排序方式: 共有34条查询结果,搜索用时 26 毫秒
1.
适于癌基因表达数据集的新特征提取标准NFEC及其分类新算法研究 总被引:2,自引:0,他引:2
癌基因表达数据集具有小样本、高维数之特点,一般的机器学习机难以对其有效分类。因此,通常需要采用某些特征提取度量标准来进行降维处理。可是常用的一些特征提取度量标准亦会导致分类效果欠佳之问题。依据微分容量控制学习机DCCM,提出了一个新的特征提取度量标准NFEC,然后依据NFEC和DCCM,提出了适于癌基因表达数据集的特征提取算法DCCFE。实验表明,新的度量NFEC和新的特征提取算法DCCFE较之现有方法对癌基因表达数据集分类时更为有效。本文的工作意义在于:(1)提出了一个新的更有意义的特征提取度量标准;(2)DCCM可以采用比核函数更为一般的一阶可微函数,因而提出的新的特征提取算法更具普遍应用意义。 相似文献
2.
Konstantinos P. Exarchos Themis P. Exarchos Costas Papaloukas Anastassios N. Troganis Dimitrios I. Fotiadis 《基因组蛋白质组与生物信息学报(英文版)》2009,7(3):138-142
PBOND is a web server that predicts the conformation of the peptide bond between any two amino acids. PBOND classifies the peptide bonds into one out of four classes, namely cis imide (cis-Pro), cis amide (cis-nonPro), trans imide (trans-Pro) and trans amide (trans-nonPro). Moreover, for every prediction a reliability index is computed. The underlying structure of the server consists of three stages: (1) feature extraction, (2) feature selection and (3) peptide bond clas- sification. PBOND can handle both s... 相似文献
3.
4.
5.
基于小波包熵的运动意识任务分类研究 总被引:1,自引:0,他引:1
提出了以小波包熵作为脑电特征向量的左右手运动意识任务分类方法,对被测试者想象左右手运动时的脑电小波包熵动态变化情况及分析窗口长度的选择进行了研究.结果表明,小波包熵能很好地反映左右手运动想象的脑电特征变化,用线性判别式算法对脑电特征进行识别,分类正确率达到92.14%.由于小波包熵的计算比较简单,稳定性好,识别率高,为大脑运动意识任务的分类提供了新思路. 相似文献
6.
基于分段伪氨基酸组成成分特征提取方法预测蛋白质亚细胞定位 总被引:3,自引:0,他引:3
蛋白质的亚细胞定位与蛋白质的功能密切相关,其定位预测有助于人们了解蛋白质功能.文章提出一种分段伪氨基酸组成成分特征提取方法,采用支持向量机算法对Chou构建的两个蛋白质亚细胞定位数据集(C2129,CS2423)进行了分类研究,并采用总分类精度Q3、内容平衡精度指数Q9等参数评估预测分类系统性能.预测结果表明,基于分段伪氨基酸组成成分特征提取方法的预测性能,优于基于完整蛋白质序列的伪氨基酸组成成分特征提取方法.例如,基于分段矩描述子伪氨基酸组成成分特征提取方法,数据集C2129的Q3和Q9分别为84.7%和60.8%,比基于完整蛋白质序列的矩描述子伪氨基酸组成成分特征提取方法分别提高1.8和2.2个百分点,且Q3比现有Xiao等人的方法提高了9.1个百分点.基于分段伪氨基酸组成成分特征提取方法构成的特征向量不仅包含残基之间的位置信息,而且还包含蛋白质子序列之问的耦合信息,另外蛋白质分段子序列可能和蛋白质的功能域有一定的联系,从而使这一方法能够有效地预测蛋白质亚细胞定位. 相似文献
7.
8.
9.
准确对事件诱发电位(ERPs)进行分类,对于各种人类认知研究和临床医学评估非常有意义.由于ERPs信号是非常高维的数据,而且其中包含非常多的与分类无关的信息,从ERPs信号中提取特征尤显重要.分析了共空间模式(CSP)的原理和不足,引入自回归(AR)模型与白化变换相结合,提出了针对ERPs分类的时空特征提取方法,并设计了验证该方法的认知实验,在认知实验数据上分别用时空特征提取方法与CSP提取特征,用同样的分类器支持向量机(SVM)训练分类器,比较它们的分类效果.实验表明,在ERPs分类问题上,时空特征提取方法与CSP相比具有明显的优势,在参数确定合理的情况下,时空特征提取方法可使分类准确率达到90%以上. 相似文献
10.
长链非编码RNA(Long non-coding RNA, lncRNA)是一类被定义为转录本的长度大于200 nt、没有蛋白编码能力的RNA转录本。研究表明,lncRNA在调节植物生长发育、表观遗传反应以及各种胁迫反应中起重要作用。但是与人类和动物相比,植物lncRNA的研究仍然处于起步阶段。目前,如何从大量的转录本中准确地挑选出lncRNA仍然是植物lncRNA研究领域的重要问题之一。本文构建了新的植物lncRNA和mRNA数据集,分析了数据集中植物lncRNA的序列及结构特征,提取了序列的k-mer频数信息、二级结构信息、开放阅读框信息以及序列的几何柔性等特征,基于SVM(Support Vector Machine, SVM)算法,用Jackknife检验对植物lncRNA进行了预测,并且计算了各种特征融合后对植物lncRNA预测结果的影响,准确率达到了96.14%。 相似文献