首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
支持向量机是一种基于统计学习理论的新型学习机。文章提出一种基于支持向量机的癫痫脑电特征提取与识别方法,充分发挥其泛化能力强的特点,在与神经网络方法的比较中,表现出较低的漏检率和较好的鲁棒性,有深入研究的价值和良好的应用前景。  相似文献   

2.
苏洪全  朱义胜  姜玉梅 《生物信息学》2010,8(4):356-358,363
基因表达系列分析(Serial analysis of gene expression,SAGE)是一种基因表达数据,反映了细胞内的动态变化。模式识别和可视化方法是分析SAGE数据的基本工具,但是由于缺乏描述数据的统计特性,传统的聚类分析技术不适用于SAGE数据的分析。本文提出了一种基于多分类和支持向量机的SAGE数据的分析法。经过对模拟数据和人类癌症SAGE数据的分析,基于径向基核函数的多分类支持向量机算法"一对一"(one-against-one,OAO)算法提供了比PoissonC和PoissonS更好的分类结果。  相似文献   

3.
黄伟  尹京苑 《生物信息学》2009,7(4):243-247
根据肿瘤分类检测模型的特点,提出了一种新的算法,该算法结合使用了基因选择和数据抽取的有效方法,并在此基础上使用支持向量机对基因表达数据进行分类或者检测。其中乳腺癌的分类交叉验证结果由88.46%提高到100.0%,急性白血病的也由71.05%提高至100.0%。实验结果说明了这一方法的有效性,为在大量的基因表达数据中提高检测癌症的准确性提出了一种比较通用的方法。  相似文献   

4.
比较序列分析作为RNA二级结构预测的最可靠途径, 已经发展出许多算法。将基于此方法的结构预测视为一个二值分类问题: 根据序列比对给出的可用信息, 判断比对中任意两列能否构成碱基对。分类器采用支持向量机方法, 特征向量包括共变信息、热力学信息和碱基互补比例。考虑到共变信息对序列相似性的要求, 通过引入一个序列相似度影响因子, 来调整不同序列相似度情况下共变信息和热力学信息对预测过程的影响, 提高了预测精度。通过49组Rfam-seed比对的验证, 显示了该方法的有效性, 算法的预测精度优于多数同类算法, 并且可以预测简单的假节。  相似文献   

5.
基于支持向量机和贝叶斯方法的蛋白质四级结构分类研究   总被引:4,自引:2,他引:4  
用支持向量机和贝叶斯两种方法对蛋白质四级结构进行分类研究。结果表明,基于支持向量机的分类结果最好,其l0CV检验的总分类精度、正样本正确预测率、Matthes相关系数和假阳性率分别为74.2%、84.6%、0.474、38.9%;基于贝叶斯的分类结果没有支持向量机的分类结果好,但其l0CV检验的假阳性率最低(15.9%).这些结果说明同源寡聚蛋白质一级序列包含四级结构信息,同时特征向量的确表示了埋藏在缔合亚基作用部位接触表面的基本信息。  相似文献   

6.
根据支持向量机的基本原理,给出一种推广误差上界估计判据,并利用该判据进行最优核参数的自动选取。对三种不同意识任务的脑电信号进行多变量自回归模型参数估计,作为意识任务的特征向量,利用支持向量机进行训练和分类测试。分类结果表明,优化核参数的支持向量机分类器取得了最佳的分类效果,分类正确率明显高于径向基函数神经网络。  相似文献   

7.
基于支持向量机方法的蛋白可溶性预测   总被引:1,自引:0,他引:1  
按照蛋白质序列中残基的相对可溶性,将其分为两类(表面/内部)和三类(表面/中间/内部)进行预测。选择不同窗宽和参数对数据进行训练和预测,以确保得到最好的分类效果,并同其他已有方法进行比较。对同一数据集不同分类阈值的预测结果显示,支持向量机方法对蛋白质可溶性的整体预测效果优于神经网络和信息论的方法。其中,对两类数据的最优分类结果达到79.0%,对三类数据的最优分类结果达到67.5%,表明支持向量机是蛋白质残基可溶性预测的一种有效方法。  相似文献   

8.
基于模糊支持向量机的膜蛋白折叠类型预测   总被引:1,自引:0,他引:1  
现有的基于支持向量机(support vector machine,SVM)来预测膜蛋白折叠类型的方法.利用的蛋白质序列特征并不充分.并且在处理多类蛋白质分类问题时存在不可分区域,针对这两类问题.提取蛋白质序列的氨基酸和二肽组成特征,并计算加权的多阶氨基酸残基指数相关系数特征,将3类特征融和作为分类器的输入特征矢量.并采用模糊SVM(fuzzy SVM,FSVM)算法解决对传统SVM不可分数据的分类.在无冗余的数据集上测试结果显示.改进的特征提取方法在相同分类算法下预测性能优于已有的特征提取方法:FSVM在相同特征提取方法下性能优于传统的SVM.二者相结合的分类策略在独立性数据集测试下的预测精度达到96.6%.优于现有的多种预测方法.能够作为预测膜蛋白和其它蛋白质折叠类型的有效工具.  相似文献   

9.
膜蛋白是一类结构独特的蛋白质,是细胞执行各种功能的物质基础。根据其在细胞膜上的不同存在方式,主要分为六种类型。本文利用压缩的氨基酸对原始膜蛋白序列进行信息压缩,再对压缩序列进行氨基酸组成和顺序特征的提取,最后采用支持向量机构建分类模型。通过五叠交叉验证的结果表明,该方法对于六种膜蛋白的分类预测,准确度最高可达98%以上,平均预测准确度在85%以上,可有效实现膜蛋白六种类型的划分,为进一步分析膜蛋白的结构和功能奠定基础。  相似文献   

10.
将63例II型糖尿病患者以及140例正常人皮肤的自体荧光光谱分为训练集和测试集两类,针对常用的四种核函数,运用交叉验证、网格寻优法计算最优分类参数,然后结合训练集建模并对测试集分类,结果显示使用径向基核函数时分类效果相对最佳。在此基础上,构建了一种基于线性核函数与径向基核函数的混合核函数,该核函数对人体皮肤自体荧光光谱的分类效果较之于径向基核函数更优,其分类正确率为82.61%,敏感性为69.57%,特异性为95.65%。研究结果表明支持向量机可用于人体皮肤自体荧光光谱的分类,有助于提高糖尿病筛查的正确率。  相似文献   

11.
通过两期水稻实验,测定了不同生育期的冠层高光谱反射率(350~2500nm),每期实验包括两个水稻品种和3个氮素(N)水平.为了分析支持向量机对水稻叶面积指数和叶绿素浓度的预测能力,对高光谱反射率进行了4种不同形式的变换,包括反射率、反射率一阶导数、反射率二阶导数和反射率对数变换.分析结果表明:利用反射率进行估算的POLY核支持向量机对水稻叶面积指数的估算能力最强,其均方根误差为1.0496;利用反射率对数变换进行估算的ANOVA核支持向量机对水稻叶绿素浓度的估算能力最强,其均方根误差为523.0741mg/m2.支持向量机对于水稻生物物理参数的估算能力不但优于逐步多元回归模型,而且对于分析不同形式的光谱反射率数据具有独到的功效.  相似文献   

12.
由于生化反应过程的复杂性和高度非线性,多数简单的数学模型不能准确描述。该文基于Matlab软件,利用改进的支持向量机(υ-SVR)对植物乳酸杆菌发酵这一典型生化过程进行研究,应用遗传算法估计模型最优参数,建立植物乳杆菌的菌体密度预测模型。同时建立传统的logistic动力学模型以进行比较。结果表明,采用结合遗传算法的υ-SVR预测模型拟合误差小,皮尔森相关系数(R)更高,可以较好地预测乳酸杆菌的发酵过程,为其优化控制及放大提供依据。  相似文献   

13.
基于支持向量机(SVM)的剪接位点识别   总被引:14,自引:1,他引:13  
剪接位点的识别作为基因识别中的一个重要环节, 一直受到研究人员的关注。考虑到剪接位点附近存在的序列保守性,已有一些基于统计特性的方法被用于剪接位点的识别中,但效果仍有待进一步改进。支持向量机(Support Vector Machines) 作为一种新的基于统计学习理论的学习机,近几年有了很大的发展,已被应用在模式识别的许多问题中。文中将其用于剪接位点的识别中,并针对满足GT- AG 规则的序列样本中虚假剪接位点的样本数远大于真实位点这一特性, 提出了一种基于SVM 的平衡取小法以获得更好的识别效果。实验结果表明,应用支持向量机进行剪接位点的识别能更好地提取位点附近保守序列的统计特征,对测试集具有更好的推广能力,并且使用上更加简单。这一结果为剪接位点的识别提供了一种新的方法,同时也为生物大分子研究中结构和位点的识别问题的解决提供了新的线索。  相似文献   

14.
自20世纪60年代以来,模式识别的理论与方法研究及在工程中的实际应用取得了很大的进展。本文先简要回顾模式识别领域的发展历史和主要方法的演变,然后围绕模式分类这个模式识别的核心问题,就概率密度估计、特征选择和变换、分类器设计几个方面介绍近年来理论和方法研究的主要进展,最后简要分析将来的发展趋势。本研究实现了利用模式识别技术在智能移动设备上的树叶自动识别功能。主要应用了图像分割,特征提取和支持向量机技术。最终实现了83%的分类准确率。  相似文献   

15.
许嘉 《生物信息学》2013,11(4):297-299
抗冻蛋白是一类具有提高生物抗冻能力的蛋白质。抗冻蛋白能够特异性的与冰晶相结合,进而阻止体液内冰核的形成与生长。因此,对抗冻蛋白的生物信息学研究对生物工程发展。提高作物抗冻性有重要的推动作用。本文采用由400条抗冻蛋白序列和400条非抗冻蛋白序列构成数据集,以伪氨基酸组分为特征,利用支持向量机分类算法预测抗冻蛋白,对训练集预测精度达到91.3%,对测试集预测精度达到78.8%。该结果证明伪氨基酸组分能够很好的反映抗冻蛋白特性,并能够用于预测抗冻蛋白。  相似文献   

16.
基于支持向量机的蛋白质同源寡聚体分类研究   总被引:14,自引:1,他引:13  
基于支持向量机和贝叶斯方法,从蛋白质一级序列出发对蛋白质同源二聚体、同源三聚体、同源四聚体、同源六聚体进行分类研究,结果表明:基于支持向量机, 采用“一对多”和“一对一”策略, 其分类总精度分别为77.36%和93.43%, 分别比基于贝叶斯协方差判别法的分类总精度50.64%提高26.72和42.79个百分点.从而说明支持向量机可用于蛋白质同源寡聚体分类,且是一种非常有效的方法.对于多类蛋白质同源寡聚体分类,基于相同的机器学习方法(如支持向量机),采用“一对一”策略比“一对多”效果好.同时亦表明蛋白质同源寡聚体一级序列包含四级结构信息.  相似文献   

17.
应用支持向量机评价太湖富营养化状态   总被引:7,自引:0,他引:7  
张成成  沈爱春  张晓晴  陈求稳 《生态学报》2013,33(23):7563-7569
根据湖库富营养化程度评价标准,随机生成大量学习样本,运用支持向量机(SVM)算法建立富营养化评价模型。采用太湖2012年7—9月的监测数据,分别应用SVM模型和线性插值评分法(SCO)对太湖33个监测点的富营养化状况进行了评价。结果表明太湖在2012年7—9月共出现3种营养类型,其中,中营养主要分布于东部湖区,轻度富营养主要分布于湖心区和东部沿岸区,中度富营养主要分布于西北部湖区,太湖水体整体表现为轻度到中度富营养水平。通过SVM和SCO结果的对比分析,发现两种评价方法的结果一致率为78.8%,出现不一致的个例均属于相邻营养等级,表明该SVM模型是有效的,能够应用于太湖的富营养化评价,且具有更好的收敛性和泛化性。  相似文献   

18.
按照蛋白质序列中残基的相对可溶性,将其分为两类(表面/内部)和三类(表面/中间/内部)进行预测.选择不同窗宽和参数对数据进行训练和预测,以确保得到最好的分类效果,并同其他已有方法进行比较.对同一数据集不同分类阈值的预测结果显示,支持向量机方法对蛋白质可溶性的整体预测效果优于神经网络和信息论的方法.其中,对两类数据的最优分类结果达到79.0%,对三类数据的最优分类结果达到67.5%,表明支持向量机是蛋白质残基可溶性预测的一种有效方法.  相似文献   

19.
启动子预测是研究基因转录调控的重要环节,但现有算法的预测正确率偏低.在深入分析启动子生物特征的基础上,提出了一种基于支持向量机的枯草杆菌启动子预测算法,在启动子序列的组成特征、信号特征和结构特征中选取9种典型特征作为预测的依据,对于信号特征,除了利用保守模式的一致序列,还考虑了间隔距离的分布信息.首先通过特征描述模型分别计算每种特征在启动子序列和非启动子序列中的得分,将特征得分组合成9维特征向量,再利用支持向量机在特征向量集上进行训练和判别.对实际数据集进行的刀切法测试验证了算法的有效性.对σ启动予的预测,平均正确率达到了90.7%;对几种其它σ因子启动子的预测,平均正确率也超过了80%.算法不但有广泛的适用性,还有良好的可扩展性,能够方便的容纳新特征,使识别性能不断提高.  相似文献   

20.
支持向量机与神经网络的关系研究   总被引:2,自引:0,他引:2  
支持向量机是一种基于统计学习理论的新颖的机器学习方法,由于其出色的学习性能,该技术已成为当前国际机器学习界的研究热点,该方法已经广泛用于解决分类和回归问题.本文将结构风险函数应用于径向基函数网络学习中,同时讨论了支持向量回归模型和径向基函数网络之间的关系.仿真实例表明所给算法提高了径向基函数网络的泛化性能.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号