首页 | 本学科首页   官方微博 | 高级检索  
   检索      

一个识别蛋白质折叠模式的SVM分类器
引用本文:郭海娟,吕强,吴宏杰,吴进珍,杨鹏,黄旭.一个识别蛋白质折叠模式的SVM分类器[J].生物信息学,2010,8(4):287-290.
作者姓名:郭海娟  吕强  吴宏杰  吴进珍  杨鹏  黄旭
作者单位:1. 苏州大学计算机科学与技术学院,江苏,苏州,215006
2. 苏州大学计算机科学与技术学院,江苏,苏州,215006;江苏省计算机信息处理技术重点实验室,江苏,苏州,215006
摘    要:蛋白质折叠模式识别是一种分析蛋白质结构的重要方法。以序列相似性较低的蛋白质为训练集,提取蛋白质序列信息频数及疏水性等信息作为折叠类型特征,从SCOP数据库中已分类蛋白质构建1 393种折叠模式的数据集,采用SVM预测蛋白质1 393种折叠模式。封闭测试准确率达99.612 2%,基于SCOP的开放测试准确率达79.632 9%。基于另一个权威测试集的开放测试折叠准确率达64.705 9%,SCOP类准确率达76.470 6%,可以有效地对蛋白质折叠模式进行预测,从而为蛋白质从头预测提供参考。

关 键 词:蛋白质折叠模式识别  SVM  从头预测

A SVM Classifier for Protein Fold Recognition
GUO Hai-juan,L Qiang,WU Hong-jie,WU Jin-zhen,YANG Peng,HUANG Xu.A SVM Classifier for Protein Fold Recognition[J].China Journal of Bioinformation,2010,8(4):287-290.
Authors:GUO Hai-juan  L Qiang  WU Hong-jie  WU Jin-zhen  YANG Peng  HUANG Xu
Institution:GUO Hai-juan,L(U) Qiang,WU Hong-jie,WU Jin-zhen,YANG Peng,HUANG Xu
Abstract:One of the important approaches to structure analysis is protein fold recognition.With a set of low similarity protein sequence for training,this paper extracts protein sequence and hydrophobic-polar information as folding type features.Based on the classified proteins of SCOP database,a SVM classifier for fold recognition is trained to predict 1393 protein folds.With the close test,the classifier achieves the accuracy as high as 99.612 2%.With the open test based on SCOP data,the classifier achieves the ac...
Keywords:SVM
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号