首页 | 本学科首页   官方微博 | 高级检索  
   检索      

面向蛋白质功能位点识别的机器学习平台构建
引用本文:胡敏菁,吴建盛,施识帆,刘宏德,孙啸.面向蛋白质功能位点识别的机器学习平台构建[J].生物信息学,2010,8(1):12-15.
作者姓名:胡敏菁  吴建盛  施识帆  刘宏德  孙啸
作者单位:东南大学生物电子学国家重点实验室,生物科学与医学工程学院,南京,210096
摘    要:有关蛋白质功能的研究是解析生命奥秘的基础,机器学习技术在该领域已有广泛应用。利用支持向量机(support vectormachine,SVM)方法,构建一个预测蛋白质功能位点的通用平台。该平台先提取非同源蛋白质序列,再对这些序列进行特征编码(包括序列的基本信息、物化特征、结构信息及序列保守性特征等),以编码好的样本作为训练数据,利用SVM进行训练,得到敏感性、特异性、Matthew相关系数、准确率及ROC曲线等评价指标,反复测试,得到评价指标最优的SVM模型后,便可以用来预测蛋白质序列上的功能位点。该平台除了应用在预测蛋白质功能位点之外,还可以应用于疾病相关单核苷酸多态性(SNP)预测分析、预测蛋白质结构域分析、生物分子间的相互作用等。

关 键 词:蛋白质功能位点预测  机器学习  支持向量机

Machine learning platform for protein function sites prediction
HU Min-jing,WU Jian-sheng,SHI Shi-fan,LIU Hong-de,SUN Xiao.Machine learning platform for protein function sites prediction[J].China Journal of Bioinformation,2010,8(1):12-15.
Authors:HU Min-jing  WU Jian-sheng  SHI Shi-fan  LIU Hong-de  SUN Xiao
Institution:HU Min-jing,WU Jian-sheng,SHI Shi-fan,LIU Hong-de,SUN Xiao (State Key Laboratory of Bioelectronics,School of Biological Science and Medical Engineering,Southeast University,Nanjing 210096,China)
Abstract:Research of protein function is the base of life mystery,and machine learning technology is widely used in this field.This paper constructs a general platform using support vector machine(SVM) to predict protein function sites.Firstly,the platform extracts non-homologous protein sequences,and codes characteristics which include basic information,physical and chemical characteristics,structure information,sequence conservation characteristics.Then uses SVM to train the coded dataset,and get sensitivity,speci...
Keywords:protein function sites prediction  machine learning  support vector machine
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号