首页 | 本学科首页   官方微博 | 高级检索  
   检索      

基于迭代自学习的操纵子结构预测
引用本文:吴文琪,郑晓斌,刘永初,汤凯,朱怀球.基于迭代自学习的操纵子结构预测[J].生物化学与生物物理进展,2011,38(7):642-651.
作者姓名:吴文琪  郑晓斌  刘永初  汤凯  朱怀球
作者单位:北京大学湍流与复杂系统国家重点实验室、工学院生物医学工程系、理论生物中心、蛋白质科学中心;北京大学湍流与复杂系统国家重点实验室、工学院生物医学工程系、理论生物中心、蛋白质科学中心;北京大学湍流与复杂系统国家重点实验室、工学院生物医学工程系、理论生物中心、蛋白质科学中心;北京大学湍流与复杂系统国家重点实验室、工学院生物医学工程系、理论生物中心、蛋白质科学中心;北京大学湍流与复杂系统国家重点实验室、工学院生物医学工程系、理论生物中心、蛋白质科学中心
基金项目:国家自然科学基金资助项目(30970667, 30770499, 10721403), “重大新药创制”科技重大专项资助项目(2009ZX09501-002), 北京市优秀博士学位论文指导教师科技项目(YB20101000102), 国家重点基础研究发展计划(973)资助项目(2011CB707500)
摘    要:原核生物操纵子结构的准确注释对基因功能和基因调控网络的研究具有重要意义,通过生物信息学方法计算预测是当前基因组操纵子结构注释的最主要来源.当前的预测算法大都需要实验确认的操纵子作为训练集,但实验确认的操纵子数据的缺乏一直成为发展算法的瓶颈.基于对操纵子结构的认识,从基因间距离、转录翻译相关的调控信号以及COG功能注释等特征出发,建立了描述操纵子复杂结构的概率模型,并提出了不依赖于特定物种操纵子数据作为训练集的迭代自学习算法.通过对实验验证的操纵子数据集的测试比较,结果表明算法对于预测操纵子结构非常有效.在不依赖于任何已知操纵子信息的情况下,算法在总体预测水平上超过了目前最好的操纵子预测方法,而且这种自学习的预测算法要优于依赖特定物种进行训练的算法.这些特点使得该算法能够适用于新测序的物种,有别于当前常用的操纵子预测方法.对细菌和古细菌的基因组进行大规模比较分析,进一步提高了对基因组操纵子结构的普遍特征和物种特异性的认识.

关 键 词:基因组分析  操纵子  迭代自学习  预测评价
收稿时间:2010/12/28 0:00:00
修稿时间:2011/1/31 0:00:00

Operon prediction based on an iterative self-learning algorithm
WU Wen-Qi,ZHENG Xiao-Bin,LIU Yong-Chu,TANG Kai and ZHU Huai-Qiu.Operon prediction based on an iterative self-learning algorithm[J].Progress In Biochemistry and Biophysics,2011,38(7):642-651.
Authors:WU Wen-Qi  ZHENG Xiao-Bin  LIU Yong-Chu  TANG Kai and ZHU Huai-Qiu
Institution:WU Wen-Qi,ZHENG Xiao-Bin,LIU Yong-Chu,TANG Kai,ZHU Huai-Qiu(State Key Laboratory for Turbulence and Complex Systems and Department of Biomedical Engineering,College of Engineering,Center for Theoretical Biology,Center for Protein Science,Peking University,Beijing 100871,China)
Abstract:
Keywords:genome analysis  operon  iterative self-learning  evaluation of prediction
本文献已被 CNKI 等数据库收录!
点击此处可从《生物化学与生物物理进展》浏览原始摘要信息
点击此处可从《生物化学与生物物理进展》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号