首页 | 本学科首页   官方微博 | 高级检索  
     

大肠杆菌基因组中重叠基因注释的机器学习优化方法
引用本文:杜明伦,黄君君,马香,唐燕琼,刘柱. 大肠杆菌基因组中重叠基因注释的机器学习优化方法[J]. 中国生物化学与分子生物学报, 2018, 34(8): 861-867. DOI: 10.13865/j.cnki.cjbmb.2018.08.09
作者姓名:杜明伦  黄君君  马香  唐燕琼  刘柱
作者单位:海南大学热带农林学院生物技术系,海口570228
基金项目:科技部国际合作专项(No.2015DFR31060); 海南省重点研发计划(No.ZDYF2017020); 海南省自然科学基金(No.317015); 国家自然科学基金项目(No.31560021, 31772887)
摘    要:细菌基因组上存在着大量的重叠基因,这不但缩减基因组尺寸,增加对遗传信息的有效利用,而且参与转录及转录后水平的调控。目前重叠基因的形成原因尚不清楚,缺少预测重叠基因是否存在的特征信息,不利于对 重叠基因的注释。本研究通过机器学习中的卷积神经网络算法对基因相关区域进行扫描,发现基因编码区前54 bp的区域可以作为判定重叠基因的标记信息,并采用支持向量机算法确证以上预测结果的准确性。通过对卷积神经网络模型的训练与优化,成功构建卷积神经网络模型,并用于大肠杆菌基因组中重叠基因的注释,对重叠基因的研究有重要意义。已训练好的模型和使用方法已经发布于GitHub,具体内容参看以下网址:https://github.com/breadpot/Convolutional_Neural_Network_Bacteria_overlapping_genes_prediction。

关 键 词:重叠基因   机器学习  卷积神经网络   功能注释   支持向量机  
收稿时间:2018-03-19

Machine Learning Optimization Method for Overlapping Genes Annotation in Escherichia coli Genomes
DU Ming-Lun,HUANG Jun-Jun,MA Xiang,TANG Yan-Qiong,LIU Zhu. Machine Learning Optimization Method for Overlapping Genes Annotation in Escherichia coli Genomes[J]. Chinese Journal of Biochemistry and Molecular Biology, 2018, 34(8): 861-867. DOI: 10.13865/j.cnki.cjbmb.2018.08.09
Authors:DU Ming-Lun  HUANG Jun-Jun  MA Xiang  TANG Yan-Qiong  LIU Zhu
Affiliation:Department of Biotechnology, Institute of Tropical Agriculture and Forestry, Hainan University, Haikou 570228, China
Abstract:
Keywords:overlapping genes  machine learning  convolutional neural network  functional annotation   support vector machine  
本文献已被 CNKI 等数据库收录!
点击此处可从《中国生物化学与分子生物学报》浏览原始摘要信息
点击此处可从《中国生物化学与分子生物学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号