期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

吴文琪郑晓斌刘永初汤凯朱怀球《生物化学与生物物理进展》2011,38(7):642-651

原核生物操纵子结构的准确注释对基因功能和基因调控网络的研究具有重要意义,通过生物信息学方法计算预测是当前基因组操纵子结构注释的最主要来源.当前的预测算法大都需要实验确认的操纵子作为训练集,但实验确认的操纵子数据的缺乏一直成为发展算法的瓶颈.基于对操纵子结构的认识,从基因间距离、转录翻译相关的调控信号以及COG功能注释等特征出发,建立了描述操纵子复杂结构的概率模型,并提出了不依赖于特定物种操纵子数据作为训练集的迭代自学习算法.通过对实验验证的操纵子数据集的测试比较,结果表明算法对于预测操纵子结构非常有效.在不依赖于任何已知操纵子信息的情况下,算法在总体预测水平上超过了目前最好的操纵子预测方法,而且这种自学习的预测算法要优于依赖特定物种进行训练的算法.这些特点使得该算法能够适用于新测序的物种,有别于当前常用的操纵子预测方法.对细菌和古细菌的基因组进行大规模比较分析,进一步提高了对基因组操纵子结构的普遍特征和物种特异性的认识. 相似文献

2.

致病性大肠杆菌UPEC CFT073全基因组分析及致病机制的新认识

罗成伟胡钢清朱怀球《生物物理学报》2009,25(4):264-268

尿道致病性大肠杆菌UPEC CFT073菌株(uropathogenic Escherichia coli CFT073)于2002年被完全测序并注释。但是,对其基因组的研究还很不完善,首先表现在基因组注释的系统性错误和滞后性。作者运用一系列生物信息学方法和工具,从编码蛋白质基因、编码RNA基因等角度对RefSeq数据库的基因组注释进行了系统的修正和增补,并在此基础上鉴别了一批新的候选致病因子基因。进一步的分析表明,得到的基因组注释对CFT073致病相关的一些重要调控关系和机制能够给出更准确、完整的描述。相似文献

3.

肠道病毒组学数据挖掘与分析方法的进展及挑战

江小青李墨尹衡闯郭倩谭洁吴姝芳王春晖朱怀球《中国科学:生命科学》2023,(5):647-659

肠道病毒对肠道微生物群系的种群结构、细菌性状乃至人体健康都有十分重要的影响,但相比肠道细菌,人们对其的研究和了解仍然很缺乏.高通量测序技术以及机器学习、深度学习等方法的快速发展,为从组学途径深入研究肠道病毒提供了契机.本文针对当前肠道病毒组学领域以噬菌体、真核病毒等为对象的高通量数据,总结并分析了近年来数据挖掘和分析的共性方法和技术的发展,梳理了一系列相关的生物信息学方法和技术,其中大多适用于基于宏基因组或宏病毒组两种策略的病毒组学分析.同时,针对目前实际生物学问题和临床问题的复杂性,人工智能方法在生物信息学领域的广泛运用,以及未来三代测序技术可能的广泛使用,讨论了病毒组学数据挖掘与数据分析方法面临的问题和挑战. 相似文献

4.

微生物组测序与分析专家共识

段云峰王升跃陈禹保杨瑞馥李后开朱怀球童贻刚杜文斌付钰胡松年王军辛玉华赵方庆鲍一明张雯李娟曾明牛海涛周欣李岩崔生辉袁静李俊桦王加义刘东来倪铭孙青邓晔朱宝利《生物工程学报》2020,36(12):2516-2524

在过去的十几年,微生物组相关研究和应用持续升温。微生物组逐渐成为生命科学、环境科学和医学等领域的研究焦点。与此同时,全球多个国家和组织也都积极发起各自的微生物组计划,进行多方面的布局,力争在这一具有广阔前景的领域获得战略地位。此外,无论是科研还是产业应用已经迎来了研究高潮和投融资热潮,微生物组相关产品和服务也不断出现。然而,行业在快速发展的同时,也存在一些不足。由于微生物组测序和分析相关技术和方法发展迅速,各国研究和应用尚未在技术、方案和数据等标准上达成统一,国内行业参与者对微生物组也存在认识不足,对微生物组相关新方法、新技术、新理论等还未能充分掌握和使用。除此之外,已有的一些标准和指南,内容过于简单,实操性也不足,这不仅给科研数据的整合造成了困难和资源浪费,还给相关企业进行不良竞争、以次充好提供了机会。更重要的是,我国尚缺乏微生物组相关的国家标准,国家微生物组计划仍处于筹备过程。在此背景下,中国生物工程学会、中国科学院微生物研究所于2019年6月至2020年3月,共同设立了“微生物组测序与分析专家共识”专项研究课题。中国生物工程学会组织了微生物组相关领域的27位专家以及来自行业内的30多位专业人员,通过分成4个项目小组、召开4轮研讨会后,最终形成了涵盖从微生物采集与保存、DNA提取与建库、高通量基因测序和数据分析以及质控标准品等全流程的“微生物组测序与分析专家共识”。本专家共识具有较强可参考性和可操作性,不仅能指导国内科研和产业机构规范进行微生物组相关产、学、研,还能为国家相关职能部门提供可参考的技术依据,保障规模型和规范化的企业利益,加强行业自律,避免不规范的企业扰乱市场,最终促进微生物组相关产业的良性发展。相似文献

5.

原核基因翻译起始位点预测的新方法

胡钢清刘永初郑晓斌杨一帆佘振苏朱怀球《生物化学与生物物理进展》2008,35(11):1254-1262

翻译起始位点（TIS,即基因5’端）的精确定位是原核生物基因预测的一个关键问题,而基因组GC含量和翻译起始机制的多样性是影响当前TIS预测水平的重要因素．结合基因组结构的复杂信息（包括GC含量、TIS邻近序列及上游调控信号、序列编码潜能、操纵子结构等）,发展刻画翻译起始机制的数学统计模型,据此设计TIS预测的新算法MED．StartPlus．并将MED．StartPlus与同类方法RBSfinder、GS．Finder、MED-Start、TiCo和Hon-yaku等进行系统地比较和评价．测试针对两种数据集进行：当前14个已知的TIS被确认的基因数据集,以及300个物种中功能已知的基因数据集．测试结果表明,MED-StartPlus的预测精度在总体上超过同类方法．尤其是对高GC含量基因组以及具有复杂翻译起始机制的基因组,MED-StartPlus具有明显的优势．相似文献

6.

CYP72B1基因和AUR3基因响应光、生长素和油菜素内酯的转录调控机制研究

张长青王进朱怀球高翔《生物化学与生物物理进展》2009,36(9):1215-1221

为研究光、生长素和油菜素内酯在基因层次上的互作机制,开发了转录调控元件识别工具OCMMat,其中,在对共表达基因信息和直系同源基因信息进行整合时,利用了转录调控元件在直系同源基因启动子中的富集性.利用该方法发现,CYP7281基因和AUR3基因启动子含有3个相同的调控模序GAGACA、AAGAAAAA、ATCATG,它们分别承担了AuxRE元件、GT元件和GT辅助元件的功能.其中,ATCATG模序是目前尚未报道过的调控元件,与AAGAAAAA模序的距离相对恒定.基于调控元件识别结果,构建了CYP7281基因和AUR3基因响应光、生长素和油菜素内酯的转录调控模型,模型显示:光信号和生长素、油菜素内酯信号在CYP72B1基因和AUR3基因的转录调控元件上相互交叠,而生长素和油菜素内酯信号则在转录因子ARF水平上相交. 相似文献