首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
近10多年来的研究逐步揭示了RNA的各种生物学功能。RNA不仅是信息从DNA传递到蛋白质的中间体,还直接参与基因沉默、表观遗传学修饰等生物学过程。单链的RNA在体内通过碱基配对折叠成一定的二级结构。介绍了现在预测RNA二级结构的主要算法及其应用,其中包括基于热力学、同源比对和统计学习的各种算法,以及如何引入实验数据辅助预测。二级结构预测算法被广泛用于寻找RNA功能单元和预测新非编码RNA等各种问题。如何利用高通量实验数据帮助结构预测,探索长非编码RNA功能,研究RNA与蛋白质相互作用,是RNA二级结构预测算法和应用的一些前沿方向。  相似文献   

2.
计算生物学在非编码RNA(non-coding RNA, ncRNA)研究领域中发挥着重要的作用.计算生物学是利用计算机科学方法来研究和理解生命科学问题的交叉学科,而ncRNA作为一类数目庞大且功能多样的RNA分子,参与了广泛的生物学过程.本文对RNA计算生物学中的常用算法和工具进行综述,并着重介绍专家系统、机器学习、深度学习等计算生物学研究策略在ncRNA鉴定、ncRNA靶标预测、RNA修饰、RNA二级结构检测、RNA-蛋白质互作及RNA功能预测中的应用.  相似文献   

3.
蛋白质的序列决定结构,结构决定功能。新一代准确的蛋白质结构预测工具为结构生物学、结构生物信息学、药物研发和生命科学等许多领域带来了全新的机遇与挑战,单链蛋白质结构预测的准确率达到与试验方法相媲美的水平。本综述概述了蛋白质结构预测领域的理论基础、发展历程与最新进展,讨论了大量预测的蛋白质结构和基于人工智能的方法如何影响实验结构生物学,最后,分析了当前蛋白质结构预测领域仍未解决的问题以及未来的研究方向。  相似文献   

4.
蛋白质二级结构的预测可以采用建立数学模型,利用计算机来预测问题的解,然后再通过生物学实验来验证,这样可以节约大量的时间和精力,但是数学模型的预测效果如何,相当关键,文章提出基于信息熵的蛋白质二级结构预测算法的准确性评价方法,与现有方法相比,这种方法更全面,不仅能确定阳性率,假阴性率,还能确定预测值与实际值之间的不确定性的减少量。  相似文献   

5.
计算RNA组学:非编码RNA结构识别与功能预测   总被引:2,自引:0,他引:2       下载免费PDF全文
真核生物基因组中包含大量非编码RNA基因,计算RNA组学采用信息科学等多学科方法解析ncRNA的结构与功能.本文就ncRNA数据存储与管理、ncRNA基因识别与鉴定、ncRNA靶标识别与功能预测等问题,对目前计算RNA组学的主要研究方法和内容进行了评述.  相似文献   

6.
经过两年多的努力 ,军事医学科学院基础医学研究所计算生物学中心成功研发了辅助分子生物学实验设计的软件系统BioSun ,该系统主要功能有 :可视化的序列编辑器、完善的序列数据库管理系统、多种方式的序列比较、蛋白质基本性质分析 (MW、PI、… )、蛋白质功能位点及模式特异性分析、多种方式的抗原表位预测、基于随机肽库实验数据的抗原识别、蛋白质二级结构预测、基于一定字长的蛋白质与DNA组成分析、DNA模式分析、PCR实验辅助设计、转录因子结合位点预测、酶切位点分析及酶切图谱制作、基于多种算法的RNA二级结构预测、原核系统外…  相似文献   

7.
结构域是进化上的保守序列单元,是蛋白质的结构和功能的标准组件.典型的两个蛋白质间的相互作用涉及特殊结构域间的结合,而且识别相互作用结构域对于在结构域水平上彻底理解蛋白质的功能与进化、构建蛋白质相互作用网络、分析生物学通路等十分重要.目前,依赖于对实验数据的进一步挖掘和对各种不同输入数据的计算预测,已识别出了一些相互作用/功能连锁结构域对,并由此构建了内容丰富、日益更新的结构域相互作用数据库.综述了产生结构域相互作用的8种计算预测方法.介绍了5个结构域相互作用公共数据库3DID、iPfam、InterDom、DIMA和DOMINE的有关信息和最新动态.实例概述了结构域相互作用在蛋白质相互作用计算预测、可信度评估,蛋白质结构域注释,以及在生物学通路分析中的应用.  相似文献   

8.
原核生物操纵子结构的准确注释对基因功能和基因调控网络的研究具有重要意义,通过生物信息学方法计算预测是当前基因组操纵子结构注释的最主要来源.当前的预测算法大都需要实验确认的操纵子作为训练集,但实验确认的操纵子数据的缺乏一直成为发展算法的瓶颈.基于对操纵子结构的认识,从基因间距离、转录翻译相关的调控信号以及COG功能注释等特征出发,建立了描述操纵子复杂结构的概率模型,并提出了不依赖于特定物种操纵子数据作为训练集的迭代自学习算法.通过对实验验证的操纵子数据集的测试比较,结果表明算法对于预测操纵子结构非常有效.在不依赖于任何已知操纵子信息的情况下,算法在总体预测水平上超过了目前最好的操纵子预测方法,而且这种自学习的预测算法要优于依赖特定物种进行训练的算法.这些特点使得该算法能够适用于新测序的物种,有别于当前常用的操纵子预测方法.对细菌和古细菌的基因组进行大规模比较分析,进一步提高了对基因组操纵子结构的普遍特征和物种特异性的认识.  相似文献   

9.
基因表达是生物体中最重要和最基础的生物学过程和分子活动,生物体正是通过调控不同基因表达而实现生长发育和抵御刺激等生命活动.转录组测序是目前在生物医学研究中应用最为广泛的高通量检测基因表达的技术,也促进了大量针对转录组数据的生物信息挖掘方法和工具的发展.本文就基因表达中的转录组数据分析和挖掘方法进行了综述,从已有大规模转...  相似文献   

10.
蛋白质空间结构的分析与预测已经成为现今分子生物学和生物信息学的重要研究课题之一。虽然引入了3D-profile,人工神经网络,遗传算法等复杂的模型或算法,并获得了相对较高的准确率,但是却很难对所得到的结果进行解释,且不易发现其中的生物学规律。而相应地,氨基酸序列所隐含的蛋白质结构信息,生物学和数学意义才应是我们所需探寻的重点。因此我们从分析构成特定二级结构的氨基酸序列着手,引入涉及关联规则的支持度S来计算特殊位点处氨基酸的贡献率,以期发现其中的隐含信息,并获得了相应的数据信息矩阵。通过分析二级结构的支持度,不仅得到了各氨基酸位于不同位点时相对于Beta结构的强弱作用关系,还发现了脯氨酸的特殊作用和相对于Beta结构的成核性。  相似文献   

11.
随着基因组规模的高通量实验鉴定技术和计算预测方法的发展,出现了大量蛋白质相互作用数据,但大规模蛋白质相互作用数据中的较高比例的假阳性影响了相互作用数据的质量。生物信息学方法能够从已有的数据和知识出发,通过计算方法系统评估大规模蛋白质相互作用的可信度。本文从过程模型设计、数据集构建、特征选择与综合属性抽取、一些算法使用、实例概述等方面介绍了生物信息学方法评估蛋白质相互作用可信度的研究特点与进展。  相似文献   

12.
为提高蛋白质-蛋白质相互作用(protein-protein interaction, PPI)预测的准确性,并深入探索细胞信号传导和疾病发生的生物学机制,本文提出一种简称为CBSG-PPI的预测算法。该算法首先利用3层前馈网络来处理蛋白质的k-mer特征,采用CT方法和Bert方法提取蛋白质的氨基酸序列以及使用卷积神经网络提取蛋白质的序列特征,再结合图神经网络和多层感知机来准确预测PPI。与现有的预测技术相比,CBSG-PPI在准确率、 F1分数、召回率和精确率等多个关键性能指标上展现了明显的优势,在公开数据集上分别达到了0.855、 0.853、 0.840和0.866的高分。此外,本算法采用了一种改进的参数调整方法,显著提高了计算效率,其预测速度比传统算法快了约140倍。这一显著的性能提升,不仅证实了CBSG-PPI在预测PPI方面的研究价值,也为未来蛋白质间相互作用网络的构建和分析提供了有用的计算工具。  相似文献   

13.
张振慧  王勇献  王正华 《激光生物学报》2007,16(2):249-252,F0003
细胞凋亡蛋白对生物体的发育、维持内环境稳定及人们理解细胞凋亡机制非常重要。文中提出了一种新的蛋白质序列特征提取方法—三肽离散源方法。计算了蛋白质序列中紧邻三联体的出现个数,利用离散增量极小化对凋亡蛋白进行定位预测;同时推广了张春霆等提出的内容平衡精度指数,使其能评估任意类的分类问题。实验结果表明:在凋亡蛋白定位预测研究中,三肽离散源方法在提高总体预测精度的同时,能够较好的解决样本不均衡问题;而内容平衡精度指数能比传统的总体预测精度更准确的评估预测算法的预测能力,有效的反映预测算法对样本不均衡问题的相容能力。  相似文献   

14.
植物长链非编码RNA研究进展   总被引:1,自引:0,他引:1  
黄小庆  李丹丹  吴娟 《遗传》2015,37(4):344-359
长链非编码RNA(Long non-coding RNA,lncRNA)长度大于200个核苷酸,大量存在于生物体中并具有多种生物学功能。目前,植物中发现的lncRNA大多由RNA聚合酶Ⅱ转录,并通过目标模仿、转录干扰、组蛋白甲基化和DNA甲基化等多种机制介导基因的表达,在植物开花、雄性不育、营养代谢、生物和非生物胁迫等生物过程中起着调节因子的作用。文章综述了近年来发现的植物lncRNA数据库、预测方法、表达及可能的生物学功能。  相似文献   

15.
为了解决生物信息学中蛋白质折叠模拟计算的速度慢和软件老旧的问题,提出了基于云计算的蛋白质折叠并行化算法Cloud_PERM。分析了PERM算法的运行流程及其面向MapReduce的子任务划分方式。Cloud_PERM算法实现采用Hadoop云计算环境作为工作平台,其蛋白质序列数据的存储与管理、子任务调度及工作单元的执行都由MapReduce规范来透明的完成;实验结果表明:Cloud_PERM比PERM串行计算具有更快的计算速度,在吞吐量和可扩展性上也有明显的优势。Cloud_PERM可以使生物科研人员节省很多时间与精力,有益于新型蛋白质结构预测与生物特性的研究。  相似文献   

16.
《生物学杂志》2011,28(5):79-82,85
系统生物学是系统理论和实验生物技术、计算机数学模型等方法整合的生物系统研究,系统遗传学研究基因组的稳态与进化、功能基因组和生物性状等复杂系统的结构、动态与发生演变等。合成生物学是系统生物学的工程应用,采用工程学方法、基因工程和计算机辅助设计等研究人工生物系统的生物技术。系统与合成生物学的结构理论,序列标志片段显示分析与微流控生物芯片,广泛用于研究细胞代谢、繁殖和应激的自组织进化、生物体形态发生等细胞分子生物系统原理等。  相似文献   

17.
长链非编码RNA(Long non-coding RNA, lncRNA)是一类被定义为转录本的长度大于200 nt、没有蛋白编码能力的RNA转录本。研究表明,lncRNA在调节植物生长发育、表观遗传反应以及各种胁迫反应中起重要作用。但是与人类和动物相比,植物lncRNA的研究仍然处于起步阶段。目前,如何从大量的转录本中准确地挑选出lncRNA仍然是植物lncRNA研究领域的重要问题之一。本文构建了新的植物lncRNA和mRNA数据集,分析了数据集中植物lncRNA的序列及结构特征,提取了序列的k-mer频数信息、二级结构信息、开放阅读框信息以及序列的几何柔性等特征,基于SVM(Support Vector Machine, SVM)算法,用Jackknife检验对植物lncRNA进行了预测,并且计算了各种特征融合后对植物lncRNA预测结果的影响,准确率达到了96.14%。  相似文献   

18.
蛋白质残基替换是基因突变的产物之一,它可能改变蛋白质三维结构,对其生物学功能产生重大影响,因此研究蛋白质残基替换与结构改变的关系具有重要意义.随着实验解析蛋白质结构的数量迅猛增长,越来越多的野生型-突变体被应用于结构生物学的比较研究中.本研究从蛋白质三维结构数据库(PDB)出发,收集和计算了大量结构特征数据,构建了一个目前已知最大的野生型-突变体(单残基差异)的结构对数据库DRSP,展示出氨基酸类型和主链偏好性对结构保守性的相关性.DRSP的开放使用可为高精度的蛋白质结构分析预测提供有用信息,它的数据库网址是http://www.labshare.cn/drsp/index.php.  相似文献   

19.
基因芯片数据分析与处理   总被引:7,自引:1,他引:6  
基因芯片技术在基因表达分析等应用过程中产生大量的数据,如何处理和分析这些数据并从中提取出有价值的生物学信息是一个极为重要的问题.其过程包括原始数据的获取及处理、标准化数据的统计学分析、以及数据的存储和交流等.  相似文献   

20.
计算系统生物学是一个多学科交叉的新兴领域,旨在通过整合海量数据建立其生物系统相互作用的复杂网络。数据的整合和模型的建立需要发展合适的数学方法和软件工具,这也是计算系统生物学的主要任务。生物系统模型有助于从整体上理解生物体的内在功能和特性。同时,生物网络模型在药物研发中的应用也越来越受到制药企业以及新药研发机构的重视,如用于特异性药物作用靶点的预测和药物毒性评估等。该文简要介绍计算系统生物学的常见网络和计算模型,以及建立模型所用的研究方法,并阐述其在建模和分析中的作用及面临的问题和挑战。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号