首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
以序列相似性低于40%的1895条蛋白质序列构建涵盖27个折叠类型的蛋白质折叠子数据库,从蛋白质序列出发,用模体频数值、低频功率谱密度值、氨基酸组分、预测的二级结构信息和自相关函数值构成组合向量表示蛋白质序列信息,采用支持向量机算法,基于整体分类策略,对27类蛋白质折叠子的折叠类型进行预测,独立检验的预测精度达到了66.67%。同时,以同样的特征参数和算法对27类折叠子的4个结构类型进行了预测,独立检验的预测精度达到了89.24%。将同样的方法用于前人使用过的27类折叠子数据库,得到了好于前人的预测结果。  相似文献   

2.
蛋白质折叠识别算法是蛋白质三维结构预测的重要方法之一,该方法在生物科学的许多方面得到卓有成效的应用。在过去的十年中,我们见证了一系列基于不同计算方式的蛋白质折叠识别方法。在这些计算方法中,机器学习和序列谱-序列谱比对是两种在蛋白质折叠中应用较为广泛和有效的方法。除了计算方法的进展外,不断增大的蛋白质结构数据库也是蛋白质折叠识别的预测精度不断提高的一个重要因素。在这篇文章中,我们将简要地回顾蛋白质折叠中的先进算法。另外,我们也将讨论一些可能可以应用于改进蛋白质折叠算法的策略。  相似文献   

3.
张天驰  张菁 《生物信息学》2011,9(2):142-145
蛋白质折叠过程模拟是当前蛋白质研究领域的一个难点问题。针对这一问题,提出了一个描述蛋白质折叠过程的算法-拟蛇算法,并且从分子振荡和分子动力学理论两个方面来证明该算法的核心函数是可行和正确的。经过实验总结出所有蛋白质空间结构都可以通过两种类型函数构造出来,提出了描述蛋白质折叠过程模型。与其它蛋白质折叠过程模拟算法的实验结果比较表明,拟蛇算法所构造的空间结构能量值最小、相似度最好。进而说明拟蛇算法和蛋白质折叠过程模型在描述蛋白质折叠过程方面具有明显优势。  相似文献   

4.
使用图像特征构建快速有效的蛋白质折叠识别方法   总被引:2,自引:0,他引:2  
蛋白质结构自动分类是探索蛋白质结构- 功能关系的一种重要研究手段。首先将蛋白质折叠子三维空间结构映射成为二维距离矩阵,并将距离矩阵视作灰度图像。然后基于灰度直方图和灰度共生矩阵提出了一种计算简单的折叠子结构特征提取方法,得到了低维且能够反映折叠结构特点的特征,并进一步阐明了直方图中零灰度孤峰形成原因,深入分析了共生矩阵特征中灰度分布、不同角度和像素距离对应的结构意义。最后应用于27类折叠子分类,对独立集测试的精度达到了71.95 %,对所有数据进行10 交叉验证的精度为78.94 %。与多个基于序列和结构的折叠识别方法的对比结果表明,此方法不仅具有低维和简洁的特征,而且无需复杂的分类系统,能够有效和高效地实现多类折叠子识别。  相似文献   

5.
细胞生物过程具有时序动态性,蛋白质功能模块是驱动细胞生物过程的功能单位。为了蛋白质功能模块识别,本文将细胞生物过程建模为动态时序表达相关蛋白质相互作用网络(DTEPIN);构建子块矩阵以表示动态时序表达相关蛋白质相互作用网络;利用子块矩阵特殊性,分析时空复杂度和并行性;优化设计马尔可夫聚类算法,以识别动态时序表达相关蛋白质相互作用网络中的蛋白质功能模块。为了支持基于子块矩阵马尔可夫聚类过程,本文运用图形处理器并行计算矩阵乘积。实验结果表明,与已有同类算法相比,所设计算法识别的蛋白质功能模块,统计匹配质量更高且精确匹配数量更多。  相似文献   

6.
<正>邹承鲁先生是近代中国生物化学的奠基人之一,一生致力于蛋白质结构与功能关系的研究,在细胞色素与呼吸链酶系、人工合成胰岛素、酶活性不可逆抑制动力学、酶活性部位的柔性以及蛋白质折叠和分子伴侣等不同领域都做出了重大贡献。1964年我从中国科学技术大学生物物理系毕业,被分配到中国科学院生物物理研究所。后有幸在邹先生实验室工作近20年,在邹先生的指导和帮助下,对胰岛素A、B链相互作用、蛋白质折叠以及帮助蛋白质折叠的分子伴侣和折叠酶开展了一些研究工作。  相似文献   

7.
蛋白质能量最小化是蛋白质折叠的重要内容。用于蛋白质折叠的新的杂合进化算法结合了交叉和柯西变异。基于toy模型的蛋白质能量最小化算例表明,这个新的杂合进化算法是有效的。  相似文献   

8.
蛋白质折叠指没有任何固定结构形式的蛋白质多肽链经过复杂作用,转化成活性蛋白质结构的物理学过程。蛋白质折叠的理论研究是理论生物学的基本内容。它对蛋白质工程、蛋白质结构的预测、蛋白质结构与功能的关系、生物疾病的发生机理等有重大的科学指导意义。蛋白质折叠的传统理论是Anfinsen提出的。目前有两种不同的热力学理论:蛋白质折叠的不可逆热力学理论与能级相图理论。本文重点分析、讨论了蛋白质折叠的不可逆热力学(irreversible thermodynamics)理论和能级相图(energy landscape)理论的共同点与分歧。  相似文献   

9.
蛋白质的错误折叠与疾病   总被引:10,自引:0,他引:10  
蛋白质是生物体内一切功能的执行者.人体内的任何功能,从催化化学反应到抵御外来侵略都是蛋白质作用的结果.蛋白质折叠是生命活动的最基本过程,近年发现蛋白质的错误折叠可以导致一些疾病.蛋白质的错误折叠与疾病的关系已成为分子生物学新的研究前沿.介绍了细胞内保证蛋白质正常功能的“质量控制”系统,重点讨论了翻译后的质量控制、与蛋白质错误折叠有关的一些疾病和治疗这一类疾病的原则方法.  相似文献   

10.
建立了一个包含核酸序列信息的蛋白质折叠数据库。以此为基础,对于每一个蛋白质,计算了其相应编码mRNA序列的茎结构含量、环结构含量、折叠自由能及mRNA的柔性等描述mRNA二级结构特征的基本参量。进一步分析了这些mRNA二级结构参量与相应蛋白质折叠速率的关系。结果表明,mRNA茎结构含量与蛋白质折叠速率呈显著负相关性,而环结构含量则与蛋白质折叠速率呈显著正相关性;同时,mRNA的柔性与相应蛋白质折叠速率呈极显著正相关性。进一步的分析表明,当把蛋白质分为不同二级结构类型和折叠类型后,mRNA的柔性对不同类型蛋白质的折叠速率均为重要的影响因素,而mRNA的茎结构含量和环结构含量主要影响二态蛋白质的折叠。结果证实,mRNA的二级结构对蛋白质的折叠有着重要作用。  相似文献   

11.
前期的相关研究发现mRNA二级结构中存在对蛋白质折叠速率的重要影响因素.而mRNA二级结构中普遍存在着各种复杂的环结构,这些环结构是否对蛋白质折叠速率也有重要的影响呢?不同的环结构对蛋白质折叠速率的影响是否相同呢?基于此想法,建立了一个包含mRNA内部环、发夹环、膨胀环和多分支环等环结构信息和相应蛋白质折叠速率的数据库.对于数据库中的每一个蛋白质,计算了mRNA二级结构中各种环结构碱基含量、配对碱基含量及单链碱基含量等参量,分析了各参量与相应蛋白质折叠速率的相关性.结果显示,各种环结构碱基含量与蛋白质折叠速率均呈极显著或显著正相关.说明mRNA环结构对蛋白质折叠速率有重要的影响.进一步,把蛋白质按照不同折叠类型或不同二级结构类型分组后,对每一组蛋白质重复上述的分析工作.结果表明,对不同类蛋白质,mRNA的各种环结构对其相应蛋白质折叠速率的影响存在着显著差异.上述研究将为进一步开展有关mRNA和蛋白质折叠速率的研究奠定理论基础.  相似文献   

12.
理解蛋白质折叠速率是探明蛋白质结构和折叠机制物理基础的关键.蛋白质折叠速率的温度依赖关系是当前一个未解决的难题.假定蛋白质折叠是一个分子构象间的量子跃迁,导出了一个蛋白质折叠速率的解析公式.由此公式出发,计算了资料库中二态蛋白质的折叠速率和研究了它们的温度依赖性.从第一性原理出发,对实验给出的16个二态蛋白质折叠速率的非阿列尼乌斯(non-Arrhenius)温度关系给予成功解释,进而预测了这些蛋白质解折叠速率的温度依赖关系.依据量子折叠理论,给出了一个预测二态蛋白质折叠速率的统计公式,用于65个蛋白的资料库,理论和实验比较的相关系数为0.73.此外,理论还给出了与实验结果一致的最大和最小折叠速率估计.  相似文献   

13.
蛋白质折叠是现代科学最具挑战性的难题之一。Anfinsen的先驱性工作已经过去数十年了,我们对蛋白质折叠的机理仍不甚了然。但值得庆幸的是,科学工作者们在解析几个模型蛋白质的折叠机理上已经取得了明显的进展。这篇综述将主要回顾在蛋白质折叠的计算研究方面的进展。受益于计算机技术的迅猛发展,在1998年首次实现了一个微秒的全原子水平的蛋白质折叠,从2000年开始,folding@home将全球分布式计算技术应用于蛋白质折叠。在经历了数十年艰苦的努力之后,天然蛋白质亚埃精度的折叠终于在2007年成功实现。近年来,一种全新的概念开始出现,人们越来越多地用网络来解释蛋白质折叠的机理。随着分子力场的不断完善,分子模拟将会在解析蛋白质折叠的机理上起到越来越重要的作用。  相似文献   

14.
蛋白质的正确折叠是实现其生物功能的保证,研究蛋白质去折叠路径及其在外部干扰下的构象变化,对揭示其折叠路径和机理至关重要,这也是分子生物学研究中的核心问题之一。与常用的光谱方法相比,电化学方法可通过蛋白或探针的氧化还原过程获得蛋白质折叠/去折叠的热力学和动力学信息,逐渐受到科学工作者的关注。  相似文献   

15.
探索和理解蛋白质折叠问题一直是分子生物学、结构生物学和生物物理学的终极挑战.未折叠的蛋白质应该存在一种普遍初始热力学亚稳态,否则无法解释蛋白质是如何在剧烈的热振动干扰下完成快速精确折叠的.本文通过分析水溶液环境和蛋白质折叠的相关性,揭示了一种由水分子屏蔽效应引起的未折叠蛋白质的普遍初始热力学亚稳态,该亚稳态的存在是水溶液环境中水分子的物理性质决定,并赋予未折叠蛋白质抵抗热扰动和避免错误折叠的能力.我们通过研究已发表的实验数据和建立分子模型,找到了该初始热力学亚稳态存在的相关证据,并推测了该亚稳态导致蛋白质精确折叠的相关物理学机制.  相似文献   

16.
胡始昌  江弋  林琛  邹权 《生物信息学》2012,10(2):112-115
蛋白质折叠问题被列为"21世纪的生物物理学"的重要课题,他是分子生物学中心法则尚未解决的一个重大生物学问题,因此预测蛋白质折叠模式是一个复杂、困难、和有挑战性的工作。为了解决该问题,我们引入了分类器集成,本文所采用的是三种分类器(LMT、RandomForest、SMO)进行集成以及188维组合理化特征来对蛋白质类别进行预测。实验证明,该方法可以有效表征蛋白质折叠模式的特性,对蛋白质序列数据实现精确分类;交叉验证和独立测试均证明本文预测准确率超过70%,比前人工作提高近10个百分点。  相似文献   

17.
依据蛋白质折叠子中氨基酸保守性,以氨基酸、氨基酸的极性、氨基酸的电性以及氨基酸的亲—疏水性为参数,从蛋白质的氨基酸序列出发,采用"一对多"的分类策略,通过构建打分矩阵和选取氨基酸序列模式片断,利用5种相似性打分函数对27类折叠子进行识别,最好的预测精度达到83.46%。结果表明,打分矩阵是预测多类蛋白质折叠子有效的方法。  相似文献   

18.
蛋白质的高级结构是由一级结构决定的,这就是说,蛋白质中氨基酸的排列顺序及其相互作用决定了蛋白质的结构和功能。本文从这一基本原则出发,分析并计算了氨基酸残基在折叠和非折叠状态下的暴露和埋藏,得到了一种计算蛋白质可及表面积的新方法。  相似文献   

19.
为了解决生物信息学中基因多序列比对的计算速度慢和软件陈旧的问题,提出了基于Yarn(Yet Another Resource Negotiator)云平台的生物基因多序列比对并行计算方法Yarn_clustalW。分析了clustalW算法的数学模型及其面向MapReduce的任务划分方式,Yarn_clustalW中综合考虑了基因的长度和数目,采用一种基于阈值刻度的任务划分方式。利用NCBI的GenBank生物基因数据作为案例程序进行了测试。实验结果表明:Yarn_clustalW比起多序列比对clustalW串行计算方法具有更快的运行时间与加速比,可以使生物科研人员节省很多时间与精力,方便对于药物靶标的发现,缩短生物药物的开发周期。  相似文献   

20.
基于支持向量机融合网络的蛋白质折叠子识别研究   总被引:11,自引:1,他引:11  
在不依赖于序列相似性的条件下,蛋白质折叠子识别是一种分析蛋白质结构的重要方法.提出了一种三层支持向量机融合网络,从蛋白质的氨基酸序列出发,对27类折叠子进行识别.融合网络使用支持向量机作为成员分类器,采用“多对多”的多类分类策略,将折叠子的6种特征分为主要特征和次要特征,构建了多个差异的融合方案,然后对这些融合方案进行动态选择得到最终决策.当分类之前难以确定哪些参与组合的特征种类能够使分类结果最好时,提供了一种可靠的解决方案来自动选择特征信息互补最大的组合,保证了最佳分类结果.最后,识别系统对独立测试样本的总分类精度达到61.04%.结果和对比表明,此方法是一种有效的折叠子识别方法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号