首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
本文在菱形网格上研究讨论了二维HP模型。首先,将蛋白质结构预测问题转化成一个数学问题,并简化成氨基酸序列中每个氨基酸与网格格点的匹配问题。为了解决这个数学问题,我们改进并扩展了经典的粒子群算法。为了验证算法和模型的有效性,我们对一些典型的算例进行数值模拟。通过与方格网上得到的蛋白质构象进行比较,菱形网上的蛋白质构象更自然,更接近真实。我们进一步比较了菱形网格上的紧致构象和非紧致构象。结果显示我们的模型和算法在菱形网格上预测氨基酸序列的蛋白质结构是有效的有意义的。  相似文献   

2.
蛋白质结构从头预测是不依赖模板仅从氨基酸序列信息得到天然结构。它的关键是正确定义能量函数、精确选用计算机搜索算法来寻找能量最低值。基于此,本文系统介绍了能量函数和构象搜索策略,并列举了几种比较成功的从头预测方法,通过比较得出结论:基于统计学知识的能量函数是近年来从头预测发展的主要方向,现有从头预测的构象搜索都用到Monte Carlo法。这表明随着蛋白质结构预测研究的深入,能量函数的构建、构象搜索方法的选择、大分子蛋白质结构的从头预测等关键性问题都取得了突破性进展。  相似文献   

3.
提出了一种新的蛋白质二级结构预测方法. 该方法从氨基酸序列中提取出和自然语言中的“词”类似的与物种相关的蛋白质二级结构词条, 这些词条形成了蛋白质二级结构词典, 该词典描述了氨基酸序列和蛋白质二级结构之间的关系. 预测蛋白质二级结构的过程和自然语言中的分词和词性标注一体化的过程类似. 该方法把词条序列看成是马尔科夫链, 通过Viterbi算法搜索每个词条被标注为某种二级结构类型的最大概率, 其中使用词网格描述分词的结果, 使用最大熵马尔科夫模型计算词条的二级结构概率. 蛋白质二级结构预测的结果是最优的分词所对应的二级结构类型. 在4个物种的蛋白质序列上对这种方法进行测试, 并和PHD方法进行比较. 试验结果显示, 这种方法的Q3准确率比PHD方法高3.9%, SOV准确率比PHD方法高4.6%. 结合BLAST搜索的局部相似的序列可以进一步提高预测的准确率. 在50个CASP5目标蛋白质序列上进行测试的结果是: Q3准确率为78.9%, SOV准确率为77.1%. 基于这种方法建立了一个蛋白质二级结构预测的服务器, 可以通过http://www.insun.hit.edu.cn:81/demos/biology/index.html来访问.  相似文献   

4.
 本文对蛋白质序列的肽键进行了统计分析,计算了二肽构象参数P_α、P_β、P_c和三肽构象参数Q_α、Q_β、Q_c。在此基础上提出了由氨基酸序列预测二级结构的规则。预测的正确率达90%,优于Chou-Fasman方法。这个结果表明二肽(三肽)关联在形成蛋白质二级结构中具有明显的重要性。  相似文献   

5.
本文基于范德华力势能预测2D三向的蛋白质结构。首先,将蛋白质结构预测这一生物问题转化为数学问题,并建立基于范德华力势能函数的数学模型。其次,使用遗传算法对数学模型进行求解,为了提高蛋白质结构预测效率,我们在标准遗传算法的基础上引入了调整算子这一概念,改进了遗传算法。最后,进行数值模拟实验。实验的结果表明范德华力势能函数模型是可行的,同时,和规范遗传算法相比,改进后的遗传算法能够较大幅度提高算法的搜索效率,并且遗传算法在蛋白质结构预测问题上有巨大潜力。  相似文献   

6.
从蛋白质的分子结构、翻译后的蛋白质质量控制、蛋白质结构预测方法 3个方面阐述肽链的折叠方式不是引起蛋白质结构和功能多样性的直接原因:在氨基酸序列确定的情况下,肽链的折叠方式是保守的;肽链一旦折叠错误,蛋白质质量控制系统会对其进行纠正或降解清除,若质量控制失败,错误折叠的蛋白质便会引起疾病;从氨基酸序列出发利用分子力学模拟方法和建模软件预测蛋白质三维构象的研究技术侧面印证了氨基酸序列确定的肽链其折叠方式具有保守性。  相似文献   

7.
蛋白质空间结构的分析与预测已经成为现今分子生物学和生物信息学的重要研究课题之一。虽然引入了3D-profile,人工神经网络,遗传算法等复杂的模型或算法,并获得了相对较高的准确率,但是却很难对所得到的结果进行解释,且不易发现其中的生物学规律。而相应地,氨基酸序列所隐含的蛋白质结构信息,生物学和数学意义才应是我们所需探寻的重点。因此我们从分析构成特定二级结构的氨基酸序列着手,引入涉及关联规则的支持度S来计算特殊位点处氨基酸的贡献率,以期发现其中的隐含信息,并获得了相应的数据信息矩阵。通过分析二级结构的支持度,不仅得到了各氨基酸位于不同位点时相对于Beta结构的强弱作用关系,还发现了脯氨酸的特殊作用和相对于Beta结构的成核性。  相似文献   

8.
预测蛋白质—蛋白质复合物结构的软对接算法   总被引:1,自引:0,他引:1  
提出了一种有效的软对接算法 ,用于在已知受体和配体三维结构的条件下预测蛋白质 蛋白质复合物的结构。该算法的分子模型基于Janin提出的简化蛋白质模型 ,并在此基础上有所改进。对蛋白质分子表面的柔性氨基酸残基Arg、Lys、Asp、Glu和Met进行了特殊处理 ,通过软化分子表面的方式考虑了它们的侧链柔性。采用双重过滤技术来排除不合理的对接结构 ,此过滤技术是以复合物界面几何互补性和残基成对偏好性为标准提出的。对所得到的构象进行能量优化 ,之后用打分函数对这些结构进行排序 ,挑选出与复合物天然结构接近的构象。该打分函数包括静电、疏水和范德华相互作用能。用此算法对 2 6个复合物进行了结构预测 ,均找到了近天然结构 ,其中有 2 0个复合物的近天然结构排在了前 10位。改进的分子模型可以在一定程度上描述蛋白质表面残基侧链的柔性 ;双重过滤技术使更多的近天然结构保留下来 ,从而提高了算法成功预测的可能性 ;打分函数可以较合理地评价对接结构。总之 ,此种软对接算法能够对蛋白质分子识别的研究提供有益的帮助。  相似文献   

9.
蛋白质结构预测方法探析   总被引:1,自引:0,他引:1  
刘云玲  陶兰 《生物信息学》2007,5(4):185-186
首先介绍了蛋白质结构预测中的三种理论方法,然后对同源蛋白质结构预测中侧链构造和环区构建中涉及到的主要方法进行了探讨,对非同源蛋白质结构预测中空间构象搜寻涉及到的主要算法进行了分析比较。  相似文献   

10.
氨基酸序列集熵值计算工具实现及应用   总被引:1,自引:0,他引:1  
氨基酸序列保守区和可变区分析是蛋白质结构和功能分析预测的关键环节。本研究根据该需求,编写了Entropy软件,实现了氨基酸序列集熵值计算、统计分析和优势序列模型自动生成等功能,并利用其对A型流感病毒血凝素氨基酸序列的特征进行了分析。该软件为氨基酸序列集保守性分析提供了可靠工具。  相似文献   

11.
本文提出能预测单链核酸分子的具有最小自由能的二级结构的计算方法。方法的基础是拓扑平面图的最大C—匹配原理和现有的单链核酸分子折叠构象的热力学数据资料。为了说明算法的能力,对免疫球蛋白r1重链的mRNA片段序列(459个核苷酸残基)大肠杆菌16s rRNA片段序列(567一883)以及脊髓灰白质炎病毒RNA片段序列(1—74O)的二级结构进行了计算机预测并同现有的结构模型进行了比较和讨论。由计算机预测的大肠杆菌16s rRNA中心域的二级结构与Noller和Woese提出的结构模型基本一致。  相似文献   

12.
为了降低固有不规则蛋白质预测模型中特征矩阵的稀疏性,提高预测模型的性能,提出一种利用氨基酸结构倾向性预测固有不规则蛋白质的方法.利用氨基酸结构倾向性将20种氨基酸进行分类,构建氨基酸简化集合,从间接角度提取氨基酸序列中蕴含的不规则结构特征,利用新的简化集合重新描述氨基酸序列,构建固有不规则蛋白质预测模型.预测结果表明,基于氨基酸结构倾向性的预测模型能够有效地挖掘氨基酸结构倾向性中隐藏的不规则结构特征信息,提高固有不规则蛋白质预测模型的预测精度.  相似文献   

13.
基于四肽构象的可视化聚类的结果,提出了一种新的编码方法,由此可将蛋白质三维构象空间映射到一维编码空间,将蛋白质三维结构空间中的模式搜索和模式发现问题转化为一维编码空间中的相应问题。通过两个算法从模式检索以及模式发现两方面验证了编码的有效性;同时利用熵的概念探讨了序列、结构之间的相关度,得到了一些重要的序列.结构模式.实验结果表明,该编码方法能更加准确地反映四肽构象空间中的分布情况,其结果可解释性更强.  相似文献   

14.
以从树肝脏mRNA逆转录得到的Ⅰ链cDNA为模板 ,运用SMARTRACEPCR技术 ,扩增得到树载脂蛋白E(apoE)cDNA序列 ,并推导出apoE蛋白质的氨基酸序列 .利用分子生物学软件包PCGENE对氨基酸序列和二级结构进行分析和比较 .结果表明 ,树apoEcDNA序列 (作为新基因已被GenBank接收 ,登录号为AF 30 3830 )由 1138bp构成 ,其中 5′非翻译区 6 4bp ,3′非翻译区 135bp ,939bp组成一个完整开放阅读框架 ,与人apoEcDNA的同源性为 86 % .编码 313个氨基酸组成的apoE前体 ,包含 18个氨基酸构成的信号肽和 2 95个氨基酸组成的成熟蛋白 .与人apoE氨基酸序列的同源性为 78% .树apoE与人及其它种属动物apoE在氨基酸组成上相近 ,但比人apoE少4个氨基酸 ,比动脉粥样硬化易感动物家兔apoE多 2个氨基酸 .经Garnier法预测 ,树apoE蛋白二级结构与人apoE相似 ,螺旋构象 (helical) 6 9 9% ,伸展构象 (extended) 16 6 % ,转角构象 (turn)6 0 % ,无规则卷曲 (coil) 7 6 % .  相似文献   

15.
为了研究一级结构对蛋白质耐热性的影响,利用软件DNAMAN对16个家族32种蛋白质序列进行了氨基酸含量分析,并统计分析了氨基酸组成对蛋白质耐热性的影响。通过比较同一家族的高低温蛋白质序列及16个家族中所有高温和低温蛋白质序列中氨基酸含量的变化可以推断(从低温到高温):Ser、Cys.含量降低显著,Arg、Ile、Pro含量升高显著。由此可知高温蛋白质倾向于含有疏水性氨基酸而避免亲水性氨基酸。  相似文献   

16.
蛋白质结构类预测是生物信息和蛋白质科学中重要的研究领域.基于Chou提出的伪氨基酸离散模型框架,从蛋白质序列出发,设计一种新的伪氨基酸组成方法表示蛋白质序列样本.抽取氨基酸组合(10-D)在序列中出现的频率和疏水氨基酸模式(6-D)表示蛋白质序列的附加特征,用和传统的氨基酸组成(20-D)一起构成的36维的伪氨基酸组成向量来表示蛋白质序列的特征.使用遗传算法来优化附加特征的权重系数.伪氨基酸组成向量作为输入数据,模糊支持向量机作为预测工具.使用三个常用的标准数据集来验证算法的性能.Jack-knife检验结果说明本方法具有较高的准确率,有望成为潜在的预测蛋白质功能的工具.  相似文献   

17.
了解蛋白质的序列,三级结构与功能之间的关系,可以用遗传学方法对蛋白质氨基酸的序列进行设计,得到的修饰分子可以具有特殊的医疗效果或重要的工业价值。人机对话式计算机制图(computer graphics)可以显示蛋白质晶体学所揭示的结构信息,并建造结构模型(model)。如果缺乏合适的晶体结构,计算机方法就必须从序列推测蛋白质的构象。推测结构最有效的方法是利用序列的同源性或利用与已知的晶体结构更为普遍的类似性。上述方法的改进需要使用含有蛋白质构造基本形式的数据库。  相似文献   

18.
以序列相似性低于40%的1895条蛋白质序列构建涵盖27个折叠类型的蛋白质折叠子数据库,从蛋白质序列出发,用模体频数值、低频功率谱密度值、氨基酸组分、预测的二级结构信息和自相关函数值构成组合向量表示蛋白质序列信息,采用支持向量机算法,基于整体分类策略,对27类蛋白质折叠子的折叠类型进行预测,独立检验的预测精度达到了66.67%。同时,以同样的特征参数和算法对27类折叠子的4个结构类型进行了预测,独立检验的预测精度达到了89.24%。将同样的方法用于前人使用过的27类折叠子数据库,得到了好于前人的预测结果。  相似文献   

19.
刘云玲  陶兰 《生物信息学》2006,4(4):173-175
将一种模拟退火算法的改进方法——作用遗传交叉算子的并行模拟退火算法PSA/GC,用于蛋白质结构预测的能量最小化问题,通过对三个蛋白质的实际测试,证实了PSA/GC比SA和PSA具有更强的寻优能力,能得到能量值更低的构象。通过对PSA/GC的交叉间隔和交叉手法进行了探讨,得到了有益的结论。  相似文献   

20.
口蹄疫病毒(FMDV)的主要免疫原位于外壳蛋白质(VP1)的141-160氨基酸之间。相当于主要免疫原区段的合成肽在豚鼠体内可诱致中和抗体反应和保护作用。为了更精确地确定口蹄疫病毒的免疫原位置,我们使用了含有141-160氨基酸区段的合成肽,研究了血清A型的亚型之间的血清学差别。我们发现这些合成肽携带有同口蹄疫病毒亚型特异性一样的决定子。根据氨基酸序列,本文还讨论了这些研究结果和预测的结构模型之间的关系。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号