共查询到20条相似文献,搜索用时 46 毫秒
1.
本文在菱形网格上研究讨论了二维HP模型。首先,将蛋白质结构预测问题转化成一个数学问题,并简化成氨基酸序列中每个氨基酸与网格格点的匹配问题。为了解决这个数学问题,我们改进并扩展了经典的粒子群算法。为了验证算法和模型的有效性,我们对一些典型的算例进行数值模拟。通过与方格网上得到的蛋白质构象进行比较,菱形网上的蛋白质构象更自然,更接近真实。我们进一步比较了菱形网格上的紧致构象和非紧致构象。结果显示我们的模型和算法在菱形网格上预测氨基酸序列的蛋白质结构是有效的有意义的。 相似文献
2.
3.
提出了一种新的蛋白质二级结构预测方法. 该方法从氨基酸序列中提取出和自然语言中的“词”类似的与物种相关的蛋白质二级结构词条, 这些词条形成了蛋白质二级结构词典, 该词典描述了氨基酸序列和蛋白质二级结构之间的关系. 预测蛋白质二级结构的过程和自然语言中的分词和词性标注一体化的过程类似. 该方法把词条序列看成是马尔科夫链, 通过Viterbi算法搜索每个词条被标注为某种二级结构类型的最大概率, 其中使用词网格描述分词的结果, 使用最大熵马尔科夫模型计算词条的二级结构概率. 蛋白质二级结构预测的结果是最优的分词所对应的二级结构类型. 在4个物种的蛋白质序列上对这种方法进行测试, 并和PHD方法进行比较. 试验结果显示, 这种方法的Q3准确率比PHD方法高3.9%, SOV准确率比PHD方法高4.6%. 结合BLAST搜索的局部相似的序列可以进一步提高预测的准确率. 在50个CASP5目标蛋白质序列上进行测试的结果是: Q3准确率为78.9%, SOV准确率为77.1%. 基于这种方法建立了一个蛋白质二级结构预测的服务器, 可以通过http://www.insun.hit.edu.cn:81/demos/biology/index.html来访问. 相似文献
4.
本文对蛋白质序列的肽键进行了统计分析,计算了二肽构象参数P_α、P_β、P_c和三肽构象参数Q_α、Q_β、Q_c。在此基础上提出了由氨基酸序列预测二级结构的规则。预测的正确率达90%,优于Chou-Fasman方法。这个结果表明二肽(三肽)关联在形成蛋白质二级结构中具有明显的重要性。 相似文献
5.
6.
7.
蛋白质空间结构的分析与预测已经成为现今分子生物学和生物信息学的重要研究课题之一。虽然引入了3D-profile,人工神经网络,遗传算法等复杂的模型或算法,并获得了相对较高的准确率,但是却很难对所得到的结果进行解释,且不易发现其中的生物学规律。而相应地,氨基酸序列所隐含的蛋白质结构信息,生物学和数学意义才应是我们所需探寻的重点。因此我们从分析构成特定二级结构的氨基酸序列着手,引入涉及关联规则的支持度S来计算特殊位点处氨基酸的贡献率,以期发现其中的隐含信息,并获得了相应的数据信息矩阵。通过分析二级结构的支持度,不仅得到了各氨基酸位于不同位点时相对于Beta结构的强弱作用关系,还发现了脯氨酸的特殊作用和相对于Beta结构的成核性。 相似文献
8.
预测蛋白质—蛋白质复合物结构的软对接算法 总被引:1,自引:0,他引:1
提出了一种有效的软对接算法 ,用于在已知受体和配体三维结构的条件下预测蛋白质 蛋白质复合物的结构。该算法的分子模型基于Janin提出的简化蛋白质模型 ,并在此基础上有所改进。对蛋白质分子表面的柔性氨基酸残基Arg、Lys、Asp、Glu和Met进行了特殊处理 ,通过软化分子表面的方式考虑了它们的侧链柔性。采用双重过滤技术来排除不合理的对接结构 ,此过滤技术是以复合物界面几何互补性和残基成对偏好性为标准提出的。对所得到的构象进行能量优化 ,之后用打分函数对这些结构进行排序 ,挑选出与复合物天然结构接近的构象。该打分函数包括静电、疏水和范德华相互作用能。用此算法对 2 6个复合物进行了结构预测 ,均找到了近天然结构 ,其中有 2 0个复合物的近天然结构排在了前 10位。改进的分子模型可以在一定程度上描述蛋白质表面残基侧链的柔性 ;双重过滤技术使更多的近天然结构保留下来 ,从而提高了算法成功预测的可能性 ;打分函数可以较合理地评价对接结构。总之 ,此种软对接算法能够对蛋白质分子识别的研究提供有益的帮助。 相似文献
9.
蛋白质结构预测方法探析 总被引:1,自引:0,他引:1
首先介绍了蛋白质结构预测中的三种理论方法,然后对同源蛋白质结构预测中侧链构造和环区构建中涉及到的主要方法进行了探讨,对非同源蛋白质结构预测中空间构象搜寻涉及到的主要算法进行了分析比较。 相似文献
10.
11.
本文提出能预测单链核酸分子的具有最小自由能的二级结构的计算方法。方法的基础是拓扑平面图的最大C—匹配原理和现有的单链核酸分子折叠构象的热力学数据资料。为了说明算法的能力,对免疫球蛋白r1重链的mRNA片段序列(459个核苷酸残基)大肠杆菌16s rRNA片段序列(567一883)以及脊髓灰白质炎病毒RNA片段序列(1—74O)的二级结构进行了计算机预测并同现有的结构模型进行了比较和讨论。由计算机预测的大肠杆菌16s rRNA中心域的二级结构与Noller和Woese提出的结构模型基本一致。 相似文献
12.
13.
14.
以从树肝脏mRNA逆转录得到的Ⅰ链cDNA为模板 ,运用SMARTRACEPCR技术 ,扩增得到树载脂蛋白E(apoE)cDNA序列 ,并推导出apoE蛋白质的氨基酸序列 .利用分子生物学软件包PCGENE对氨基酸序列和二级结构进行分析和比较 .结果表明 ,树apoEcDNA序列 (作为新基因已被GenBank接收 ,登录号为AF 30 3830 )由 1138bp构成 ,其中 5′非翻译区 6 4bp ,3′非翻译区 135bp ,939bp组成一个完整开放阅读框架 ,与人apoEcDNA的同源性为 86 % .编码 313个氨基酸组成的apoE前体 ,包含 18个氨基酸构成的信号肽和 2 95个氨基酸组成的成熟蛋白 .与人apoE氨基酸序列的同源性为 78% .树apoE与人及其它种属动物apoE在氨基酸组成上相近 ,但比人apoE少4个氨基酸 ,比动脉粥样硬化易感动物家兔apoE多 2个氨基酸 .经Garnier法预测 ,树apoE蛋白二级结构与人apoE相似 ,螺旋构象 (helical) 6 9 9% ,伸展构象 (extended) 16 6 % ,转角构象 (turn)6 0 % ,无规则卷曲 (coil) 7 6 % . 相似文献
15.
16.
蛋白质结构类预测是生物信息和蛋白质科学中重要的研究领域.基于Chou提出的伪氨基酸离散模型框架,从蛋白质序列出发,设计一种新的伪氨基酸组成方法表示蛋白质序列样本.抽取氨基酸组合(10-D)在序列中出现的频率和疏水氨基酸模式(6-D)表示蛋白质序列的附加特征,用和传统的氨基酸组成(20-D)一起构成的36维的伪氨基酸组成向量来表示蛋白质序列的特征.使用遗传算法来优化附加特征的权重系数.伪氨基酸组成向量作为输入数据,模糊支持向量机作为预测工具.使用三个常用的标准数据集来验证算法的性能.Jack-knife检验结果说明本方法具有较高的准确率,有望成为潜在的预测蛋白质功能的工具. 相似文献
17.
了解蛋白质的序列,三级结构与功能之间的关系,可以用遗传学方法对蛋白质氨基酸的序列进行设计,得到的修饰分子可以具有特殊的医疗效果或重要的工业价值。人机对话式计算机制图(computer graphics)可以显示蛋白质晶体学所揭示的结构信息,并建造结构模型(model)。如果缺乏合适的晶体结构,计算机方法就必须从序列推测蛋白质的构象。推测结构最有效的方法是利用序列的同源性或利用与已知的晶体结构更为普遍的类似性。上述方法的改进需要使用含有蛋白质构造基本形式的数据库。 相似文献
18.
以序列相似性低于40%的1895条蛋白质序列构建涵盖27个折叠类型的蛋白质折叠子数据库,从蛋白质序列出发,用模体频数值、低频功率谱密度值、氨基酸组分、预测的二级结构信息和自相关函数值构成组合向量表示蛋白质序列信息,采用支持向量机算法,基于整体分类策略,对27类蛋白质折叠子的折叠类型进行预测,独立检验的预测精度达到了66.67%。同时,以同样的特征参数和算法对27类折叠子的4个结构类型进行了预测,独立检验的预测精度达到了89.24%。将同样的方法用于前人使用过的27类折叠子数据库,得到了好于前人的预测结果。 相似文献
19.
将一种模拟退火算法的改进方法——作用遗传交叉算子的并行模拟退火算法PSA/GC,用于蛋白质结构预测的能量最小化问题,通过对三个蛋白质的实际测试,证实了PSA/GC比SA和PSA具有更强的寻优能力,能得到能量值更低的构象。通过对PSA/GC的交叉间隔和交叉手法进行了探讨,得到了有益的结论。 相似文献
20.
口蹄疫病毒(FMDV)的主要免疫原位于外壳蛋白质(VP1)的141-160氨基酸之间。相当于主要免疫原区段的合成肽在豚鼠体内可诱致中和抗体反应和保护作用。为了更精确地确定口蹄疫病毒的免疫原位置,我们使用了含有141-160氨基酸区段的合成肽,研究了血清A型的亚型之间的血清学差别。我们发现这些合成肽携带有同口蹄疫病毒亚型特异性一样的决定子。根据氨基酸序列,本文还讨论了这些研究结果和预测的结构模型之间的关系。 相似文献