首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
李菁  王炜 《中国科学C辑》2006,36(6):552-562
序列比对是寻找蛋白质结构保守性区域的常用方法, 然而当序列相似小于30%时比对准确度却不高, 这是因为在这些序列中具有相似结构功能的不同残基在序列比对中往往被错误配对. 基于相似的物理化学性质, 某些残基可以被归类为一组, 而应用这些简化后的残基字符可以有效地简化蛋白质序列的复杂性并保持序列的主要信息. 因此, 如果20种天然氨基酸残基能够正确的归类, 可以有效地提高序列比对的准确度. 本文基于蛋白质结构比对数据库DAPS, 提出了一种新的氨基酸残基归类方法, 并可以同时得到不同简化程度下的替代矩阵用于序列比对. 归类的合理性由相互熵方法确认, 并且应用简化后的字符表于序列比对来识别蛋白质的结构保守区域. 结果表明, 当氨基酸残基字符简化到9个左右时能够有效地提高序列比对的准确度.  相似文献   

2.
蛋白质的序列、结构和功能多种多样.大量研究表明蛋白质的结构与其氨基酸序列的排序有关,并且局部的氨基酸序列环境对蛋白质的结构具有一定的影响.本文提出一种新的基于5-mer氨基酸扭转角统计偏好的蛋白质结构类型预测方法,在该方法通过PDB数据库中5-mer中间氨基酸的扭转角统计偏好来进行结构类型的预测.新方法可以通过计算机仿...  相似文献   

3.
依据蛋白质折叠子中氨基酸保守性,以氨基酸、氨基酸的极性、氨基酸的电性以及氨基酸的亲—疏水性为参数,从蛋白质的氨基酸序列出发,采用"一对多"的分类策略,通过构建打分矩阵和选取氨基酸序列模式片断,利用5种相似性打分函数对27类折叠子进行识别,最好的预测精度达到83.46%。结果表明,打分矩阵是预测多类蛋白质折叠子有效的方法。  相似文献   

4.
基于氨基酸特征序列对人类Rh血型系统的蛋白质结构分析   总被引:1,自引:0,他引:1  
高雷  朱平 《生物信息学》2009,7(4):248-251
利用代数学中同态思想和物理中的“粗粒化”思想,以及HP模型,根据a,t,c,g的化学结构分类,提出了DNA序列的特征序列概念(σ-,τ-,σ∩τ-)并推广到蛋白质序列中,从而给出一种数值刻划,将蛋白质序列简化成一个(0,1)序列,基于上述给出特征序列的方法,根据氨基酸分子量与简并度的关系,提出了另外一种DNA序列的特征序列概念(-)并推广到蛋白质序列中,进而给出了另外一种数值刻划,将蛋白质序列简化成一个(0,1,2)序列,通过比较RHD基因和RHCE基因的特征序列的数值刻划图,得出RHD基因和RHCE基因均偏爱使用低分子量且高简并度的氨基酸。  相似文献   

5.
蛋白质结构类预测是生物信息和蛋白质科学中重要的研究领域.基于Chou提出的伪氨基酸离散模型框架,从蛋白质序列出发,设计一种新的伪氨基酸组成方法表示蛋白质序列样本.抽取氨基酸组合(10-D)在序列中出现的频率和疏水氨基酸模式(6-D)表示蛋白质序列的附加特征,用和传统的氨基酸组成(20-D)一起构成的36维的伪氨基酸组成向量来表示蛋白质序列的特征.使用遗传算法来优化附加特征的权重系数.伪氨基酸组成向量作为输入数据,模糊支持向量机作为预测工具.使用三个常用的标准数据集来验证算法的性能.Jack-knife检验结果说明本方法具有较高的准确率,有望成为潜在的预测蛋白质功能的工具.  相似文献   

6.
蛋白质序列复杂性简化与非比对序列分析   总被引:1,自引:0,他引:1  
非比对序列分析是最新发展的一种序列分析方法,具有计算效率高并适用于分析低相似性的序列,已成功用于DNA的序列分析中.但是由于蛋白质序列的复杂性,非比对序列分析对于蛋白质序列分析的准确度却不高.用将20种天然氨基酸残基归类的方法,简化了蛋白质序列的复杂性,并运用到对蛋白质的非比对序列分析中,有效地提高了序列分析的准确性.  相似文献   

7.
本文首次将基于位置权重矩阵的打分函数用于蛋白质二级结构的预测中.我们选取CB513数据库作为基准数据库,首先在库中截取11残基和21残基片段,依据中心残基的二级结构类型分成3个集合;然后分别建立20种氨基酸、以及依据亲疏水性约化成的6种氨基酸在3个集合中的位置权重矩阵;对于任意一个待测的序列片段X通过和3个位置权重矩阵比较,应用打分函数得到3个不同的分值,比较哪个分值最大X就属于哪一类;最后在误差允许范围内对预测结果进行修正,得到的预测精度Q_3最高达到了80%.  相似文献   

8.
把20种氨基酸简化为3类:疏水氨基酸(hydrophobic,H)、亲水氨基酸(hydrophilic,P)及中性氨基酸(neutral,N),每个氨基酸简化为一个点,用其C!原子来代替.采用非格点模型,以相对熵作为优化函数,进行蛋白质三维结构预测.为了与基于相对熵方法的蛋白质设计工作进行统一,采用了新的接触强度函数.选用蛋白质数据库中的天然蛋白质作为测试靶蛋白,结果表明,采用该模型和方法取得了较好的结果,预测结构相对于天然结构的均方根偏差在0.30~0.70nm之间.该工作为基于相对熵及HNP模型的蛋白质设计研究打下了基础.  相似文献   

9.
利用p53 C端118个氨基酸的mRNA二级结构和Chou-Fasman蛋白质二级结构预测原则,预测p53蛋白质C端289~325为卷曲肽段,368~393段包括两段螺旋结构: α1 368~373, α2 381~388.其中三段已知的蛋白质二级结构与此mRNA二级结构单元间有准确的对应关系.与四种以多重序列联配为基础的蛋白质二级结构预测方法(准确率均为73.20%左右)相对照,预测结果基本一致.结合单体聚合区31个氨基酸晶体结构,在SGI INDIGO2工作站上构建了p53 C端108个残基的三维结构.进一步揭示了p53 C端诸多生物功能区之间的空间构象关系.  相似文献   

10.
核酸序列中包含一定的蛋白质结构信息。根据通常情况下遗传密码表中密码子中间位的碱基配对时产生的氢键数目,尝试将20种氨基酸划分为两类,并用自编的计算机软件对蛋白质二级结构数据库中两类氨基酸的类聚现象进行了统计分析。结果表明,使用这种方法对氨基酸进行划分后,氨基酸残基具有较大概率与划入同一类的氨基酸残基相邻出现,并且这种聚集体对二级结构具有一定的偏好性。最后按照该方法设计了一段氨基酸序列并给出了预测服务器预测得到的结构。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号