首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
用离散量预测蛋白质的结构型   总被引:14,自引:2,他引:12  
基于蛋白质的结构类型决定了它的二级结构序列的概念,用二级结构序列参数Nα,Nβ,Nβaβ,N(βαβ)构成离散源,并计算离散量D(Xα),D(Xβ),D(Xα+β),利用离散增量预测蛋白质的结构类型,它是由这个蛋白质的离散量D(Xn)与四个标准离散D(Xα),D(Xβ),D(Xα/β),D(Xα+β)之间离散增量的最小值所决定的,预测结果表明,准确率分别达到84.8%(标准集)和83.3%(检验集)。  相似文献   

2.
蛋白质结构型的定义和识别   总被引:5,自引:1,他引:4  
提出紧结构域的概念,由二级结构序列中一段或几段连续的α螺旋和β折叠构成的空间紧密堆集的最大折叠体称为紧结构域.利用3种紧结构域(α域,β域和α/β域)定义球蛋白的5种结构型:α型蛋白,β型蛋白,α/β型蛋白,多域蛋白和ζ型蛋白.将1 261个代表性的蛋白质(1 022家族)进行分类,并和SCOP库的分类做了比较.进行了删去序列冗余的分析.在此基础上提出结构型的预测方案,成功率在82%~85%.  相似文献   

3.
提出紧结构域的概念,由二级结构序列中一段或几段连续的α螺旋和β折叠构成的空间紧密堆集的最大折叠体称为紧结构域.利用3种紧结构域(α域,β域和α/β域)定义球蛋白的5种结构型:α型蛋白,β型蛋白,α/β型蛋白,多域蛋白和ζ型蛋白.将1 261个代表性的蛋白质(1 022家族)进行分类,并和SCOP库的分类做了比较.进行了删去序列冗余的分析.在此基础上提出结构型的预测方案,成功率在82%~85%.  相似文献   

4.
氨基酸组成聚类、蛋白质结构型和结构型的预测   总被引:11,自引:0,他引:11  
用信息聚类方法对蛋白质的氨基酸组成进行聚类,发现存在梯级成团(大集团分解成小集团)现象,645个蛋白质可分成15个小集团,每一个小集团与蛋白质二级结构含量决定的结构型有一定相关性,但与蛋白质五大结构型相关性不明显。指出了由氨基酸成分和二级结构含量预测结构型的方案中存在的问题。提出了由蛋白质二级结构序列预测蛋白质结构型的新方法,并给出了预测蛋白质结构型的简明预测规则  相似文献   

5.
脯氨酸对蛋白质热稳定性的贡献   总被引:8,自引:0,他引:8  
单一氨基酸的置换可以改变酶的热稳定性。脯氨酸(Pro)残基在蛋白质结构及其热稳定性中具有特殊作用。它十分偏爱β-转折或无规卷曲结构,而很少出现在α-螺旋和β-折叠中。分析认为在改善酶热稳定性的蛋白质工程中,只要主链构象不发生骤变,则可在适当的β-转折或无规卷曲中引入Pro,通过其刚性的吡咯烷环,降低蛋白质去折叠时的骨架熵,从面使其周围的构象更合理。这一Pro理论(the proline theor  相似文献   

6.
蛋白质序列中的关联规则发现及其应用   总被引:2,自引:0,他引:2  
随着蛋白质序列-结构分析中使用的机器学习算法越来越复杂,其结果的解释和发现过程也随之复杂化,因此有必要寻找简单且理论上可靠的方法。通过引入原理简单、理论可靠、结果具有很强实际意义的关联规则发现算法,找到了蛋白质序列中数以万计的模式。结合实例演示了如何将这些模式应用于蛋白质序列分析中,如保守区域发现、二级结构预测等。同时根据这些结果构建了一个二级结构规则库和一种简单的二级结构预测算法,实验结果表明,约81%的二级结构可以由至少一条关联规则预测得到。  相似文献   

7.
P53蛋白质N末端的二级结构预测及其三维构象   总被引:2,自引:0,他引:2  
以编码P53N末端120个残基的mRNA二级结构为基础,结合Chou-Fasman蛋白质二级结构预测原则,预测出P53蛋白质N端的93个残基包含四段α螺旋结构(14-26;38-46;51-56;68-70),没有发现β片层。与四种以多重序列联配为基础的蛋白质二级结构预测方法(准确率均为73.20%左右)相对照,结果十分相近。在SGI工作站上以此为初始结构建立的三维构象提示,P53N末端前80个氨基酸肽段呈弧型板块结构,其转录激活区由两段主要螺旋组成,呈上下构形,占据弧型板块的顶部及底部外侧缘。C端13个富含脯氨酸肽段则呈弯曲松散状。这些构象与P53N末端的生物功能是相吻合的  相似文献   

8.
利用p53 C端118个氨基酸的mRNA二级结构和Chou-Fasman蛋白质二级结构预测原则,预测p53蛋白质C端289~325为卷曲肽段,368~393段包括两段螺旋结构: α1 368~373, α2 381~388.其中三段已知的蛋白质二级结构与此mRNA二级结构单元间有准确的对应关系.与四种以多重序列联配为基础的蛋白质二级结构预测方法(准确率均为73.20%左右)相对照,预测结果基本一致.结合单体聚合区31个氨基酸晶体结构,在SGI INDIGO2工作站上构建了p53 C端108个残基的三维结构.进一步揭示了p53 C端诸多生物功能区之间的空间构象关系.  相似文献   

9.
蛋白质的二级结构预测研究进展   总被引:1,自引:0,他引:1  
唐媛  李春花  张瑗  尚进  邹凌云  李立奇 《生物磁学》2013,(26):5180-5182
认识蛋白质的二级结构是了解蛋白质的折叠模式和三级结构的基础,并为研究蛋白质的功能以及它们之间的相互作用模式提供结构基础,同时还可以为新药研发提供帮助。故研究蛋白质的二级结构具有重要的意义。随着后基因组时代的到来,越来越多的蛋白质序列不断被发现,给蛋白质的二级结构研究带来巨大的挑战和研究空间。而依靠传统的实验方法很难获取大规模蛋白质的二级结构信息。目前,采用生物信息学手段仍然是获得大部分蛋白质二级结构的途径。近年来,许多研究者通过构建用于二级结构预测的蛋白质数据集,计算、提取蛋白质的各种特征信息,并采用不同的预测算法预测蛋白质的二级结构得到了快速的发展。本文拟从蛋白质的特征信息的提取与筛选、预测算法以及预测效果的检验方法等方面进行综述,介绍蛋白质二级结构预测领域的研究进展。相信随着基因组学、蛋白质组学和生物信息学的不断发展,蛋白质二级结构预测会不断取得新突破。  相似文献   

10.
蛋白质二级结构的预测是生物信息学中一个重要的研究课题,在对蛋白质组的研究中也是最具难度的一个问题。进行二级结构预测对于理解蛋白质结构与功能的关系,以及分子设计、生物制药等领域都有重要的现实意义。同时也是一级结构与三级结构所联系的媒介,也为三级结构的研究打下基础。虽然目前预测的方法有几十种,但准确率最高的也只有70%多,本文对于目前方法进行分析,希望从中得到更加准确的方法。  相似文献   

11.
Abstract

In this paper, we propose a nongraphical representation for protein secondary structures. By counting the frequency of occurrence of all possible four-tuples (i.e., four-letter words) of a protein secondary structure sequence, we construct a set of 3 × 3 matrices for the corresponding protein secondary structure sequence. Furthermore, the leading eigenvalues of these matrices are computed and considered as invariants for the protein secondary structure sequences. To illustrate the utility of our approach, we apply it to a set of real data to distinguish protein structural classes. The result indicates that it can be used to complement the classification of protein secondary structures.  相似文献   

12.
统计分析了人的 119种蛋白质和大肠杆菌的 92种蛋白质密码子翻译速率和蛋白质二级结构的关系。据m 密码子片段在不同二级结构中的频数分布 ,我们发现人和大肠杆菌中翻译速率与蛋白质二级结构之间有一定关系 :高翻译速率时倾向编码α螺旋、不倾向编码线团 (coil) ;低翻译速率时倾向编码线团、不倾向编码α螺旋 ;β折叠结构则随翻译速率表现出明显的振荡。同时 ,密码子的使用在不同片段内一般也是不均匀的 :在α螺旋片段内 ,结构尾部偏向使用高翻译速率密码子 ;中部倾向使用中翻译速率密码子 ;而头部使用的密码子翻译速率偏低。这样的倾向性不大可能归结为随机起伏的影响。  相似文献   

13.
同义密码子的反常蛋白质二级结构偏好性   总被引:1,自引:0,他引:1  
统计分析了 119种人蛋白质和 92种大肠杆菌蛋白质的mRNA序列和蛋白质二级结构的关系 .从二肽频数出发 ,研究了同义密码子使用对蛋白质二级结构的影响 ,证明其影响在 10 %到 2 0 %的量级 .对于人和大肠杆菌 ,在 90 %置信水平上 ,4 0 0对二肽中分别有 79对和 6 0对 ,在 95 %置信水平上 ,分别有 4 5对和 36对二肽的相应密码子二联体具有不同于氨基酸的反常二级结构偏好性 ,并且这种反常不能归因于随机涨落  相似文献   

14.
用离散量的方法识别蛋白质的超二级结构   总被引:1,自引:0,他引:1  
用离散量的方法,对2208个分辨率在2.5I以上的高精度的蛋白质结构中四类超二级结构进行了识别。从蛋白质一级序列出发,以氨基酸(20种氨基酸加一个空位)和其紧邻关联共同为参数,当序列模式固定长取8个氨基酸残基时,对“822”序列模式3交叉检验的平均预测精度达到78.1%,jack-knife检验的平均预测精度达到76.7%;当序列模式固定长取10个氨基酸残基时,对“1041”序列模式3交叉检验的平均预测精度达到83.1%,jack-knife检验的平均预测精度达到79.8%。  相似文献   

15.
Vries JK  Liu X  Bahar I 《Proteins》2007,68(4):830-838
An n-gram pattern (NP{n,m}) in a protein sequence is a set of n residues and m wildcards in a window of size n+m. Each window of n+m amino acids is associated with a collection of NP{n,m} patterns based on the combinatorics of n+m objects taken m at a time. NP{n,m} patterns that are shared between sequences reflect evolutionary relationships. Recently the authors developed an alignment-independent protein classification algorithm based on shared NP{4,2} patterns that compared favorably to PSI-BLAST. Theoretically, NP{4,2} patterns should also reflect secondary structure propensity since they contain all possible n-grams for 1 < or = n < or = 4 and a window of 6 residues is wide enough to capture periodicities in the 2 < or = n < or = 5 range. This sparked interest in differentiating the information content in NP{4,2} patterns related to evolution from the content related to local propensity. The probability of alpha-, beta-, and coil components was determined for every NP{4,2} pattern over all the chains in the Protein Data Bank (PDB). An algorithm exclusively based on the Z-values of these distributions was developed, which accurately predicted 71-76% of alpha-helical segments and 62-67% of beta-sheets in rigorous jackknife tests. This provided evidence for the strong correlation between NP{4,2} patterns and secondary structure. By grouping PDB chains into subsets with increasing levels of sequence identity, it was also possible to separate the evolutionary and local propensity contributions to the classification process. The results showed that information derived from evolutionary relationships was more important for beta-sheet prediction than alpha-helix prediction.  相似文献   

16.
A major goal of structural genomics is the provision of a structural template for a large fraction of protein domains. The magnitude of this task depends on the number and nature of protein sequence families. With a large number of bacterial genomes now fully sequenced, it is possible to obtain improved estimates of the number and diversity of families in that kingdom. We have used an automated clustering procedure to group all sequences in a set of genomes into protein families. Bench-marking shows the clustering method is sensitive at detecting remote family members, and has a low level of false positives. This comprehensive protein family set has been used to address the following questions. (1) What is the structure coverage for currently known families? (2) How will the number of known apparent families grow as more genomes are sequenced? (3) What is a practical strategy for maximizing structure coverage in future? Our study indicates that approximately 20% of known families with three or more members currently have a representative structure. The study indicates also that the number of apparent protein families will be considerably larger than previously thought: We estimate that, by the criteria of this work, there will be about 250,000 protein families when 1000 microbial genomes have been sequenced. However, the vast majority of these families will be small, and it will be possible to obtain structural templates for 70-80% of protein domains with an achievable number of representative structures, by systematically sampling the larger families.  相似文献   

17.
蛋白质可逆磷酸化涉及到几乎所有细胞活动的调节.着重探讨了影响蛋白激酶作用专一性的几个因素和磷酸化影响蛋白质功能的结构基础及作用机制.  相似文献   

18.
19.
Efforts to predict protein secondary structure have been hampered by the apparent structural plasticity of local amino acid sequences. Kabsch and Sander (1984, Proc. Natl. Acad. Sci. USA 81, 1075–1078) articulated this problem by demonstrating that identical pentapeptide sequences can adopt distinct structures in different proteins. With the increased size of the protein structure database and the availability of new methods to characterize structural environments, we revisit this observation of structural plasticity. Within a set of proteins with less than 50% sequence identity, 59 pairs of identical hexapeptide sequences were identified. These local structures were compared and their surrounding structural environments examined. Within a protein structural class (α/α, β/β, α/β, α + β), the structural similarity of sequentially identical hexapeptides usually is preserved. This study finds eight pairs of identical hexapeptide sequences that adopt β-strand structure in one protein and α-helical structure in the other. In none of the eight cases do the members of these sequence pairs come from proteins within the same folding class. These results have implications for class dependent secondary structure prediction algorithms.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号