共查询到19条相似文献,搜索用时 62 毫秒
1.
蛋白质折叠规律研究是生命科学重大前沿课题,折叠类型分类是蛋白质折叠研究的基础。构建BRD-like折叠类型模板数据库,建立了基于多模板的综合分类方法,并用于该折叠类型的分类。对实验集的12 117个样本进行检验,结果的敏感性、特异性分别为0.923和0.997,MCC值为0.72;对独立检验集2 260个样本的检验,结果发现:敏感性、特异性分别为0.941和0.998,MCC值为0.86.结果表明:基于多模板的综合分类方法可用于蛋白质折叠类型分类。 相似文献
2.
蛋白质折叠规律研究是生命科学领域重要的前沿课题之一,蛋白质折叠类型分类是折叠规律研究的基础。本研究以SCOP数据库的蛋白质折叠类型分类为基础、以Astral SCOPe 2.05数据库中相似性小于40%的α、β、α+β及α/β类所属的折叠类型为研究对象,完成了989种蛋白质折叠类型的模板构建并形成模板数据库;基于折叠类型设计模板建立了蛋白质折叠类型分类方法,实现了SCOP数据库蛋白质折叠类型的自动化分类。家族模板自洽性检验与独立性检验所得的敏感性、特异性以及MCC的平均值分别为:95.00%、99.99%、0.94与90.00%、99.97%、0.92,折叠类型模板自洽性检验与独立性检验所得的敏感性、特异性以及MCC的平均值分别为:93.71%、99.97%、0.91与86.00%、99.93%、0.87。结果表明:模板设计合理,可有效用于对已知结构的蛋白质进行分类。 相似文献
3.
蛋白质折叠类型分类是蛋白质分类研究的重要内容。以SCOP数据库中的 PH domain-like barrel 折叠类型为研究对象,选择序列相似度小于25%的61个样本为检验集,通过结构特征分析,确定了该折叠类型的模板及其对应的特征参数,利用模板与待测蛋白的空间结构比对信息,提出了一个新的折叠类型打分函数Fscore,建立了基于Fscore的蛋白质折叠类型分类方法并用于该折叠类型的分类。用此方法对Astral1.75中序列相似度小于95%的16711个样本进行检验,分类结果的特异性为99.97%。结果表明:特征参数抓住了折叠类型的本质,打分函数Fscore及基于Fscore建立的分类方法可用于 PH domain-like barrel 蛋白质折叠类型自动分类。 相似文献
4.
α/β类蛋白质折叠类型的分类方法研究 总被引:1,自引:0,他引:1
蛋白质折叠规律的研究是生命科学重大前沿课题之一,折叠分类是蛋白质折叠研究的基础。本文基于LIFCA数据库,选取样本量大于2的55种α/β类蛋白质折叠类型为研究对象。结合蛋白质折叠类型的定义及其保守拓扑结构特征,确定了55种蛋白质折叠类型的模板及其对应的特征参数。建立了基于模板的打分函数Mul-Fscore,并结合二级结构参数信息,给出了55种α/β类蛋白质折叠类型的多模板分类方法。用此方法对LIFAC数据库中的931个样本进行检验,分类结果的平均特异性、平均敏感性、MCC值分别为99.58%、79.47%、79.39%。与TM-score分类结果对比发现,Mul-Fscore分类的敏感性与MCC值好于TM-score的相应结果,平均特异性相近。 相似文献
5.
蛋白质空间结构研究是分子生物学、细胞生物学、生物化学以及药物设计等领域的重要课题.折叠类型反映了蛋白质核心结构的拓扑模式,对折叠类型的识别是蛋白质序列与结构关系研究的重要内容.选取LIFCA数据库中样本量较大的53种折叠类型,应用功能域组分方法进行折叠识别.将Astral 1.65中序列一致性小于95%的样本作为检验集,全库检验结果中平均敏感性为96.42%,特异性为99.91%,马修相关系数(MCC)为0.91,各项统计结果表明:功能域组分方法可以很好地应用在蛋白质折叠识别中,LIFCA相对简单的分类规则可以很好地集中蛋白质的大部分功能特性,反映了结构与功能的对应关系. 相似文献
6.
7.
蛋白质折叠类型识别是蛋白质结构研究的重要内容.以SCOP中的Globin-like折叠为研究对象,选择其中序列同一性小于25%的17个代表性蛋白质为训练集,采用机器和人工结合的办法进行结构比对,产生序列排比,经过训练得到了适合Globin-like折叠的概形隐马尔科夫模型(profile HMM)用于该折叠类型的识别.以Astrall.65中的68057个结构域样本进行检验,识别敏感度为99.64%,特异性100%.在折叠类型水平上,与Pfam和SUPERFAMILY单纯使用序列比对构建的HMM相比,所用模型由多于100个归为一个,仍然保持了很高的识别效果.结果表明:对序列相似度很低但具有相同折叠类型的蛋白质,可以通过引入结构比对的方法建立统一的HMM模型,实现高准确率的折叠类型识别. 相似文献
8.
《生命科学研究》2016,(5):381-388
蛋白质折叠类型识别是蛋白质结构研究的重要内容,折叠类型分类是折叠识别的基础。通过对ASTRAL-1.65数据库α类蛋白质所属折叠类型进行系统研究,建立蛋白质折叠类型模板数据库,提取反映折叠类型拓扑结构的模板特征参数,根据模板特征参数和TM-align结构比对结果,建立基于特征参数的打分函数Fdscore,并实现α类蛋白质折叠类型自动化分类。使用相同数据集样本,将Fdscore分类方法与TM-score分类方法对比,Fdscore分类方法的平均敏感性、平均特异性、MCC值分别为71.86%、99.49%、0.69,均高于TM-score分类方法相对应结果。上述结果表明该分类方法可用于α类蛋白质折叠类型的自动化分类。 相似文献
9.
10.
蛋白质的折叠 总被引:2,自引:0,他引:2
唐兵 《氨基酸和生物资源》1997,19(3):51-54
重点介绍了蛋白质折叠的热力学控制学说和动力学控制学说,简单介绍了几种蛋白质折叠模型并分析了多肽链在体内进行快速折叠的原因。 相似文献
11.
蛋白质折叠问题被列为"21世纪的生物物理学"的重要课题,他是分子生物学中心法则尚未解决的一个重大生物学问题,因此预测蛋白质折叠模式是一个复杂、困难、和有挑战性的工作。为了解决该问题,我们引入了分类器集成,本文所采用的是三种分类器(LMT、RandomForest、SMO)进行集成以及188维组合理化特征来对蛋白质类别进行预测。实验证明,该方法可以有效表征蛋白质折叠模式的特性,对蛋白质序列数据实现精确分类;交叉验证和独立测试均证明本文预测准确率超过70%,比前人工作提高近10个百分点。 相似文献
12.
The α/β hydrolase fold is a typical example of a tertiary fold adopted by proteins that have no obvious sequence similarity, but nevertheless, in the course of evolution, diverged from a common ancestor. Recently solved structures demonstrate a considerably increased variability in fold architecture and substrate specificity, necessitating the redefinition of the minimal features that distinguish the family. 相似文献
13.
14.
以序列相似性低于40%的1895条蛋白质序列构建涵盖27个折叠类型的蛋白质折叠子数据库,从蛋白质序列出发,用模体频数值、低频功率谱密度值、氨基酸组分、预测的二级结构信息和自相关函数值构成组合向量表示蛋白质序列信息,采用支持向量机算法,基于整体分类策略,对27类蛋白质折叠子的折叠类型进行预测,独立检验的预测精度达到了66.67%。同时,以同样的特征参数和算法对27类折叠子的4个结构类型进行了预测,独立检验的预测精度达到了89.24%。将同样的方法用于前人使用过的27类折叠子数据库,得到了好于前人的预测结果。 相似文献
15.
Kinases are a ubiquitous group of enzymes that catalyze the phosphoryl transfer reaction from a phosphate donor (usually ATP) to a receptor substrate. Although all kinases catalyze essentially the same phosphoryl transfer reaction, they display remarkable diversity in their substrate specificity, structure, and the pathways in which they participate. In order to learn the relationship between structural fold and functional specificities in kinases, we have done a comprehensive survey of all available kinase sequences (>17,000) and classified them into 30 distinct families based on sequence similarities. Of these families, 19, covering nearly 98% of all sequences, fall into seven general structural folds for which three-dimensional structures are known. These fold groups include some of the most widespread protein folds, such as Rossmann fold, ferredoxin fold, ribonuclease H fold, and TIM beta/alpha-barrel. On the basis of this classification system, we examined the shared substrate binding and catalytic mechanisms as well as variations of these mechanisms in the same fold groups. Cases of convergent evolution of identical kinase activities occurring in different folds are discussed. 相似文献
16.
The distribution of the C(alpha)-C(alpha) distances between residues separated by three to 30 amino acid residues is highly characteristic of protein folds and makes it possible to identify them from a straightforward comparison of the distance histograms. The comparison is carried out by contingency table analysis and yields a probability of identity (PRIDE score), with values between zero and 1. For closely related structures, PRIDE is highly correlated with the root-mean-square distance between C(alpha) atoms, but it provides a correct classification even for unrelated structures for which a structural alignment is not meaningful. For example, an analysis of the CATH database of fold structures showed that 98.8% of the folds fall into the correct CATH homologous superfamily category, based on the highest PRIDE score obtained. Structural alignment and secondary-structure assignment are not necessary for the calculation of PRIDE, which is fast enough to allow the scanning of large databases. 相似文献
17.
18.
Yi Zhang Haifeng Zhao Jia Wang Jingpeng Ge Yang Li Jinke Gu Peng Li Yue Feng Maojun Yang 《The Journal of biological chemistry》2013,288(30):22058-22066
In the nematode Caenorhabditis elegans, fem-1, fem-2, and fem-3 play crucial roles in male sexual development. Among these three genes, fem-2 encodes a PP2C (serine/threonine phosphatase type 2C)-like protein, whose activity promotes the development of masculinity. Different from the canonical PP2Cs, FEM-2 consists of an additional N-terminal domain (NTD) apart from its C-terminal catalytic domain. Interestingly, genetic studies have indicated indispensable roles for both of these two domains of FEM-2 in promoting male development, but the underlying mechanism remains unknown. In the present study, we solved the crystal structure of full-length FEM-2, which revealed a novel structural fold formed by its NTD. Structural and functional analyses demonstrated that the NTD did not directly regulate the in vitro dephosphorylation activity of FEM-2, but instead functioned as a scaffold domain in the assembly of the FEM-1/2/3 complex, the executioner in the final step of the sex determination pathway. Biochemical studies further identified the regions in the NTD involved in FEM-1 and FEM-3 interactions. Our results not only identified a novel fold formed by the extra domain of a noncanonical PP2C enzyme, but also provided important insights into the molecular mechanism of how the NTD works in mediating the sex-determining role of FEM-1/2/3 complex. 相似文献