首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
α/β类蛋白质折叠类型的分类方法研究   总被引:1,自引:0,他引:1       下载免费PDF全文
马帅  王勤  李晓琴 《生物信息学》2014,12(2):123-132
蛋白质折叠规律的研究是生命科学重大前沿课题之一,折叠分类是蛋白质折叠研究的基础。本文基于LIFCA数据库,选取样本量大于2的55种α/β类蛋白质折叠类型为研究对象。结合蛋白质折叠类型的定义及其保守拓扑结构特征,确定了55种蛋白质折叠类型的模板及其对应的特征参数。建立了基于模板的打分函数Mul-Fscore,并结合二级结构参数信息,给出了55种α/β类蛋白质折叠类型的多模板分类方法。用此方法对LIFAC数据库中的931个样本进行检验,分类结果的平均特异性、平均敏感性、MCC值分别为99.58%、79.47%、79.39%。与TM-score分类结果对比发现,Mul-Fscore分类的敏感性与MCC值好于TM-score的相应结果,平均特异性相近。  相似文献   

2.
蛋白质折叠类型分类是蛋白质分类研究的重要内容。以SCOP数据库中的 PH domain-like barrel 折叠类型为研究对象,选择序列相似度小于25%的61个样本为检验集,通过结构特征分析,确定了该折叠类型的模板及其对应的特征参数,利用模板与待测蛋白的空间结构比对信息,提出了一个新的折叠类型打分函数Fscore,建立了基于Fscore的蛋白质折叠类型分类方法并用于该折叠类型的分类。用此方法对Astral1.75中序列相似度小于95%的16711个样本进行检验,分类结果的特异性为99.97%。结果表明:特征参数抓住了折叠类型的本质,打分函数Fscore及基于Fscore建立的分类方法可用于 PH domain-like barrel 蛋白质折叠类型自动分类。  相似文献   

3.
依据蛋白质折叠子中氨基酸保守性,以氨基酸、氨基酸的极性、氨基酸的电性以及氨基酸的亲—疏水性为参数,从蛋白质的氨基酸序列出发,采用"一对多"的分类策略,通过构建打分矩阵和选取氨基酸序列模式片断,利用5种相似性打分函数对27类折叠子进行识别,最好的预测精度达到83.46%。结果表明,打分矩阵是预测多类蛋白质折叠子有效的方法。  相似文献   

4.
蛋白质折叠类型分类方法及分类数据库   总被引:1,自引:0,他引:1  
李晓琴  仁文科  刘岳  徐海松  乔辉 《生物信息学》2010,8(3):245-247,253
蛋白质折叠规律研究是生命科学重大前沿课题,折叠分类是蛋白质折叠研究的基础。目前的蛋白质折叠类型分类基本上靠专家完成,不同的库分类并不相同,迫切需要一个建立在统一原理基础上的蛋白质折叠类型数据库。本文以ASTRAL-1.65数据库中序列同源性在25%以下、分辨率小于2.5的蛋白为基础,通过对蛋白质空间结构的观察及折叠类型特征的分析,提出以蛋白质折叠核心为中心、以蛋白质结构拓扑不变性为原则、以蛋白质折叠核心的规则结构片段组成、连接和空间排布为依据的蛋白质折叠类型分类方法,建立了低相似度蛋白质折叠分类数据库——LIFCA,包含259种蛋白质折叠类型。数据库的建立,将为进一步的蛋白质折叠建模及数据挖掘、蛋白质折叠识别、蛋白质折叠结构进化研究奠定基础。  相似文献   

5.
蛋白质折叠规律研究是生命科学重大前沿课题,折叠类型分类是蛋白质折叠研究的基础。构建BRD-like折叠类型模板数据库,建立了基于多模板的综合分类方法,并用于该折叠类型的分类。对实验集的12 117个样本进行检验,结果的敏感性、特异性分别为0.923和0.997,MCC值为0.72;对独立检验集2 260个样本的检验,结果发现:敏感性、特异性分别为0.941和0.998,MCC值为0.86.结果表明:基于多模板的综合分类方法可用于蛋白质折叠类型分类。  相似文献   

6.
蛋白质折叠规律研究是生命科学领域重要的前沿课题之一,蛋白质折叠类型分类是折叠规律研究的基础。本研究以SCOP数据库的蛋白质折叠类型分类为基础、以Astral SCOPe 2.05数据库中相似性小于40%的α、β、α+β及α/β类所属的折叠类型为研究对象,完成了989种蛋白质折叠类型的模板构建并形成模板数据库;基于折叠类型设计模板建立了蛋白质折叠类型分类方法,实现了SCOP数据库蛋白质折叠类型的自动化分类。家族模板自洽性检验与独立性检验所得的敏感性、特异性以及MCC的平均值分别为:95.00%、99.99%、0.94与90.00%、99.97%、0.92,折叠类型模板自洽性检验与独立性检验所得的敏感性、特异性以及MCC的平均值分别为:93.71%、99.97%、0.91与86.00%、99.93%、0.87。结果表明:模板设计合理,可有效用于对已知结构的蛋白质进行分类。  相似文献   

7.
利用蛋白质内源荧光和酶活性两种信号以及荧光偏振,HPLC和停流等方法研究了盐酸胍诱导的α淀粉酶去折叠与重折叠的平衡转变和动力学。实验结果表明α淀粉酶去折叠与重折叠是两个不同的过程;变性与复性过程中可能伴有聚集体生成;去折叠与重折叠均为双相过程,重折叠大约始于2秒之后。  相似文献   

8.
蛋白质空间结构研究是分子生物学、细胞生物学、生物化学以及药物设计等领域的重要课题.折叠类型反映了蛋白质核心结构的拓扑模式,对折叠类型的识别是蛋白质序列与结构关系研究的重要内容.选取LIFCA数据库中样本量较大的53种折叠类型,应用功能域组分方法进行折叠识别.将Astral 1.65中序列一致性小于95%的样本作为检验集,全库检验结果中平均敏感性为96.42%,特异性为99.91%,马修相关系数(MCC)为0.91,各项统计结果表明:功能域组分方法可以很好地应用在蛋白质折叠识别中,LIFCA相对简单的分类规则可以很好地集中蛋白质的大部分功能特性,反映了结构与功能的对应关系.  相似文献   

9.
10.
牦牛生态类型的分类   总被引:4,自引:0,他引:4  
为进一步弄清中国牦牛的遗传资源及其类型划分,利用微卫星DNA、随机扩增多态性(RAPD)、扩增片断长度多态性(AFLP)等3种分子遗传标记技术研究了麦洼牦牛、九龙牦牛、大通牦牛和天祝白牦牛的分类;并结合作者对牦牛染色体和血液蛋白多态性的研究结果探讨了中国牦牛类群的分类.结果:①根据微卫星位点的等位基因频率进行聚类分析,表明麦洼牦牛和九龙牦牛的遗传距离最大(1.506),麦洼牦牛2个群体之间的遗传距离最小(1.062).5个牦牛群体被聚为两大类,四川九龙牦牛单独成一大类,其他牦牛群体聚为一类.②根据RAPD和AFLP两种分子遗传标记的分析,表明天祝牦牛和大通牦牛的遗传距离最小(0.0336),九龙牦牛和天祝牦牛的遗传距离最大(0.0414),4个牦牛品种被聚为两大类,九龙牦牛品种聚为一类,其它3个牦牛品种聚为一类.大通牦牛和天祝白牦牛在较近的水平上首先聚为一类,然后在较远处与麦洼牦牛聚为一大类.③根据染色体特征和血液蛋白位点的基因频率进行聚类的结果与微卫星DNA、RAPD、AFLP的聚类结果相似.中国牦牛可分为以九龙牦牛和麦洼牦牛为代表的两个类群(型).这与蔡立等将中国牦牛分为“青藏高原型”和“横断高山型”的结果是一致的.而与其他学者的分类结果有较大的差异.结合中国牦牛品种(群体)的地理分布、生态条件、育成史及其分化的实际情况,作者认为中国牦牛分为两个大的生态类型是合理的.  相似文献   

11.
对用于折叠模式识别的蛋白质结构数据库进行结构分类,构建了四个分类库:Al-α库,Al-β库,α/β库,α+β库和一个总库,然后分别统计出不同灵敏度的匹配评估函数(平均势)。对不同的平均势,不同结构类型的蛋白进行的检验发现:来源于α/β库的平均势预测能力最强,来源于Al-α库的平均势预测能力最弱;对α/β蛋白的预测成功率最高,对Al-α蛋白的预测成功率最低。这与α/β蛋白结构最规则,Al-α蛋白未加入辅基不能反映出结构的全部特征是相一致的  相似文献   

12.
蛋白质折叠类型识别方法研究   总被引:1,自引:0,他引:1  
蛋白质折叠类型识别是一种分析蛋白质结构的重要方法.以序列相似性低于25%的822个全B类蛋白为研究对象,提取核心结构二级结构片段及片段问氢键作用信息为折叠类型特征参数,构建全B类蛋白74种折叠类型模板数据库.定义查询蛋白与折叠类型模板间二级结构匹配函数SS、氢键作用势函数BP及打分函数P,P值最小的模板所对应的折叠类型为查询蛋白的折叠类型.从SCOP1.69中随机抽取三组、每组50个全β类蛋白结构域进行预测,分辨精度分别为56%、56%和42%;对Ding等提供的检验集进行预测,总分辨精度为61.5%.结果和比对表明,此方法是一种有效的折叠类型识别方法.  相似文献   

13.
从蛋白质折叠成自由能最小的稳定结构类型为研究的出发点,为揭示蛋白质空间折叠的动力学本质,对非同源蛋白质数据库,以蛋白质序列的氮基酸频率和自协方差函数为特征矢量,求出表征特征矢量中各分量耦合作用与协同作用的协方差矩阵所对应的特征值.与Chou的方法相比,更全面地反映了蛋白质折叠密码的简并性、全局性和多意性,为定量表征折叠成不同结构类的蛋白质,提供了一种动力学参数分析方法.  相似文献   

14.
基于模糊支持向量机的膜蛋白折叠类型预测   总被引:1,自引:0,他引:1  
现有的基于支持向量机(support vector machine,SVM)来预测膜蛋白折叠类型的方法.利用的蛋白质序列特征并不充分.并且在处理多类蛋白质分类问题时存在不可分区域,针对这两类问题.提取蛋白质序列的氨基酸和二肽组成特征,并计算加权的多阶氨基酸残基指数相关系数特征,将3类特征融和作为分类器的输入特征矢量.并采用模糊SVM(fuzzy SVM,FSVM)算法解决对传统SVM不可分数据的分类.在无冗余的数据集上测试结果显示.改进的特征提取方法在相同分类算法下预测性能优于已有的特征提取方法:FSVM在相同特征提取方法下性能优于传统的SVM.二者相结合的分类策略在独立性数据集测试下的预测精度达到96.6%.优于现有的多种预测方法.能够作为预测膜蛋白和其它蛋白质折叠类型的有效工具.  相似文献   

15.
以序列相似性低于40%的1895条蛋白质序列构建涵盖27个折叠类型的蛋白质折叠子数据库,从蛋白质序列出发,用模体频数值、低频功率谱密度值、氨基酸组分、预测的二级结构信息和自相关函数值构成组合向量表示蛋白质序列信息,采用支持向量机算法,基于整体分类策略,对27类蛋白质折叠子的折叠类型进行预测,独立检验的预测精度达到了66.67%。同时,以同样的特征参数和算法对27类折叠子的4个结构类型进行了预测,独立检验的预测精度达到了89.24%。将同样的方法用于前人使用过的27类折叠子数据库,得到了好于前人的预测结果。  相似文献   

16.
广西岩溶植被类型及其分类系统   总被引:24,自引:1,他引:23  
苏宗明  李先琨 《广西植物》2003,23(4):289-293
岩溶区具有特殊的生态环境,影响着植被的分布特征,广西的岩溶植被类型丰富,生态结构复杂、物种多样性丰富、特有成分突出,岩溶植被具有自身起源与演替方式的特点,同时带有植被地带性分布规律的烙印。广西岩溶植被类型可分为5个植被型组、8个植被型,共96群系。  相似文献   

17.
李瑞芳  李宏 《生物信息学》2009,7(4):288-291
以大肠杆菌60个蛋白酶以及几种常见病毒(SARS病毒、艾滋病病毒、丙型肝炎病毒及乙型肝炎病毒)各蛋白质序列中的所有α-螺旋和β-折叠片段为研究对象,计算了各片段的折叠速率和平均极性,分别在各物种的α-螺旋和β-折叠两类二级结构片段中分析了二者的相关性。得到结论:不论是大肠杆菌中的蛋白酶还是病毒蛋白,其中的两类氨基酸片段的平均极性与折叠速率都是极显著相关的:对于所有的α片段,二者呈线性正相关,而对于所有的β片段,二者成线性负相关。结果证实了在蛋白质折叠中,氨基酸的极性起着重要的作用。  相似文献   

18.
张天驰  张菁 《生物信息学》2011,9(2):142-145
蛋白质折叠过程模拟是当前蛋白质研究领域的一个难点问题。针对这一问题,提出了一个描述蛋白质折叠过程的算法-拟蛇算法,并且从分子振荡和分子动力学理论两个方面来证明该算法的核心函数是可行和正确的。经过实验总结出所有蛋白质空间结构都可以通过两种类型函数构造出来,提出了描述蛋白质折叠过程模型。与其它蛋白质折叠过程模拟算法的实验结果比较表明,拟蛇算法所构造的空间结构能量值最小、相似度最好。进而说明拟蛇算法和蛋白质折叠过程模型在描述蛋白质折叠过程方面具有明显优势。  相似文献   

19.
Globin-like蛋白质折叠类型识别   总被引:2,自引:0,他引:2  
蛋白质折叠类型识别是蛋白质结构研究的重要内容.以SCOP中的Globin-like折叠为研究对象,选择其中序列同一性小于25%的17个代表性蛋白质为训练集,采用机器和人工结合的办法进行结构比对,产生序列排比,经过训练得到了适合Globin-like折叠的概形隐马尔科夫模型(profile HMM)用于该折叠类型的识别.以Astrall.65中的68057个结构域样本进行检验,识别敏感度为99.64%,特异性100%.在折叠类型水平上,与Pfam和SUPERFAMILY单纯使用序列比对构建的HMM相比,所用模型由多于100个归为一个,仍然保持了很高的识别效果.结果表明:对序列相似度很低但具有相同折叠类型的蛋白质,可以通过引入结构比对的方法建立统一的HMM模型,实现高准确率的折叠类型识别.  相似文献   

20.
PGC-1α属于与能量代谢关系最密切的PGC-1转录辅助活化因子家族成员,最早在酵母双杂交体系中作为调控脂肪细胞分化的核受体PPARγ的辅激活因子被发现。PGC-1α在肌纤维类型转化中发挥重要作用,肌纤维类型及其组成是肌肉生长和肉品质形成的生物学基础,直接影响肌肉色泽、嫩度内脂肪含量。因此,研究PGC-1α在肌纤维类型转化中的调控作用,将为改善肉品质提供重要的理论依据。主要从PGC-1α的结构特点、作用特征及其在陆上动物和鱼类肌纤维类型转化中的最新进展等方面进行综述。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号