首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
蛋白质超二级结构预测是三级结构预测的一个非常重要的中间步骤。本文从蛋白质的一级序列出发,对5793个蛋白质中的四类简单超二级结构进行预测,以位点氨基酸为参数,采用3种片段截取方式,分别用离散增量算法预测的结果不理想,将组合的离散增量值作为特征参数输入支持向量机,取得了较好的预测结果,5交叉检验的平均预测总精度达到83.0%,Matthew’s相关系数在0.71以上。  相似文献   

2.
用人工神经网络方法预测蛋白质超二级结构   总被引:10,自引:0,他引:10  
蛋白质超二级结构,即由α-螺旋和β-折叠等二级结构单元和连接短肽组成的超二级结构,是蛋白质结构研究中的一个重要层次。目前蛋白质超二级结构的预测工作尚属摸索阶段,还没有成熟的方法。人工神经网络预测方法是近年来在二级结构预测中发展起来的新方法。本文成功的将人工神经网络引入蛋白质超二级结构的预测工作中,结果表明蛋白质的超二级结构的发生与其局域的氨基酸的序列模式有重要联系,可以由蛋白质的一级结构序列预测该  相似文献   

3.
用离散量预测蛋白质的结构型   总被引:12,自引:2,他引:12  
基于蛋白质的结构类型决定了它的二级结构序列的概念,用二级结构序列参数Nα,Nβ,Nβaβ,N(βαβ)构成离散源,并计算离散量D(Xα),D(Xβ),D(Xα+β),利用离散增量预测蛋白质的结构类型,它是由这个蛋白质的离散量D(Xn)与四个标准离散D(Xα),D(Xβ),D(Xα/β),D(Xα+β)之间离散增量的最小值所决定的,预测结果表明,准确率分别达到84.8%(标准集)和83.3%(检验集)。  相似文献   

4.
近年来关于蛋白质超二级结构(supersecondary motifs,Motifs)的研究已成为国际上一个热点课题,国内也开始出现有关的研究论文,蛋白质超二级结构是两个或几个规则二级结构单元的进一步组合,或看成是二级结构的局域折叠.文章就蛋白质Motifs结构的定义,特点,及对这一结构层次开展研究的意义作了综述,并对蛋白质Motifs研究的进展作了简要的介绍.  相似文献   

5.
曹晨  马堃 《生物信息学》2016,14(3):181-187
蛋白质二级结构是指蛋白质骨架结构中有规律重复的构象。由蛋白质原子坐标正确地指定蛋白质二级结构是分析蛋白质结构与功能的基础,二级结构的指定对于蛋白质分类、蛋白质功能模体的发现以及理解蛋白质折叠机制有着重要的作用。并且蛋白质二级结构信息广泛应用到蛋白质分子可视化、蛋白质比对以及蛋白质结构预测中。目前有超过20种蛋白质二级结构指定方法,这些方法大体可以分为两大类:基于氢键和基于几何,不同方法指定结果之间的差异较大。由于尚没有蛋白质二级结构指定方法的综述文献,因此,本文主要介绍和总结已有蛋白质二级结构指定方法。  相似文献   

6.
神经网络在蛋白质二级结构预测中的应用   总被引:3,自引:0,他引:3  
介绍了蛋白质二级结构预测的研究意义,讨论了用在蛋白质二级结构预测方面的神经网络设计问题,并且较详尽地评述了近些年来用神经网络方法在蛋白质二级结构预测中的主要工作进展情况,展望了蛋白质结构预测的前景。  相似文献   

7.
目前评价蛋白质二级结构预测方法主要考虑预测准确率,并没有充分考虑方法自身参数对方法的影响。本文提出一种新型评价方法,将内在评价与外在评价相结合评价预测方法的优劣。以基于混合并行遗传算法的蛋白质二级结构预测方法为例,通过内在评价,合理选取内在参数——切片长度和组内类别数,有效提高预测准确率,同时,通过外在评价,与其他基于随机算法的蛋白质二级结构预测算法比较和与CASP所提供的结论比较,说明了方法的有效性与正确性,以此验证内在评价和外在评价的客观性、公正性和全面性。  相似文献   

8.
目前蛋白质二级结构的预测准确率徘徊在75%左右,难以作进一步提高。本文通过统计学的方法,对蛋白质的冗余数据库进行了分析。并由此证明,目前影响预测准确率继续的真正原因是蛋白质数据库本身的系统误差,系统误差大约为25%。而该误差是由于实验条件的客观原因带来的。  相似文献   

9.
提出了一种新的蛋白质二级结构预测方法. 该方法从氨基酸序列中提取出和自然语言中的“词”类似的与物种相关的蛋白质二级结构词条, 这些词条形成了蛋白质二级结构词典, 该词典描述了氨基酸序列和蛋白质二级结构之间的关系. 预测蛋白质二级结构的过程和自然语言中的分词和词性标注一体化的过程类似. 该方法把词条序列看成是马尔科夫链, 通过Viterbi算法搜索每个词条被标注为某种二级结构类型的最大概率, 其中使用词网格描述分词的结果, 使用最大熵马尔科夫模型计算词条的二级结构概率. 蛋白质二级结构预测的结果是最优的分词所对应的二级结构类型. 在4个物种的蛋白质序列上对这种方法进行测试, 并和PHD方法进行比较. 试验结果显示, 这种方法的Q3准确率比PHD方法高3.9%, SOV准确率比PHD方法高4.6%. 结合BLAST搜索的局部相似的序列可以进一步提高预测的准确率. 在50个CASP5目标蛋白质序列上进行测试的结果是: Q3准确率为78.9%, SOV准确率为77.1%. 基于这种方法建立了一个蛋白质二级结构预测的服务器, 可以通过http://www.insun.hit.edu.cn:81/demos/biology/index.html来访问.  相似文献   

10.
蛋白质二级结构预测是蛋白质结构研究的一个重要环节,大量的新预测方法被提出的同时,也不断有新的蛋白质二级结构预测服务器出现。试验选取7种目前常用的蛋白质二级结构预测服务器:PSRSM、SPOT-1D、MUFOLD、Spider3、RaptorX,Psipred和Jpred4,对它们进行了使用方法的介绍和预测效果的评估。随机选取了PDB在2018年8月至11月份发布的180条蛋白质作为测试集,评估角度为:Q3、Sov、边界识别率、内部识别率、转角C识别率,折叠E识别率和螺旋H识别率七种角度。上述服务器180条测试数据的Q3结果分别为:89.96%、88.18%、86.74%、85.77%、83.61%,79.72%和78.29%。结果表明PSRSM的预测结果最好。180条测试集中,以同源性30%,40%,70%分类的实验结果中,PSRSM的Q3结果分别为:89.49%、90.53%、89.87%,均优于其他服务器。实验结果表明,蛋白质二级结构预测可从结合多种深度学习方法以及使用大数据训练模型方向做进一步的研究。  相似文献   

11.
多样性指标用于基因中剪切位点的识别   总被引:4,自引:0,他引:4  
根据基因剪切位点处的碱基保守性特征,和附近位点的碱基组成和关联特征,应用多样性指标和二次判别分析,对几类模式生物的基因结构进行统一的分析和预测,能够较好地识别外显子和内含子及其边界.计算结果表明,对于4类物种,线虫(C.elegans),拟南芥(A.thaliana), 果蝇(D.melanogaster)和人类(human),核苷酸水平的识别精度为92.5%~97.1%,外显子水平的识别敏感性为83.7%~94.5%,特异性为87.8%~97.1%.预测能力优于GeneSplicer等剪切位点检测软件.  相似文献   

12.
林昊 《生物信息学》2009,7(4):252-254
由于蛋白质亚细胞位置与其一级序列存在很强的相关性,利用多样性增量来描述蛋白质之间氨基酸组分和二肽组分的相似程度,采用修正的马氏判别式(这里称为IDQD方法)对分枝杆菌蛋白质的亚细胞位置进行了预测。利用Jackknife检验对不同序列相似度下的蛋白质数据集进行了预测研究,结果显示,当数据集的序列相似度小于等于70%时,算法的预测精度稳定在75%左右。在对整体852条蛋白质的预测成功率达到87.7%,这一结果优于已有算法的预测精度,说明IDQD是一种有效的分枝杆菌蛋白质亚细胞预测方法。  相似文献   

13.
蛋白质结构型的识别方法   总被引:2,自引:0,他引:2  
给出了α型、β型、α/β型、多域型蛋白质二级结构主序列六联体的分布规律.提出了根据蛋白质二级结构主序列对蛋白质结构型进行识别(分类)的方法.以蛋白质二级结构主序列三联体为参数,利用Mahalanobis距离方法对上述4种结构型的蛋白质进行识别,分类的总体准确率为81%;以二级结构主序列中六联体的频数构成蛋白质结构的多样性源,利用多样性增量极小化对上述4种结构型进行识别,分类的总体准确率为83%. 同时也给出了对紧结构域的识别途径.  相似文献   

14.
蛋白质亚细胞定位的识别   总被引:3,自引:2,他引:3  
根据蛋白质的亚细胞定位,将蛋白质分为12类,用离散量的数学理论,以蛋白质中400个氨基酸二联体数目构成离散源,通过计算离散增量预测蛋白质的亚细胞定位,用Self-consistency和Jackknife两种方法测试均获得较高的预测成功率。结果表明:Self-consistency方法预测成功率为84.5%,Jackknife方法预测成功率为81.1%。  相似文献   

15.
对颜氏大疣蛛Macrothele yani蛛毒所富含的多肽与蛋白质多样性进行探索,采用十二烷基硫酸钠-聚丙烯酰胺凝胶电泳和超高效液相色谱-电喷雾-四极杆-飞行时间质谱技术分离和鉴定颜氏大疣蛛蛛毒中的蛋白质和多肽,并对其相对分子质量分布多样性进行分析。结果显示:粗毒中所含蛋白质的相对分子质量主要分布在35kDa以上。在17~135kDa分离度较佳的共有11条电泳条带,主要集中于40~120kDa附近;在75kDa附近弥散着高丰度的蛋白条带,75kDa以上的蛋白质最丰富。粗毒经色谱分离后得到超过50个色谱峰,经质谱鉴定得到121个物质成分,其中,多肽类物质的相对分子质量呈双峰式分布,21%分布在500~2000 Da,76%分布在3000~5000Da,为粗毒中多肽含量最丰富的部分,且集中于35~60min的保留时间内被洗脱。研究结果表明,颜氏大疣蛛蛛毒中含有较为丰富的多肽和蛋白类物质,这些物质的相对分子质量分布特征与已报道的其他蜘蛛既有相似性又存在具体差异。本文展示了颜氏大疣蛛蛛毒的分子多样性,为后续该毒素的物质基础研究及药用价值开发提供参考。  相似文献   

16.
DNA甲基化作为直接作用于DNA序列的一种表观遗传修饰,能够在不改变DNA分子一级结构的情况下影响基因表达,在生命活动中扮演着重要的角色.在哺乳动物中,DNA甲基化主要发生在C_pG二核苷酸的胞嘧啶上,并且在基因组中呈现不均匀分布.准确预测DNA甲基化位点有助于阐明DNA甲基化对基因表达的调控作用,并为肿瘤的早期诊断及治疗提供新的依据.本文应用离散增量结合二次判别分析的方法,对人类的C_pG二核苷酸甲基化状态进行了识别.5折交叉检验的整体准确率超过了80%,受试者操作特性曲线面积也达到了0.86.与现有方法相比,预测成功率显著提高.这说明离散增量结合二次判别分析方法适用于甲基化位点的预测;基因组序列中甲基化位点具有序列依赖性.  相似文献   

17.
海南植物区系的多样性   总被引:6,自引:0,他引:6  
张宏达 《生态科学》2001,20(1):1-10
记载海南维管束植物的多样性,表明蕨类植物区系已有古生代和中生代的孑遗,又有白垩纪以来的现代蕨类,它们都存在着许多特有种;裸子植物则以泛热带成分及华夏成分为主;有花植物包括全球植物区系8个植物区的成分,而以热带成分全球性分布成分最多。最后,文章分析了海南植物区系多样性的地史背景及自然条件的因素。  相似文献   

18.
利用分散量的数学理论,提出了基于最小分散增量的蛋白质序列辨识方法.通过多种特征联合对蛋白质序列进行编码,并建立基于最小分散增量的分类器MID_OMP,应用于革兰氏阴性细菌外膜蛋白序列辨识.在数据集上的Jackknife测试中,MID_OMP辨识外膜蛋白和α螺旋跨膜蛋白的准确率达到95.7%,辨识外膜蛋白和球状蛋白的准确率达到91.0%;在14个细菌基因组内挖掘结果显示,MID_OMP具有较高的敏感性和特异性,预测结果的可信度明显优于另外一种OMPs挖掘工具TMBETA-GENOME.  相似文献   

19.
海南植物区系的多样性   总被引:13,自引:2,他引:13  
张宏达 《生态科学》2001,20(Z1):1-10
记载海南维管束植物的多样性,表明蕨类植物区系已有古生代和中生代的孑遗,又有白垩纪以来的现代蕨类,它们都存在着许多特有种;裸子植物则以泛热带成分及华夏成分为主;有花植物包括全球植物区系8个植物区的成分,而以热带成分及全球性分布成分最多。最后,文章分析了海南植物区系多样性的地史背景及自然条件的因素。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号