首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
介绍了一种从一级结构预测蛋白质稳定性的方法.Guruprasad,Reedy 和 Pa-ndit 对32种稳定蛋白质和12种不稳定蛋白质进行了统计分析,发现存在这样一些二肽,它们在稳定的和不稳定蛋白质中的出现频率是明显不同的.通过一系列的统计学计算处理,计算出所有400种二肽各自对蛋白质稳定性(或不稳定性)的影响大小,给它们设计了一个二肽不稳定性权值(DIWV).对一个给定的蛋白质,与它的序列长度相一致的这些 DIWV 的加和能帮助区分不稳定蛋白质和稳定蛋白质.这种方法对如何提高蛋白质的稳定性具有一定的指导意义.我们根据 Guruprasad 等人的方法计算了几个已知序列的蛋白质的稳定性指数,并由此推出它们的稳定性.  相似文献   

2.
【目的】 比较嗜压和非嗜压微生物中蛋白质在氨基酸和二肽组成上的差异对嗜压蛋白稳定性机理的了解及在此基础上的定向改造具有重要意义。【方法】利用4种微生物全蛋白质组信息,统计了639对直系同源序列二级结构氨基酸组成及二肽组成并计算其偏差。【结果】结果表明:在β折叠和无规则卷曲中二者差异明显,β折叠中,嗜压蛋白含更多的缬氨酸,异亮氨酸,亮氨酸,更少的精氨酸,赖氨酸,天冬氨酸;无规则卷曲中,嗜压蛋白含更多的缬氨酸和异亮氨酸,更少的甘氨酸和脯氨酸。而嗜压蛋白存在更多的YM、MN、KD、QC、CI、MW、MM、CY、WQ、HC、RC和QH,更少TW、MS、VD、DH、YE、CT、MW、CF、CK、CM、MY、QI、TH、MQ、QQ和MC。【结论】二肽比氨基酸包含更多的结构和序列信息,更有利于了解嗜压蛋白稳定性机制及指导其定向改造。  相似文献   

3.
 本文对蛋白质序列的肽键进行了统计分析,计算了二肽构象参数P_α、P_β、P_c和三肽构象参数Q_α、Q_β、Q_c。在此基础上提出了由氨基酸序列预测二级结构的规则。预测的正确率达90%,优于Chou-Fasman方法。这个结果表明二肽(三肽)关联在形成蛋白质二级结构中具有明显的重要性。  相似文献   

4.
曾征  陈雪伊  于昕 《水生生物学报》2023,(10):1659-1668
基于线粒体基因COI、核基因ITS序列数据,结合成虫、稚虫相互匹配的方法,文章对蜻蜓目广布种长尾黄蟌Ceriagrion fallax Ris和翠胸黄蟌Ceriagrion auranticum Fraser稚虫的尾鳃和上颚这两个传统的形态鉴定特征的稳定性进行了分析,结果显示:(1)长尾黄蟌稚虫尾鳃黑斑的有无、数量、颜色等特征均不稳定,且与种群、性别无关;(2)两种稚虫的上颚齿式特征在同种群内也呈现明显的不稳定性。因此,两种稚虫的尾鳃和上颚特征不稳定,鉴定时应慎用。这暗示蜻蜓目其他物种的形态特征或存在类似的不稳定性。  相似文献   

5.
同义密码子的反常蛋白质二级结构偏好性   总被引:1,自引:0,他引:1  
统计分析了 119种人蛋白质和 92种大肠杆菌蛋白质的mRNA序列和蛋白质二级结构的关系 .从二肽频数出发 ,研究了同义密码子使用对蛋白质二级结构的影响 ,证明其影响在 10 %到 2 0 %的量级 .对于人和大肠杆菌 ,在 90 %置信水平上 ,4 0 0对二肽中分别有 79对和 6 0对 ,在 95 %置信水平上 ,分别有 4 5对和 36对二肽的相应密码子二联体具有不同于氨基酸的反常二级结构偏好性 ,并且这种反常不能归因于随机涨落  相似文献   

6.
林昊 《生物信息学》2009,7(4):252-254
由于蛋白质亚细胞位置与其一级序列存在很强的相关性,利用多样性增量来描述蛋白质之间氨基酸组分和二肽组分的相似程度,采用修正的马氏判别式(这里称为IDQD方法)对分枝杆菌蛋白质的亚细胞位置进行了预测。利用Jackknife检验对不同序列相似度下的蛋白质数据集进行了预测研究,结果显示,当数据集的序列相似度小于等于70%时,算法的预测精度稳定在75%左右。在对整体852条蛋白质的预测成功率达到87.7%,这一结果优于已有算法的预测精度,说明IDQD是一种有效的分枝杆菌蛋白质亚细胞预测方法。  相似文献   

7.
蛋白质序列复杂性简化与非比对序列分析   总被引:1,自引:0,他引:1  
非比对序列分析是最新发展的一种序列分析方法,具有计算效率高并适用于分析低相似性的序列,已成功用于DNA的序列分析中.但是由于蛋白质序列的复杂性,非比对序列分析对于蛋白质序列分析的准确度却不高.用将20种天然氨基酸残基归类的方法,简化了蛋白质序列的复杂性,并运用到对蛋白质的非比对序列分析中,有效地提高了序列分析的准确性.  相似文献   

8.
基于最近邻居算法,从蛋白质一级序列出发,利用蛋白质序列氨基酸组成、二肤组成以及混合组成方法对蛋白质单聚体、二聚体、三聚体、四聚体、五聚体、六聚体和八聚体进行分类研究。结果表明:采用二肽组成编码方法的预洲效果最好,Jackknife检验和独立测试集检验的总体预测精度分别达到90.83%和95.48%,比相同数据集上基于伪氨基酸组成和组分耦合预测的方法提高了12和15个百分点;特别是对于五聚体蛋白,预测精度分别提高了90和50个百分点;说明二肽组成对于蛋白质四级结构分类研究是一种非常有效的特征提取方法。  相似文献   

9.
张堃  赵静静  唐旭清 《生命科学研究》2011,15(2):101-106,124
基于经典HP模型,利用蛋白质序列的矩阵图谱表达法(MGR)及数值刻画的思想提出了一种新的蛋白质序列的比对方法,通过观察蛋白质序列的数值刻画图及计算两蛋白质序列之间的欧氏距离d,对木聚糖酶两家族的蛋白质序列进行了相似性分析.发现被划分为同一木聚糖酶家族的蛋白质序列之间的相似性更大,而且蛋白质序列的相似性程度与分子大小、结构和分子进化相关.  相似文献   

10.
相似性比对预测蛋白质亚细胞区间   总被引:1,自引:0,他引:1  
王雄飞  张梁  薛卫  赵南  徐焕良 《微生物学通报》2016,43(10):2298-2305
【目的】对蛋白质所属的亚细胞区间进行预测,为进一步研究蛋白质的生物学功能提供基础。【方法】以蛋白质序列的氨基酸组成、二肽、伪氨基酸组成作为序列特征,用BLAST比对改进K最近邻分类算法(K-nearest neighbor,KNN)实现蛋白序列所属亚细胞区间预测。【结果】在Jackknife检验下,数据集CH317三种特征的成功率分别为91.5%、91.5%和89.3%,数据集ZD98成功率分别为93.9%、92.9%和89.8%。【结论】BLAST比对改进KNN算法是预测蛋白质亚细胞区间的一种有效方法。  相似文献   

11.
利用支持向量机和蛋白质非稳定性指标预测凋亡蛋白类型   总被引:3,自引:0,他引:3  
黄静  石峰  周怀北 《生物信息学》2005,3(3):121-123
细胞凋亡蛋白对生物体的发育和体内稳定、对人们理解程序细胞凋亡的机制非常重要。根据在细胞中的位置,它们一般分为四种类型。文中利用支持向量机和蛋白质的非稳定性指标对98个细胞凋亡蛋白进行分类,取得了较好的结果。  相似文献   

12.
集成改进KNN算法预测蛋白质亚细胞定位   总被引:1,自引:0,他引:1  
基于Adaboost算法对多个相似性比对K最近邻(K-nearest neighbor,KNN)分类器集成实现蛋白质的亚细胞定位预测。相似性比对KNN算法分别以氨基酸组成、二肽、伪氨基酸组成为蛋白序列特征,在KNN的决策阶段使用Blast比对决定蛋白质的亚细胞定位。在Jackknife检验下,Adaboost集成分类算法提取3种蛋白序列特征,3种特征在数据集CH317和Gram1253的最高预测成功率分别为92.4%和93.1%。结果表明Adaboost集成改进KNN分类预测方法是一种有效的蛋白质亚细胞定位预测方法。  相似文献   

13.
随着以功能基因组学和蛋白质组学为主要研究内容的后基因组时代的来临,人们面对着生物信息的数据呈指数增长,如何通过有效的计算方法由核酸和蛋白质的序列推导出它们的结构和功能,特别是识别DNA序列中编码蛋白质的基因预测问题是迫切需要解决的研究课题之一.本文在CpG岛对研究基因编码的特殊生物意义下,通过三种方法确定CpG岛的位置,并在此基础上,结合一种新的DNA序列字母向量,利用信息熵离散量预测基因序列,提高了识别基因编码的效率,而且计算的时间有显著的减少.  相似文献   

14.
随着全球变暖加剧,北半球高纬度和高海拔地区树木径向生长对气候变化产生了明显的不稳定、非线性分异响应的现象.在西北地区,阿尔泰山不同海拔优势针叶树种对气候因子响应的稳定性也存在不确定性.以阿尔泰山中段的高、中、低海拔西伯利亚落叶松(Larix sibirica)为研究对象,分析了3条树木年轮宽度序列年表的特征以及树木径向...  相似文献   

15.
能够生产有功用的治疗性蛋白的一个重要前提是获得稳定的重组蛋白高表达细胞株,然而筛选一个能够持续稳定表达外源蛋白的重组细胞株是费时费力的过程。有多篇文献报道了重组蛋白细胞株表达的不稳定性。位置效应是高表达细胞株不稳定性的重要因素,克服或利用位置效应是当前获得稳定高表达重组蛋白细胞株的有效途径。为解决外源基因插入的随机性所带来的不可预知的后果,可以事先在CHO细胞基因组中筛选转录热点区域,再通过位点特异性或同源重组的方式,实现外源基因的定点整合。各种调节位置效应的DNA元件陆续被发现,可以利用它们去调控基因表达及增加细胞株的稳定性。  相似文献   

16.
1 前 言稳定性是生物种群、群落与生态系统研究的重要内容之一。稳定性是预测和调控一个系统的基础。棉田生态系统稳定性的研究对于指导棉田生态系统的优化管理 ,对于棉田系统生产力的稳定提高和持续发展具有非常重要的意义。然而 ,生态学的稳定性研究在概念、度量指标 (或称研究方法 )上至今仍未统一[1,2 ],因而研究结果也不一致。Webster等[3]认为 ,生态学家关心的不是生态学的系统是否稳定 ,而是系统有多么稳定 ,即稳定的相对程度 ,并提出了绝对稳定性概念(判断是否稳定 )和相对稳定性概念 (判断相对稳定程度 )。其相对稳定性意…  相似文献   

17.
嗜热蛋白在高温下能保持稳定性和活性,是研究蛋白质热稳定性的理想模型,开发一个蛋白质热稳定性识别的方法将对蛋白质工程和蛋白质的设计很有帮助。目前的研究中,氨基酸的组成及其物化性质一直被认为和蛋白质的热稳定性相关。本研究筛选出可靠的数据集,包括915个嗜热蛋白和793个非嗜热蛋白。利用蛋白质氨基酸的物化性质和氨基酸的组成表征嗜热蛋白,将二肽氨基酸组成整合到9组氨基酸物化性质中使蛋白序列公式化。支持向量机5折叠交叉验证表明:当gap=0时,290个特征产生的精度最高,为92.74%。因此说明对于分析蛋白质的热稳定性,所建立的预测模型将是一个很有效的工具。  相似文献   

18.
研究表明, 多倍体小麦基因组中存在一类低拷贝、染色体专化的DNA序列, 其在多倍体形成时常表现出不稳定性.这类序列被认为在异源多倍体的建立和稳定中起着关键作用.为进一步研究这一问题, 对通过染色体显微切割从普通小麦( Triticum aestivum L.)中分离的5个7B染色体专化DNA序列的特性进行了研究.以这些序列为探针对大量的多倍体小麦和它们的二倍体祖先物种进行了Southern杂交分析.结果表明, 这些序列可被分为两种类型:其中的4个序列与所有的多倍体物种均杂交, 但是在二倍体水平上, 它们却只与和多倍体小麦B基因组紧密相关的物种杂交, 这说明这些序列是在二倍体物种分化以后产生的,然后垂直传递给多倍体; 其中的1个序列与所有的二倍体及多倍体物种均杂交, 暗示在多倍体形成后这些序列从A和D基因组中消除了. 用这一序列分别与一个人工合成的六倍体和四倍体小麦进行Southern杂交的结果表明, 序列消除是一个迅速的事件而且很可能与这些序列的甲基化状态有关. 认为这些低拷贝的染色体专化序列对于多倍体形成后部分同源染色体之间的进一步分化起着重要作用.  相似文献   

19.
基于氨基酸组成分布的蛋白质同源寡聚体分类研究   总被引:7,自引:0,他引:7  
基于一种新的特征提取方法——氨基酸组成分布,使用支持向量机作为成员分类器,采用“一对一”的多类分类策略,从蛋白质一级序列对四类同源寡聚体进行分类研究。结果表明,在10-CV检验下,基于氨基酸组成分布,其总分类精度和精度指数分别达到了86.22%和67.12%,比基于氨基酸组成成分的传统特征提取方法分别提高了5.74和10.03个百分点,比二肽组成成分特征提取方法分别提高了3.12和5.63个百分点,说明氨基酸组成分布对于蛋白质同源寡聚体分类是一种非常有效的特征提取方法;将氨基酸组成分布和蛋白质序列长度特征组合,其总分类精度和精度指数分别达到了86.35%和67.23%,说明蛋白质序列长度特征含有一定的空间结构信息。  相似文献   

20.
定点突变后蛋白质稳定性的增加还是降低,是分子生物学和蛋白质工程的核心问题之一,也是目前生物信息学研究的重要领域。基于蛋白质序列信息对蛋白质定点突变后的稳定性进行预测的方法,因其简易、适用面广而得到广泛的研究应用。通过对编码策略(coding schemes)的探索,发现不同编码策略对预测准确率有较大影响,并发现基于进化信息的BLOSUM打分矩阵可以用于蛋白质定点突变稳定性预测,具有较高的预测准确率。应用基于BLOSUM62打分矩阵的神经网络(ANN)和支持向量机(SVM)算法,可以改进蛋白质定点突变后稳定性的预测,而且ANN+ BLOSUM62在1623条序列的数据集上的实测结果优于目前国际通用的几款预测 软件。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号