首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
基于蛋白质-DNA复合物晶体结构的DNA结构动力学特性研究   总被引:1,自引:0,他引:1  
依据最新NDB数据库中蛋白质-DNA复合物晶体结构数据,考虑DNA结构的序列依赖特性,对10个二联体和36个约化的四联体计算了DNA动力学结构模型中的关键参数——力常数矩阵,矩阵中的非对角项反映了结构参数间的关联。利用改进的DNA结构动力学模型,可以方便地计算给定序列的结构动力学特性。  相似文献   

2.
有关蛋白质功能的研究是解析生命奥秘的基础,机器学习技术在该领域已有广泛应用。利用支持向量机(support vectormachine,SVM)方法,构建一个预测蛋白质功能位点的通用平台。该平台先提取非同源蛋白质序列,再对这些序列进行特征编码(包括序列的基本信息、物化特征、结构信息及序列保守性特征等),以编码好的样本作为训练数据,利用SVM进行训练,得到敏感性、特异性、Matthew相关系数、准确率及ROC曲线等评价指标,反复测试,得到评价指标最优的SVM模型后,便可以用来预测蛋白质序列上的功能位点。该平台除了应用在预测蛋白质功能位点之外,还可以应用于疾病相关单核苷酸多态性(SNP)预测分析、预测蛋白质结构域分析、生物分子间的相互作用等。  相似文献   

3.
蛋白质的序列、结构和功能多种多样.大量研究表明蛋白质的结构与其氨基酸序列的排序有关,并且局部的氨基酸序列环境对蛋白质的结构具有一定的影响.本文提出一种新的基于5-mer氨基酸扭转角统计偏好的蛋白质结构类型预测方法,在该方法通过PDB数据库中5-mer中间氨基酸的扭转角统计偏好来进行结构类型的预测.新方法可以通过计算机仿...  相似文献   

4.
蛋白质结构型的识别方法   总被引:2,自引:0,他引:2  
给出了α型、β型、α/β型、多域型蛋白质二级结构主序列六联体的分布规律.提出了根据蛋白质二级结构主序列对蛋白质结构型进行识别(分类)的方法.以蛋白质二级结构主序列三联体为参数,利用Mahalanobis距离方法对上述4种结构型的蛋白质进行识别,分类的总体准确率为81%;以二级结构主序列中六联体的频数构成蛋白质结构的多样性源,利用多样性增量极小化对上述4种结构型进行识别,分类的总体准确率为83%. 同时也给出了对紧结构域的识别途径.  相似文献   

5.
SARS冠状病毒全基因组序列初步分析   总被引:4,自引:0,他引:4  
对已经完成全序列测定的12个SARS病毒基因组进行了多序列比对,发现序列主体部分29708 b具有99.82%的相同碱基,除2个序列各有5个和6个碱基的缺失外,其余部分共有42个位点核苷酸碱基的差异,其中28个位点的碱基差异可引起氨基酸残基改变。利用蛋白质二级结构和跨膜螺旋预测以及蛋白质定位等生物信息学工具,分析了这些产生氨基酸改变部位的蛋白质构像,推测了可能产生的结构和功能改变,为进一步生物学实验提供参考。所有分析结果同时在北京大学生物信息中心抗SARS网站(antisars.cbi.pku.edu.cn)上发布。  相似文献   

6.
利用复杂网络的方法来探索序列特征因素对蛋白质结构的影响。由于蛋白质的序列对结构具有重要且复杂的影响,因此将蛋白质的结构以及序列特征之间的关系模拟成一个复杂系统,通过利用互相关系数、标准化互信息和传递熵等方法来建立以序列特征为节点的加权网络,进而利用网络中心性的方法来分析不同蛋白质结构类型对应加权网络的中心性分布的差异,探索不同结构类型蛋白质的序列特征差异。发现不同的蛋白质结构类型对应的序列特征网络既有共性又有差异,文章将针对每一种结构类型的网络中心性分布,以及不同结构类型之间的共性与差异进行详细地讨论。研究结果对蛋白质序列与结构之间关系的研究,特别是结构分类研究具有重要的意义。  相似文献   

7.
蛋白质折叠速率的正确预测对理解蛋白质的折叠机理非常重要。本文从伪氨基酸组成的方法出发,提出利用序列疏水值震荡的方法来提取蛋白质氨基酸的序列顺序信息,建立线性回归模型进行折叠速率预测。该方法不需要蛋白质的任何二级结构、三级结构信息或结构类信息,可直接从序列对蛋白质折叠速率进行预测。对含有62个蛋白质的数据集,经过Jack.knife交互检验验证,相关系数达到0.804,表示折叠速率预测值与实验值有很好的相关性,说明了氨基酸序列信息对蛋白质折叠速率影响重要。同其他方法相比,本文的方法具有计算简单,输入参数少等特点。  相似文献   

8.
本文介绍了计算机在核酸和蛋白质一级结构序列分析上的一些应用,包括序列的收集和贮存,两个或多个序列之间同源性的比较,用限制性内切酶找出酶切位点,找出DNA序列的开放式密码解读链和蛋白质序列倒翻成DMA序列的可能结果以及DNA和蛋白质序列的建立和应用等。  相似文献   

9.
运用计算机进行核酸和蛋白质的序列分析是分子生物学研究的一个较新发展,这项技术已越来越多地用于研究大量积累的序列数据。蛋白质功能区是蛋白质分子中能独立折叠成具有一定结构并执行特定功能的结构域,所有具有同一类功能区的分子统称为一个蛋白质的超族(protein superfamily)。本文通过对免疫球蛋白(Ig)超族及其功能区序列所进行的分析,建立了一种根据功能区之保守片段残基组成的模式匹配分析检索蛋白质功能区的方法,它先根据多序列的对准比较确定某一类功能区之保守片段,再对已知的保守片段各位置上氨基酸残基组成进行统计分析,然后根据与统计数值相匹配的方法,计算待检序列残基组成的统计学意义,由此确定功能区的存在。该方法的优点在于它不仅可以检出已知的具有某一类功能区的分子,而且还可能发现新的具有该功能区的分子,从而推测后者的功能。  相似文献   

10.
梁启浩  李阳  唐旭清 《病毒学报》2017,33(3):313-319
基于经典HP模型,本文采用离散傅里叶变换获取蛋白质特征,利用分层聚类方法进行蛋白质序列的结构分析。其目的是将自动信号频谱分析技术与层次聚类方法相结合,并应用到蛋白质序列结构分析中。通过流感病毒HA和NA蛋白质序列的实验结果表明:应用该方法可得到非常好的分类结果。这些研究为基于大数据的蛋白质序列的自动信息提取和结构分析提供基础。  相似文献   

11.
通过现有的序列同源性比较、二级结构预测、三维结构预测和模拟方法,得到了拟南芥中PAP特异磷酸酶的三维结构.这是一种与酵母中的Hal2p蛋白质类似,并且N端为α+β,C端为α/β结构域的多结构域蛋白质.分析预测所得结构,发现了Mg2+等金属离子的结合位点,推测了对Na+敏感的结构基础.这些结合位点与其生化功能相关.而且,通过结构与功能分析,讨论了蛋白质数据库(PDB)中同一个酶已有理论结构的不合理性.  相似文献   

12.
基于小波分析的膜蛋白跨膜区段序列分析和预测   总被引:2,自引:0,他引:2  
膜蛋白是一类结构独特的蛋白质,在各种细胞中普遍存在,发挥着重要的生理功能。目前仅有少数膜蛋白听结构被实验测出,因此用计算机预测膜蛋白的结构是蛋白质结构预测的主要研究内容之一。膜蛋白一般在膜上形成保守的跨膜螺旋结构,序列特征明显,比较适合用预测的方法确定跨膜螺旋区段的位置。国际上已有一些研究者用人工神经网络方法、多序列比对方法和统计方法进行了预测尝试,取得了一定的成功经验。我们对蛋白质序列数据库中的  相似文献   

13.
利用SWISS-PROT网上获取生物信息学资源   总被引:3,自引:0,他引:3  
生物信息学是是采用数学、统计学和计算机方法对生物学数据信息进行采集、存储、传播、分析、归类、解释的科学[1].Internet网络是信息传输、检索、获取、交流的重要手段.当前,在Internet网上可以查询到大量的生物信息学数据库,其中SWISS-PROT蛋白质序列数据库是网上生物信息学最核心的3个数据库之一.通过该数据库,可以较完整地获得生物大分子的序列信息.同时,研究者也可以将测定的序列信息通过该数据库予以认定、发表、交流.本文主要探讨SWISS-PROT蛋白质序列数据库的特点、检索方法及利用Internet获取蛋白质序列信息.  相似文献   

14.
提出了一种新的蛋白质二级结构预测方法. 该方法从氨基酸序列中提取出和自然语言中的“词”类似的与物种相关的蛋白质二级结构词条, 这些词条形成了蛋白质二级结构词典, 该词典描述了氨基酸序列和蛋白质二级结构之间的关系. 预测蛋白质二级结构的过程和自然语言中的分词和词性标注一体化的过程类似. 该方法把词条序列看成是马尔科夫链, 通过Viterbi算法搜索每个词条被标注为某种二级结构类型的最大概率, 其中使用词网格描述分词的结果, 使用最大熵马尔科夫模型计算词条的二级结构概率. 蛋白质二级结构预测的结果是最优的分词所对应的二级结构类型. 在4个物种的蛋白质序列上对这种方法进行测试, 并和PHD方法进行比较. 试验结果显示, 这种方法的Q3准确率比PHD方法高3.9%, SOV准确率比PHD方法高4.6%. 结合BLAST搜索的局部相似的序列可以进一步提高预测的准确率. 在50个CASP5目标蛋白质序列上进行测试的结果是: Q3准确率为78.9%, SOV准确率为77.1%. 基于这种方法建立了一个蛋白质二级结构预测的服务器, 可以通过http://www.insun.hit.edu.cn:81/demos/biology/index.html来访问.  相似文献   

15.
生物信息学是是采用数学、统计学和计算机方法对生物学数据信息进行采集、存储、传播、分析、归类、解释的科学[1] 。Internet网络是信息传输、检索、获取、交流的重要手段。当前 ,在Internet网上可以查询到大量的生物信息学数据库 ,其中SWISS PROT蛋白质序列数据库是网上生物信息学最核心的 3个数据库之一。通过该数据库 ,可以较完整地获得生物大分子的序列信息。同时 ,研究者也可以将测定的序列信息通过该数据库予以认定、发表、交流。本文主要探讨SWISS PROT蛋白质序列数据库的特点、检索方法及利用I…  相似文献   

16.
在蛋白质结构预测的研究中,一个重要的问题就是正确预测二硫键的连接,二硫键的准确预测可以减少蛋白质构像的搜索空间,有利于蛋白质3D结构的预测,本文将预测二硫键的连接问题转化成对连接模式的分类问题,并成功地将支持向量机方法引入到预测工作中。通过对半胱氨酸局域序列连接模式的分类预测,可以由蛋白质的一级结构序列预测该蛋白质的二硫键的连接。结果表明蛋白质的二硫键的连接与半胱氨酸局域序列连接模式有重要联系,应用支持向量机方法对蛋白质结构的二硫键预测取得了良好的结果。  相似文献   

17.
为了研究一级结构对蛋白质耐热性的影响,利用软件DNAMAN对16个家族32种蛋白质序列进行了氨基酸含量分析,并统计分析了氨基酸组成对蛋白质耐热性的影响。通过比较同一家族的高低温蛋白质序列及16个家族中所有高温和低温蛋白质序列中氨基酸含量的变化可以推断(从低温到高温):Ser、Cys.含量降低显著,Arg、Ile、Pro含量升高显著。由此可知高温蛋白质倾向于含有疏水性氨基酸而避免亲水性氨基酸。  相似文献   

18.
基因工程技术已经被广泛应用于抗体的生产。但是由于抗体的分子量较大,导致合成抗体较为困难。蛋白质内含子是前体蛋白质中的一段氨基酸序列,能够将自身剪切出来,并将两端的外显子连接形成成熟的蛋白质。将抗体的Fab(antigen binding fragment)和Fc(crystalline fragment)分别与蛋白质内含子(intein) 的N端(IN)和C端(IC)融合表达,利用蛋白质内含子的剪接功能,可形成完整的抗体分子。KSCDKTH是存在于抗体铰链区(hinge region)的一段氨基酸序列,如果在KSCDKTH序列中筛选到高效剪接的蛋白质内含子,即可通过蛋白质剪接,将抗体分子的Fab和Fc剪接形成完整抗体。本文筛选发现,Ssp DnaX的3种断裂蛋白质内含子(S0, S1, S11)具有在KSCDKTH序列中高效剪接的能力,这一研究结果为抗体的剪接合成提供了可行性。  相似文献   

19.
随着越来越多的蛋白质相互作用数据被公布,网络比对在预测蛋白质的新功能和推测蛋白质网络进化历史上发挥着越来越重要的作用。但是,目前主要的网络比对方法要么忽略蛋白质的同源信息或蛋白质网络的结构信息,要么采用启发式算法。文章作者通过将网络比对转化为线性规划问题给出了一个精确的网络比对算法,并且针对水痘病毒和卡波济(氏)肉瘤病毒的蛋白质相互作用数据进行了比对分析。  相似文献   

20.
陶华  唐旭清 《生物信息学》2012,10(4):269-273,279
基于模糊邻近关系的粒度空间,对蛋白质序列进行聚类结构分析。利用MEGA软件计算选取的木聚糖酶序列间的比对距离,引入内积将其转化为模糊邻近关系(或矩阵),再应用算法求解其粒度空间,进行序列的聚类结构分析和最佳聚类确定研究。这些研究为蛋白质序列提供了定量分析的工具。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号