共查询到20条相似文献,搜索用时 46 毫秒
1.
蛋白质序列复杂性简化与非比对序列分析 总被引:1,自引:0,他引:1
非比对序列分析是最新发展的一种序列分析方法,具有计算效率高并适用于分析低相似性的序列,已成功用于DNA的序列分析中.但是由于蛋白质序列的复杂性,非比对序列分析对于蛋白质序列分析的准确度却不高.用将20种天然氨基酸残基归类的方法,简化了蛋白质序列的复杂性,并运用到对蛋白质的非比对序列分析中,有效地提高了序列分析的准确性. 相似文献
2.
构建基于折叠核心的全α类蛋白取代矩阵 总被引:1,自引:0,他引:1
氨基酸残基取代矩阵是影响多序列比对效果的重要因素,现有的取代矩阵对低相似序列的比对性能较低.在已有的 BLOSUM 取代矩阵算法基础上,定义了基于蛋白质折叠核心结构的序列 结构数据块;提出一种新的基于全α类蛋白质折叠核心结构的氨基酸残基取代矩阵——TOPSSUM25,用于提高低相似度序列的比对效果.将矩阵TOPSSUM25导入多序列比对程序,对相似性小于25%的一组四螺旋束序列 结构数据块的测试结果表明,基于 TOPSSUM25的多序列比对效果明显优于BLOSUM30矩阵;基于一个BAliBASE子集的比对检验也进一步表明, TOPSSUM25在全α类蛋白质的两两序列比对上优于BLOSUM30矩阵.研究结果可为进一步的阐明低同源蛋白质序列 结构 功能关系提供帮助. 相似文献
3.
通过研究神经网络权值矩阵的算法,挖掘蛋白质二级结构与氨基酸序列间的内在规律,提高一级序列预测二级结构的准确度。神经网络方法在特征分类方面具有良好表现,经过学习训练后的神经元连接权值矩阵包含样本的内在特征和规律。研究使用神经网络权值矩阵打分预测;采用错位比对方法寻找敏感的氨基酸邻域;分析测试集在不同加窗长度下的共性表现。实验表明,在滑动窗口长度L=7时,预测性能变化显著;邻域位置P=4的氨基酸残基对预测性能有加强作用。该研究方法为基于局部序列特征的蛋白质二级结构预测提供了新的算法设计。 相似文献
4.
5.
用离散量的方法识别蛋白质的超二级结构 总被引:1,自引:0,他引:1
用离散量的方法,对2208个分辨率在2.5I以上的高精度的蛋白质结构中四类超二级结构进行了识别。从蛋白质一级序列出发,以氨基酸(20种氨基酸加一个空位)和其紧邻关联共同为参数,当序列模式固定长取8个氨基酸残基时,对“822”序列模式3交叉检验的平均预测精度达到78.1%,jack-knife检验的平均预测精度达到76.7%;当序列模式固定长取10个氨基酸残基时,对“1041”序列模式3交叉检验的平均预测精度达到83.1%,jack-knife检验的平均预测精度达到79.8%。 相似文献
6.
详细考察了基于HNP(H:hydtophobic,N:neutral,P:hydrophilic)模型及相对熵的蛋白质设计方法对于不同结构类型蛋白质的适用性,并与基于HP模型的结果进行了比较.通过对190个4种不同结构类型的蛋白质进行预测,结果表明,基于HNP模型及相对熵的设计方法对于不同结构类型的蛋白质具有普适性.进一步的研究发现,对于α螺旋、β折叠等规则的二级结构,该方法的预测成功率高于无规卷曲结构预测成功率.另外,还比较了对不同氨基酸的预测差异,结果显示亲水残基的预测成功率较高.此外,研究表明该方法对于蛋白质保守残基的预测成功率高于非保守残基.在以上分析的基础上,进一步讨论了导致这些差异的原因.这些研究为基于相对熵的蛋白质设计方法的实际应用和进一步的发展打下了良好基础. 相似文献
7.
研究不同耐药细菌AcrAB-Tolc型外排泵中关键蛋白AcrA的序列,针对其保守及非保守氨基酸残基进行该类蛋白的进化分析,构建蛋白进化树。收集来源于不同细菌的已知序列的AcrA蛋白,去除冗余并进行序列比对之后,根据其序列比对结果的相似性、氨基酸残基的保守性研究其进化特征。结果表明,不同细菌的AcrA蛋白部分氨基酸残基具有高度的保守性,这与其实现生物学功能有关,非保守区域是主要的进化区域。可为不同菌株的进化提供参考,同时为以AcrAB-Tolc型外排泵为靶标的新药研究提供相关数据。 相似文献
8.
9.
《生物技术世界》2015,(6)
本文运用了生物信息学方法对在水稻中与拟南芥CYP704B1同源序列的查找及对该条序列进行核酸一级结构和其表达产物的一级结构、二级结构以及三级结构进行初步分析。通过分析我们得出,该条序列长度为1903bp,有多种酶的限制性酶切位点,与其Sorghum bicolor hypothetical protein基因相似性很高,本条序列共编码506个氨基酸。预测的相对分子质量为58164.91ku,理论的PI为8.56。氨基酸总体来说疏水性不强,属于亲水性氨基酸。有22个磷酸化位点。该蛋白质有信号肽,有一个跨膜区,该氨基酸序列二级结构的分析结果显示,a螺旋占52.96%;延伸链占11.26%,无规卷曲所占的比例为35.77%,并且分布不连续。该序列编码的蛋白质含有一个跨膜结构域并且重叠了一个低度复杂结构域。通过Swiss Model全自动模式对该蛋白三级结构预测与分析,该蛋白最佳匹配的模板是3mzs.1.A.最佳比对区域位于其该蛋白序列的第28-506位氨基酸残基,序列一致性达21.19%,GMQE值为0.55。通过对其系统发生树的建立,由两种方法N-J法和M-P法构建的系统树,可以看出该同源序列与Aegilops tauschii节节麦和Zea mays玉米同源相似性较近。 相似文献
10.
11.
核酸序列中包含一定的蛋白质结构信息。根据通常情况下遗传密码表中密码子中间位的碱基配对时产生的氢键数目,尝试将20种氨基酸划分为两类,并用自编的计算机软件对蛋白质二级结构数据库中两类氨基酸的类聚现象进行了统计分析。结果表明,使用这种方法对氨基酸进行划分后,氨基酸残基具有较大概率与划入同一类的氨基酸残基相邻出现,并且这种聚集体对二级结构具有一定的偏好性。最后按照该方法设计了一段氨基酸序列并给出了预测服务器预测得到的结构。 相似文献
12.
核酸序列中包含一定的蛋白质结构信息。根据通常情况下遗传密码表中密码子中间位的碱基配对时产生的氢键数目,尝试将20种氨基酸划分为两类,并用自编的计算机软件对蛋白质二级结构数据库中两类氨基酸的类聚现象进行了统计分析。结果表明,使用这种方法对氨基酸进行划分后,氨基酸残基具有较大概率与划入同一类的氨基酸残基相邻出现,并且这种聚集体对二级结构具有一定的偏好性。最后按照该方法设计了一段氨基酸序列并给出了预测服务器预测得到的结构。 相似文献
13.
SARS冠状病毒全基因组序列初步分析 总被引:4,自引:0,他引:4
对已经完成全序列测定的12个SARS病毒基因组进行了多序列比对,发现序列主体部分29708 b具有99.82%的相同碱基,除2个序列各有5个和6个碱基的缺失外,其余部分共有42个位点核苷酸碱基的差异,其中28个位点的碱基差异可引起氨基酸残基改变。利用蛋白质二级结构和跨膜螺旋预测以及蛋白质定位等生物信息学工具,分析了这些产生氨基酸改变部位的蛋白质构像,推测了可能产生的结构和功能改变,为进一步生物学实验提供参考。所有分析结果同时在北京大学生物信息中心抗SARS网站(antisars.cbi.pku.edu.cn)上发布。 相似文献
14.
提出了一种新的蛋白质二级结构预测方法. 该方法从氨基酸序列中提取出和自然语言中的“词”类似的与物种相关的蛋白质二级结构词条, 这些词条形成了蛋白质二级结构词典, 该词典描述了氨基酸序列和蛋白质二级结构之间的关系. 预测蛋白质二级结构的过程和自然语言中的分词和词性标注一体化的过程类似. 该方法把词条序列看成是马尔科夫链, 通过Viterbi算法搜索每个词条被标注为某种二级结构类型的最大概率, 其中使用词网格描述分词的结果, 使用最大熵马尔科夫模型计算词条的二级结构概率. 蛋白质二级结构预测的结果是最优的分词所对应的二级结构类型. 在4个物种的蛋白质序列上对这种方法进行测试, 并和PHD方法进行比较. 试验结果显示, 这种方法的Q3准确率比PHD方法高3.9%, SOV准确率比PHD方法高4.6%. 结合BLAST搜索的局部相似的序列可以进一步提高预测的准确率. 在50个CASP5目标蛋白质序列上进行测试的结果是: Q3准确率为78.9%, SOV准确率为77.1%. 基于这种方法建立了一个蛋白质二级结构预测的服务器, 可以通过http://www.insun.hit.edu.cn:81/demos/biology/index.html来访问. 相似文献
15.
本文对固有无序蛋白(IDPs)与其他蛋白质相互作用位点残基特征进行了研究.首先在数据库中选出满足条件的109条IDPs蛋白质链及与其他配体蛋白形成的299个IDPs-蛋白质复合物,然后提取复合物中作为相互作用位点的IDPs-蛋白质残基.这109条IDPs链中共含有50 031个氨基酸残基,其中处于作用位点的残基有4 822个.通过分析发现,20种氨基酸在形成IDPs-蛋白质相互作用位点残基时具有不同的倾向性,根据形成作用位点残基的倾向性,20种氨基酸可分成三大类:倾向型氨基酸(ILE、LEU、ARG、PHE、TYR、MET、TRP)、中间型氨基酸(GLN、GLU、THR、LYS、VAL、ASP、HIS)、非倾向型氨基酸(PRO、SER、GLY、ALA、ASN、CYS).研究结果还进一步表明,不同氨基酸在有序区域与无序区域形成IDPs-蛋白质作用位点残基的倾向性不同.其中,氨基酸TRP、LEU、ILE、CYS在有序和无序区域形成作用位点残基的差异性尤为明显,而氨基酸GLU、PHE、HIS、ALA则基本没有多大差别.对IDPs-蛋白质相互作用位点残基理化特征进行分析发现:疏水性强、侧链净电荷量较少、极性较小、溶剂可及性表面积较大、侧链体积较大、极化率较大的氨基酸比较倾向于形成作用位点残基.主成分分析结果显示,残基的极化率、侧链体积和溶剂可及表面积对作用位点残基影响最大. 相似文献
16.
17.
《生命科学研究》2016,(5):395-400
基于已构建的千里光全长c DNA文库,克隆其脂肪醛脱羰基酶基因(Gen Bank No.:KT895253),并进一步分析该基因所编码蛋白质(CER1蛋白)的氨基酸保守基元序列(conserved sequence motif,CSM)和蛋白质功能结构域的关系。蛋白质一级结构分析发现,千里光CER1蛋白由623个氨基酸残基组成;进化树和序列比对结果提示SH-片段和LH-片段这两个富含His的保守基元序列在不同物种中表现出高度保守性;3-D结构预测结果表明,高等植物CER1蛋白水合状态下具有高效的底物结合能力和脂肪醛脱羰基的催化效率。因此,根据脂肪醛脱羰基酶氨基酸保守基序对蛋白质功能域的决定作用,推测CER1蛋白的保守结构域是形成底物结合部位和酶催化活性中心的结构基础。 相似文献
18.
蛋白质的序列、结构和功能多种多样.大量研究表明蛋白质的结构与其氨基酸序列的排序有关,并且局部的氨基酸序列环境对蛋白质的结构具有一定的影响.本文提出一种新的基于5-mer氨基酸扭转角统计偏好的蛋白质结构类型预测方法,在该方法通过PDB数据库中5-mer中间氨基酸的扭转角统计偏好来进行结构类型的预测.新方法可以通过计算机仿... 相似文献
19.
氨基酸残基可及性与蛋白质家族成员结构的保守性 总被引:1,自引:1,他引:0
本文在细胞色素c族蛋白和免疫球蛋白家族中一些蛋白质片段的序列比较和分析的基础上,通过计算其氨基酸残基的可及性,对残基可及性与蛋白质序列及其三维结构的保守性之间的关系进行了分析和探讨。结果表明,序列中凡是保守的残基,其可及性都较低,而且这些低可及性的保守性残基与维持蛋白质特有的三维结构相关。作者认为,同一家族的蛋白质中,在进化上相距较远的各成员之间,结构的保守性主要是体现在其三维结构上;序列中的保守 相似文献
20.
信号肽预测是蛋白质功能预测中最重要的问题之一。为了避免使用滑动窗口造成的样本不平衡等问题,序列比对方法被有效地运用到了信号肽预测中。考虑到信号肽是蛋白质序列局部片段所体现的生物特性,本文提出一种局部序列匹配相似度的方法来预测信号肽,在采用氨基酸相对疏水性编码方案的基础上,搜索蛋白质局部匹配子序列,根据替换矩阵BLOSUM62来度量两个蛋白质的相似性,最后采用k最近邻思想进行分类。在目前广泛使用的SwissProt数据集上进行实验,结果表明该方法具有一定的高预测率。 相似文献