期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

万晓耕《生物信息学》2021,19(1):35-46

蛋白质的序列、结构和功能多种多样.大量研究表明蛋白质的结构与其氨基酸序列的排序有关,并且局部的氨基酸序列环境对蛋白质的结构具有一定的影响.本文提出一种新的基于5-mer氨基酸扭转角统计偏好的蛋白质结构类型预测方法,在该方法通过PDB数据库中5-mer中间氨基酸的扭转角统计偏好来进行结构类型的预测.新方法可以通过计算机仿... 相似文献

2.

人TEAD1蛋白质的生物信息学分析

《生物技术》2016,(3)

[目的]采用生物信息学方法对人TEAD1蛋白质的理化性质、跨膜区域、亲疏水性、信号肽区域、二级结构、三级结构、蛋白质之间的相互作用、GO注释进行预测分析。[方法]使用多种分析软件对TEAD1蛋白质进行预测分析。[结果]TEAD1蛋白质由426个氨基酸组成,等电点为8.33,在哺乳动物中高度保守;二级结构预测发现6个α螺旋和10个β折叠片层,三级结构预测结果的可靠性为100%,拉曼图分析表明预测结构稳定;与TEAD1相互作用的蛋白质主要是核内转录调控蛋白质,并可参与Hippo信号通路。[结论]TEAD1一种存在核定位序列、无跨膜结构的亲水不稳定蛋白质,具有转录调控因子的作用,可通过Hippo信号通路,表现出促癌作用。相似文献

3.

蛋白质二级结构预测: 基于词条的最大熵马尔科夫方法

董启文王晓龙林磊关毅赵健《中国科学C辑》2005,35(1):87-96

提出了一种新的蛋白质二级结构预测方法. 该方法从氨基酸序列中提取出和自然语言中的“词”类似的与物种相关的蛋白质二级结构词条, 这些词条形成了蛋白质二级结构词典, 该词典描述了氨基酸序列和蛋白质二级结构之间的关系. 预测蛋白质二级结构的过程和自然语言中的分词和词性标注一体化的过程类似. 该方法把词条序列看成是马尔科夫链, 通过Viterbi算法搜索每个词条被标注为某种二级结构类型的最大概率, 其中使用词网格描述分词的结果, 使用最大熵马尔科夫模型计算词条的二级结构概率. 蛋白质二级结构预测的结果是最优的分词所对应的二级结构类型. 在4个物种的蛋白质序列上对这种方法进行测试, 并和PHD方法进行比较. 试验结果显示, 这种方法的Q3准确率比PHD方法高3.9%, SOV准确率比PHD方法高4.6%. 结合BLAST搜索的局部相似的序列可以进一步提高预测的准确率. 在50个CASP5目标蛋白质序列上进行测试的结果是: Q3准确率为78.9%, SOV准确率为77.1%. 基于这种方法建立了一个蛋白质二级结构预测的服务器, 可以通过http://www.insun.hit.edu.cn:81/demos/biology/index.html来访问. 相似文献

4.

使用伪氨基酸组成和模糊支持向量机预测蛋白质结构类

姜小莹朱俊东李晓波张同亮《生物物理学报》2008,24(1):43-48

蛋白质结构类预测是生物信息和蛋白质科学中重要的研究领域.基于Chou提出的伪氨基酸离散模型框架,从蛋白质序列出发,设计一种新的伪氨基酸组成方法表示蛋白质序列样本.抽取氨基酸组合(10-D)在序列中出现的频率和疏水氨基酸模式(6-D)表示蛋白质序列的附加特征,用和传统的氨基酸组成(20-D)一起构成的36维的伪氨基酸组成向量来表示蛋白质序列的特征.使用遗传算法来优化附加特征的权重系数.伪氨基酸组成向量作为输入数据,模糊支持向量机作为预测工具.使用三个常用的标准数据集来验证算法的性能.Jack-knife检验结果说明本方法具有较高的准确率,有望成为潜在的预测蛋白质功能的工具. 相似文献

5.

嗜酸氧化亚铁硫杆菌基因组分泌蛋白的初步分析 总被引：1，自引：0，他引：1

赵文杰曾嘉柳建设邱冠周《现代生物医学进展》2008,8(1):22-26

利用信号肽预测软件SignalP v3.0、跨膜螺旋结构预测软件TMHMM v2.0和非经典分泌蛋白预测软件SecretomeP对嗜酸氧化亚铁硫杆菌全基因组的3 218个氨基酸序列进行预测分析.结果表明在嗜酸氧化亚铁硫杆菌中有507个蛋白为分泌蛋白,其中分泌型信号肽120个(其中有9个为RR-motif亚组型信号肽),脂蛋白信号肽3个,Prepilin-like信号肽4个,非经典分泌蛋白380个.并对分泌型信号肽的长度分布、氨基酸使用频率和酶切位点的氨基酸使用频率作了统计.得分最高的100个非经典分泌蛋白中,有36个具有功能分类,主要是参与细胞壁、能量代谢及转运和结合的蛋白质.嗜酸氧化亚铁硫杆菌的这507个分泌蛋白所参与的生化过程可能发生在膜外的周质空间或是菌体外的场所,为该物种与矿物相互作用,以及对环境做出响应服务. 相似文献

6.

SARS-CoV(BJ01)基因预测及功能推测 总被引：1，自引：1，他引：1

陈廷贵吴松锋万平杜春娟荔建琦李栋魏广智李滨王中胜薛晓芳朱云平贺福初《遗传学报》2003,30(8):773-780

通过对有关SARS—Cov文献的调研,指出了有关基因预测和功能研究的不足。为制备有效的药物和疫苗,对SARS—CoV(BJ01)重新进行了基因预测和功能推测。比较12种基因预测方法对冠状病毒属中已知基因的预测优劣,选用Heuristic models、Gene Identification、ZCURVE—CoV和ORF FINDER4种较好的方法来预测基因,然后运用AT—Gpr分析第一起始密码子的可能性及是否符合Kozak规则,同时搜索转录调控序列,以提高基因预测的准确性。共预测出34个ORF,排除NCBI及有关文献中完全相同或有微弱差别的13个,得到21个大于50个氨基酸的可能新基因。对于预测出的蛋白质,运用ProtParam分析它们的物理化学特征,用SignaIP分析蛋白是否有信号肽,用BLAST、FASTA分析是否有相似序列,用TMPred、TMHMM、PFAM和HMMTOP分析结构域或模体,以提高基因功能推测的可靠性。根据4种基因预测方法使用情况、与其他冠状病毒属已知基因匹配分值、匹配预期值、已知基因与预测基因长度差别,将21个可能的新基因按出现可能性分为4类。同时对结果进行了讨论。相似文献

7.

绵羊肌球蛋白轻链2基因的分子克隆与表达分析

张春兰王建民王桂芝《中国生物化学与分子生物学报》2016,32(12):1347-1353

肌球蛋白轻链2蛋白是哺乳动物肌球蛋白的重要成员之一。获得其基因序列,并对其特征和表达进行分析,可为进一步研究功能奠定基础。本研究以小尾寒羊背最长肌为试验材料,采用RACE等方法对绵羊肌球蛋白轻链2基因的cDNA序列进行克隆和测序、利用相关生物学软件对所得cDNA序列进行生物信息学预测、并利用qRT-PCR和Western印迹法对其在绵羊各种组织中的表达进行分析。结果获得该基因cDNA序列全长为776 bp,提交至GenBank中获得相应的登录号为KJ710702;该序列中的498 bp的开放读码框编码含有166个氨基酸残基的蛋白质。预测发现该蛋白质无信号肽和二硫键,但存在N-糖基化和磷酸化位点;二级结构中以α-螺旋为主;蛋白质序列比较发现绵羊MYL2与小鼠、人、大鼠、猪、牛等哺乳动物的同源性均在95%以上。mRNA和蛋白质表达谱均显示该基因在绵羊心肌中表达量最高,其次为背最长肌。相似文献

8.

信号肽序列对毕赤酵母表达外源蛋白质的影响 总被引：24，自引：0，他引：24

熊爱生彭日荷等《Acta biochimica et biophysica Sinica》2003,35(2):154-160

乙醇氧化酶启动子被分离、克隆 ,并建立了转化方法后 ,毕赤酵母已被发展成为一种高效的外源蛋白表达宿主。为了进一步提高外源蛋白质的分泌表达 ,对信号肽序列进行了研究。首先按毕赤酵母的偏爱密码合成了酿酒酵母的α因子信号肽序列MF4I,随后在MF4I信号肽序列的N端分别引入 1～ 10个毕赤酵母Aox1蛋白质的N端氨基酸 ,构成 10种不同的分泌信号肽序列 ,10种不同的分泌信号肽序列被用于植酸酶基因的毕赤酵母分泌表达。以上新的信号肽序列都可使植酸酶的分泌表达量增加 ,而以N端增加A、I、P三个氨基酸的信号肽序列引起的提高最大 ;和野生型的酿酒酵母α因子信号肽序列相比 ,使植酸酶分泌表达量增加 5倍 ,摇瓶中植酸酶的分泌表达量为 90mg/L。此外在MF4I信号肽的引导序列和内切蛋白酶间增加了EEAEAEAEP和K共 10个氨基酸 ,进一步提高信号肽的分泌效率 ,使表达又提高约 35 % ,使得摇瓶中酸性植酸酶的表达量达到 12 0mg/L ,是pPCI9K表达量的 8倍。相似文献

9.

基于多样性指标的分枝杆菌蛋白质亚细胞定位预测

林昊《生物信息学》2009,7(4):252-254

由于蛋白质亚细胞位置与其一级序列存在很强的相关性,利用多样性增量来描述蛋白质之间氨基酸组分和二肽组分的相似程度,采用修正的马氏判别式（这里称为IDQD方法）对分枝杆菌蛋白质的亚细胞位置进行了预测。利用Jackknife检验对不同序列相似度下的蛋白质数据集进行了预测研究,结果显示,当数据集的序列相似度小于等于70％时,算法的预测精度稳定在75％左右。在对整体852条蛋白质的预测成功率达到87．7％,这一结果优于已有算法的预测精度,说明IDQD是一种有效的分枝杆菌蛋白质亚细胞预测方法。相似文献

10.

基于近似熵的伪氨基酸组成预测蛋白质亚核定位

张同亮丁永生顾全孙登宽《生物物理学报》2008,24(3):239-244

了解真核细胞中细胞核内蛋白质的定位情况对于新发现蛋白质的功能注释具有重要意义.随着蛋白质数据库中蛋白质序列数量的急速增加,采用计算方法来预测蛋白质亚核定位已经成为蛋白质科学领域研究的热点.根据Chou提出的伪氨基酸组成离散模型,提出了一种新的蛋白质亚核定位预测方法.计算蛋白质序列的近似熵作为附加特征构建伪氨基酸组成,表示蛋白质序列特征,AdaBoost分类算法作为预测工具.与已报道的亚核定位预测方法的性能相比,这种方法具有更高的准确率. 相似文献