首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 312 毫秒
1.
根据蛋白质的氨基酸组成实现其快速鉴定   总被引:1,自引:0,他引:1  
常规进行蛋白质鉴定的方法是测定其氨基酸顺序,它需要蛋白质顺序分析仪,对蛋白质的纯度要求高,费时和花费大,与之相比,蛋白质的氨基酸组成和分子量是容易实验测定的。本文描述了一个基于蛋白质的组成和分子量进行其快速鉴定的方法。其基本出发点是,通过统计蛋白质序列数据库中每个序列的氨基酸组成和分子量,得到一个含蛋白质长度、组成和分子量的数据库,将靶蛋白质的组成等数据与该数据库进行对比,可以检出组成和分子量与之接近的蛋白质。从而对该蛋白质进行初步鉴定。在有些情况下,甚至能相当准确地确定靶蛋白质与数据库中的某个(些)蛋白质相关。根据这一原理本文设计了根据氨基酸组成检索蛋白质组成数据库的程序,通过对胰岛素原、细胞肿瘤抗原P53和泛肽等多种蛋白质的组成分析,证实根据氨基酸组成能较好地进行蛋白质鉴定。  相似文献   

2.
对蛋白质质谱数据进行数据库比对和鉴定是蛋白质组学研究技术中的一个重要步骤。由于公共数据库蛋白质数据信息不全,有些蛋白质质谱数据无法得到有效的鉴定。而利用相关物种的EST序列构建专门的质谱数据库则可以增加鉴定未知蛋白的几率。本文介绍了利用EST序列构建Mascot本地数据库的具体方法和步骤,扩展了Mascot检索引擎对蛋白质质谱数据的鉴定范围,从数据库层面提高了对未知蛋白的鉴别几率,为蛋白质组学研究提供了一种较为实用的生物信息学分析技术。  相似文献   

3.
Ps I H(Subunit H of photosystem I)是属于光合系统I亚族的分子量约10 kD的内在膜蛋白,是真核生物特有的3个组成光合系统I的亚基之一,在植物光合作用中起重要作用。从天山雪莲(Sasussured involucrataKar.et Kir)叶片全长cDNA文库中,筛选克隆得到PsaH基因。序列分析表明,该基因的开放阅读框为432 bp,编码143个氨基酸,包括由47个氨基酸组成的转运肽和96个氨基酸组成的成熟PS I H。预测该蛋白质相对分子量为15.04 kD,理论等电点(Theoretical pI)为9.81,存在一个跨膜结构。序列比对表明,SikPsaH编码蛋白与蓖麻(Ricinus communis)、毛果杨(Populus trichocarpa)PsaH基因编码的蛋白质具有83.3%的相似性。系统进化树显示,天山雪莲与石蒜(Lycoris radiata)亲缘关系最近。。  相似文献   

4.
基于最近邻居算法,从蛋白质一级序列出发,利用蛋白质序列氨基酸组成、二肤组成以及混合组成方法对蛋白质单聚体、二聚体、三聚体、四聚体、五聚体、六聚体和八聚体进行分类研究。结果表明:采用二肽组成编码方法的预洲效果最好,Jackknife检验和独立测试集检验的总体预测精度分别达到90.83%和95.48%,比相同数据集上基于伪氨基酸组成和组分耦合预测的方法提高了12和15个百分点;特别是对于五聚体蛋白,预测精度分别提高了90和50个百分点;说明二肽组成对于蛋白质四级结构分类研究是一种非常有效的特征提取方法。  相似文献   

5.
苏云金芽孢杆菌液体培养物上清液中杀虫活性物质的研究   总被引:11,自引:0,他引:11  
采用离心、拄层析、氨基酸组成及序列分析、生物鉴定等方法,对具有杀虫活性的苏云金芽孢杆菌培养物上清液进行了研究。发现上清液中杀虫活性的出现时间与菌的自溶同步。上清液中含有的分子量为60—kDa的蛋白是起杀虫作用的主成分,分离纯化该蛋白质,对其进行了氨基酸组分和N末端序列分析。结果表明,该蛋与P1蛋白在N端有18个氨基酸的序列完全一致,氨基酸的组分相似,说明二者同源。同时还发现,上清液与沉淀混用能提高杀虫活性。  相似文献   

6.
嗜热蛋白在高温下能保持稳定性和活性,是研究蛋白质热稳定性的理想模型,开发一个蛋白质热稳定性识别的方法将对蛋白质工程和蛋白质的设计很有帮助。目前的研究中,氨基酸的组成及其物化性质一直被认为和蛋白质的热稳定性相关。本研究筛选出可靠的数据集,包括915个嗜热蛋白和793个非嗜热蛋白。利用蛋白质氨基酸的物化性质和氨基酸的组成表征嗜热蛋白,将二肽氨基酸组成整合到9组氨基酸物化性质中使蛋白序列公式化。支持向量机5折叠交叉验证表明:当gap=0时,290个特征产生的精度最高,为92.74%。因此说明对于分析蛋白质的热稳定性,所建立的预测模型将是一个很有效的工具。  相似文献   

7.
大麦醇溶蛋白研究概况   总被引:1,自引:0,他引:1  
湛小燕 《遗传》1990,12(6):35-38
本文综合概述了近年来大麦醇溶蛋白(Hordein)的研究情况,涉及醇溶蛋白各组(A,B,C,D)多肤的含量、分子量、等电点,氨基酸组成和序列等生化特性;多肤多态性及形成机制;基因结构、定位及与其他基因(如抗白粉病基因)的连锁关系;进行多肤鉴别的一系列实验方法;蛋白质体和发育中各组醇蛋白多肤的积累和差异;高赖氨酸突变体(如RiSΦ1508, RiSΦ56)基因结构及与醇溶蛋白合成的关系等方面。  相似文献   

8.
柽柳金属硫蛋白基因的克隆及序列分析   总被引:2,自引:0,他引:2  
张艳  杨传平  王玉成 《植物研究》2007,27(3):293-296
用木麻黄(Casuarina glauca)的金属硫蛋白基因(metallothionein 1)氨基酸序列对柽柳ESTs序列本地数据库进行tBlastn检索,获得了柽柳金属硫蛋白基因全长cDNA序列,去除polyA后该基因全长366 bp,其中5′非翻译区97 bp,3′非翻译区59 bp,开放读码框(ORF)长210 bp,编码70 个氨基酸组成的多肽,蛋白分子量为6.793 kD,理论等电点为4.99,含10个Cys,集中分布在肽链的N端和C端。BlastP同源性分析表明该基因与花生同源性最高,与小豆同源性最低。该基因的EST序列在GenBank登录(登录号:CV792539)。  相似文献   

9.
利用SDS-PAGE检测了2份类大麦属(Crithopsis delileana)材料的高分子量谷蛋白亚基组成,并对其中1份材料的x型亚基进行了克隆和测序。结果表明,2份材料具有完全相同的蛋白电泳图谱。在小麦的高分子量区域仅检测到一条蛋白质带,与小麦y型亚基的迁移率接近,但克隆测序表明其为x型高分子量谷蛋白亚基,其编码基因命名为Kx。Kx基因编码区序列长度为2052bp.编码长度为661个氨基酸残基的蛋白质,其序列具有典型的x型高分子量谷蛋白亚基的特征。Kx基因能在原核表达系统内正确表达,其表达蛋白与来源于种子中的Kx亚基的迁移率完全一致。Kx亚基与小麦属A、B和D,山羊草属C和U以及黑麦属R染色体组编码的高分子量谷蛋白亚基氨基酸序列非常相似,但在N和C保守区的氨基酸组成以及重复区长度上与它们存在明显差异。聚类分析可将Kx与Ax1聚类为平行的分支。由此可见,来源于C.delileana的Kx基因为一新的x型高分子量谷蛋白亚基基因。  相似文献   

10.
相似性比对预测蛋白质亚细胞区间   总被引:1,自引:0,他引:1  
王雄飞  张梁  薛卫  赵南  徐焕良 《微生物学通报》2016,43(10):2298-2305
【目的】对蛋白质所属的亚细胞区间进行预测,为进一步研究蛋白质的生物学功能提供基础。【方法】以蛋白质序列的氨基酸组成、二肽、伪氨基酸组成作为序列特征,用BLAST比对改进K最近邻分类算法(K-nearest neighbor,KNN)实现蛋白序列所属亚细胞区间预测。【结果】在Jackknife检验下,数据集CH317三种特征的成功率分别为91.5%、91.5%和89.3%,数据集ZD98成功率分别为93.9%、92.9%和89.8%。【结论】BLAST比对改进KNN算法是预测蛋白质亚细胞区间的一种有效方法。  相似文献   

11.
成人视网膜假定蛋白基因ARHP的克隆及生物信息学分析   总被引:4,自引:0,他引:4  
从UniGene库中选取编号为BG2 2 2 62 4来自人鼻咽组织的表达序列标签 (EST )序列 ,联网到NCBI调用Blast服务器分析 ,发现该EST序列是一个代表新基因的未知序列 .利用Blast检索GenBank的nr数据库和EST数据库 ,构建EST重叠群 ,联网到NCBI的ORFfinder服务器 ,分析发现该EST重叠群具有完整的阅读框架 .分别在cDNA序列阅读框架的起始密码子和终止密码子的两侧设计引物 ,以人胎脑cDNA文库为模板 ,进行PCR扩增 ,测序确定该基因的cDNA全长序列 .该基因cDNA序列全长为 1672bp ,阅读框架位于第 3 0 4~ 1557位之间 ,编码由 417个氨基酸组成 ,分子质量为 46 58ku的蛋白质 ,其理论 pI为 4 2 1.将蛋白质序列通过NCBI的Blast服务器进行序列相似性分析 ,发现该基因编码的蛋白质和成年小鼠视网膜未知蛋白 (BAB3 2 2 14 )同源 .经与国际人类基因组命名委员会协商定名为成人视网膜假定蛋白 (adultretinahypotheticalprotein ,ARHP) ,GenBank登录号为AY174896.生物信息学分析表明 ,该蛋白质可能为一参与转录调控的核蛋白 .ARHP基因定位在染色体 5q3 5,跨越 3 5163bp ,含 4个外显子和 3个内含子 .在基因的 5′非翻译区有 2个CpG岛  相似文献   

12.
采用PCR方法从鮰爱德华菌基因组中扩增出外膜蛋白OmpLC基因,利用生物信息学相关软件和网络数据库,预测该基因编码产物的基本理化性质、亲疏水性、信号肽、跨膜性、二级结构、结构域及基序、以及三级结构,同时构建OmpLC同源基因的系统发育进化树。结果表明:该蛋白由360个氨基酸组成,分子量为39.407 k D,理论等电点为4.98,不稳定系数为18.26,是一种稳定的强亲水性蛋白,有信号肽,成熟蛋白无跨膜螺区。其二级结构中α螺旋、β折叠和无规则卷曲分别占6.67%、45.28%和48.06%,其空间结构为β桶状,属于OM_channels superfamily的gram_neg_porins成员。蛋白质多重序列比对和聚类分析显示,该蛋白序列与OmpLC蛋白(AEQ59632、AEQ59639)具有高度同源性,且在系统发育树上与二者聚为一簇。鮰爱德华菌OmpLC的生物信息学分析不仅为进一步探索该蛋白的功能提供参考资料,也为研究鮰爱德华菌的感染和致病机理,研制相关疫苗提供理论依据。  相似文献   

13.
为获得不易感动脉粥样硬化动物北京鸭卵磷脂胆固醇酰基转移酶 (LCAT)的cDNA和蛋白质序列 ,分析其结构特点 .以从北京鸭肝脏mRNA反转录获得的cDNA一链为模板 ,应用SMART RACE技术 ,获得了北京鸭LCAT的cDNA序列 ,推导出其蛋白质氨基酸序列 ,应用分子生物学软件对该蛋白的一级、二级结构进行分析和比较 .北京鸭LCATcDNA (在GenBank中的注册号为AF32 4 887)全长 195 3bp ,其中开放阅读框架 135 6bp ,编码 4 5 1个氨基酸 ,包括一个由 2 3个氨基酸构成的疏水性信号肽和一个由 4 2 8个氨基酸组成的成熟蛋白 .该成熟蛋白比人LCAT在C端多 12个氨基酸 ,其与鸡、人、家兔的同源性依次为 98%、83%和 82 % .与其它种属LCAT蛋白序列的比较结果表明 ,北京鸭LCAT蛋白质序列虽然在长度上和结构上与其它种属有一定的差异 ,但序列中与酶催化活性相关的序列均非常保守  相似文献   

14.
丝氨酸羟甲基转移酶(SHMT)是植物细胞光合作用和一碳代谢的关键酶之一,研究SHMT基因的序列信息对揭示其蛋白结构与功能具有重要指导意义。从白及转录组数据库中分离得到SHMT基因(NCBI登录号:MG544187),运用生物信息学软件对该基因进行序列分析。结果显示:该基因长度为1 953 bp,编码的蛋白质长度为471aa、分子量为51.861 06 kD、理论等电点为7.17,SHMT二级结构主要由无规则卷曲结构和α螺旋结构组成,核苷酸和氨基酸序列与铁皮石斛SHMT相似性最高,达93%,结构域分析发现该蛋白具有高度保守结构域,三级结构预测为四聚体结构,跨膜区及信号肽分析发现该蛋白无跨膜区及信号肽,亚细胞定位分析发现该蛋白主要位于细胞质、叶绿体亚细胞器位置。本分析结果为白及SHMT的应用研究提供了基础数据,也为植物SHMT基因的分子研究提供了理论依据及基础资料。  相似文献   

15.
为了研究梨小食心虫Grapholita molesta化学感受蛋白(chemosensory proteins, CSPs)在化学感受系统中的作用, 本研究利用RT-PCR和RACE技术克隆到一条梨小食心虫化学感受蛋白的全长cDNA序列, 命名为GmolCSP (GenBank 登录号: JQ821389)。序列分析表明, GmolCSP开放阅读框序列为384 bp, 编码127个氨基酸残基, 预测N末端含有18个氨基酸组成的信号肽序列, 其成熟蛋白的预测分子量为12.80 kD, 等电点为8.33。该基因编码的氨基酸序列与其他鳞翅目昆虫化学感受蛋白的氨基酸序列具有较高同源性。RT-PCR结果显示, GmolCSP在梨小食心虫成虫触角、 去触角的头、 胸、 腹、 足和翅中都有表达。将GmolCSP重组到表达载体pET-32a中, 转入大肠杆菌Escherichia coli BL21(DE3)进行表达。SDS-PAGE和Western 印迹检测结果显示, 梨小食心虫化学感受蛋白基因在大肠杆菌中成功地表达出一个分子量约为29 kD的融合蛋白, 与预测的融合蛋白分子量大小一致。本研究结果为进一步研究该蛋白的分子结构和功能奠定了良好基础。  相似文献   

16.
MYBPC3基因突变是家族性肥厚型心肌病的原因之一。本文对心脏肌球蛋白结合蛋白C基因(cardic myosin binding protein C,MYBPC3)及其编码蛋白(c My BP-C)进行生物信息学分析。运用生物信息学相关数据库和在线生物学软件分析MYBPC3基因的结构与突变位点,对c My BP-C蛋白分子物种间的序列同源性、蛋白质空间结构、理化性质、组织特异性、蛋白质翻译后修饰、蛋白质相互作用网络进行分析。结果表明人MYBPC3基因mRNA全长为4 217 bp,编码区为3 825 bp,MYBPC3基因编码1 274个氨基酸组成的多肽,与物种进化程度一致,属于免疫球蛋白超家族,是酸性亲水蛋白,稳定性不高,其主要二级结构元件为随机卷曲。与c My BP-C存在相互作用的基因和蛋白主要是磷酸激酶与肌小节组成成分。本文对MYBPC3基因进行生物信息学分析,为深入研究MYBPC3基因的分子功能以及靶向治疗遗传性心肌病提供一定的依据。  相似文献   

17.
一个新的人类睾丸特异基因的cDNA克隆和表达分析   总被引:4,自引:1,他引:3  
运用“数据库消减杂交”(DigitalDifferentialDisplay)方法筛选人类睾丸特异表达新基因 ,获得了有差异显示的代表新基因的克隆重叠群 ,挑选其中一个克隆重叠群HS .12 9794进行多组织RT PCR ,初步证实该重叠群在人睾丸中有高表达。然后从包含该重叠群的IMAGE克隆出发 ,采用生物信息学的方法快速克隆了一个人类新基因的全长cDNA序列 ,其全长 2 4 30bp ,开放阅读框为 6 76~ 12 4 8bp ,定位于 3p2 1 1,编码由 190个氨基酸组成 ,分子量为 2 0 4 17 8Da ,等电点为 5 2 3的一个偏酸性蛋白质 ,该蛋白与已知蛋白质无明显同源性。克隆实验验证该基因阅读框完全正确 ,半定量RT PCR进一步显示该基因在人不同发育时期的睾丸及精子细胞中有表达 ,推测其可能与精子生成相关 ,暂命名为SRG5 (TestisSpermatogenesisRelatedGene 5 ,SRG5 ) (GenBank登录号 :AY2 2 1117)。SRG5基因的成功克隆表明 ,“数据库消减杂交”与实验验证相结合的技术路线是一种快捷高效的发现更多人类功能新基因的新策略。  相似文献   

18.
嗜热与嗜常温微生物的蛋白质氨基酸组成比较   总被引:11,自引:0,他引:11  
嗜热微生物的嗜热特性与其蛋白质的高度热稳定性紧密相关。为了探索嗜热蛋白质的热稳定机制,比较嗜热和嗜常温微生物的蛋白质在氨基酸组成上的差别,收集110对分别来自嗜热和嗜常温微生物的同源蛋白质序列,比较两组蛋白质各种氨基酸含量以及疏水性氨基酸组成、疏水性指数和荷电氨基酸组成的差别,结果两者在多种氨基酸含量上存在微小但统计学上显著的差别,嗜热蛋白质比嗜常温蛋白质具有较高的平均疏水性和荷电氨基酸组成。对两组蛋白质的“脂肪族氨基酸指数”进行分析,证明嗜热蛋白质之所以具有较高的脂肪族氨基酸指数是由于其亮氨酸含量较高,与影响该指数的其它几种氨基酸无关;从而认为该指数的意义值得怀疑。通过对大量同源嗜热蛋白质和嗜常温蛋白质氨基酸组成的比较,能够揭示一些有关蛋白质热稳定性的普遍规律。  相似文献   

19.
集成改进KNN算法预测蛋白质亚细胞定位   总被引:1,自引:0,他引:1  
基于Adaboost算法对多个相似性比对K最近邻(K-nearest neighbor,KNN)分类器集成实现蛋白质的亚细胞定位预测。相似性比对KNN算法分别以氨基酸组成、二肽、伪氨基酸组成为蛋白序列特征,在KNN的决策阶段使用Blast比对决定蛋白质的亚细胞定位。在Jackknife检验下,Adaboost集成分类算法提取3种蛋白序列特征,3种特征在数据集CH317和Gram1253的最高预测成功率分别为92.4%和93.1%。结果表明Adaboost集成改进KNN分类预测方法是一种有效的蛋白质亚细胞定位预测方法。  相似文献   

20.
基于SVM 的药物靶点预测方法及其应用   总被引:1,自引:0,他引:1       下载免费PDF全文
目的:基于已知药物靶点和潜在药物靶点蛋白的一级结构相似性,结合SVM技术研究新的有效的药物靶点预测方法。方法:构造训练样本集,提取蛋白质序列的一级结构特征,进行数据预处理,选择最优核函数,优化参数并进行特征选择,训练最优预测模型,检验模型的预测效果。以G蛋白偶联受体家族的蛋白质为预测集,应用建立的最优分类模型对其进行潜在药物靶点挖掘。结果:基于SVM所建立的最优分类模型预测的平均准确率为81.03%。应用最优分类器对构造的G蛋白预测集进行预测,结果发现预测排位在前20的蛋白质中有多个与疾病相关。特别的,其中有两个G蛋白在治疗靶点数据库(TTD)中显示已作为临床试验的药物靶点。结论:基于SVM和蛋白质序列特征的药物靶点预测方法是有效的,应用该方法预测出的潜在药物靶点能够为发现新的药靶提供参考。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号