首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
艾亮  冯杰 《生物信息学》2023,21(3):179-186
本文提出了一种新的快速非比对的蛋白质序列相似性与进化分析方法。在刻画蛋白质序列特征时,首先将氨基酸的10种理化性质通过主成分分析浓缩为6个主成分,并且将每条蛋白质序列里的氨基酸数目作为权重对主成分得分值进行加权平均,然后再融合氨基酸的位置信息构成一个26维的蛋白质序列特征向量,最后利用欧式距离度量蛋白质序列间的相似性及进化关系。通过对3个蛋白质序列数据集的测试表明,本文提出的方法能将每条蛋白质序列准确聚类,并且简便快捷,说明了该方法的有效性。  相似文献   

2.
严重急性呼吸综合征(SARS)冠状病毒S蛋白的鉴定与分析   总被引:3,自引:0,他引:3  
利用293细胞对SARS病人样品进行病毒扩增,培养上清中病毒颗粒经过纯化后,利用蛋白质组学技术,对纯化得到的SARS冠状病毒颗粒蛋白进行初步分离与鉴定。其中质谱分析结果最终表明,分子量约150kD的蛋白质的氨基酸序列与SARS—CoV基因组所预测S蛋白质序列高度吻合,从而首次从蛋白质水平对SARS冠状病毒S蛋白的氨基酸序列进行了证实。  相似文献   

3.
基于氨基酸特征序列的蛋白质结构分析   总被引:2,自引:1,他引:2  
针对蛋白质序列中氨基酸的核苷酸组成部分及其相关特征信息,提出另外的σ-等序列的概念,并讨论了其主要特征与次要特征,可作为对蛋白质进行定性和定量比较的一种方法,用来判断这些物种的同源性和相似性程度。然后,对所取的全α螺旋,全β折叠和αβ类序列,利用σ-,τ-,στ序列的概念,给出蛋白质序列的相关氨基酸特征序列。同时对三类共18个蛋白质序列进行数值刻划,给出数值刻划图并进行分析。  相似文献   

4.
五龄家蚕若干组织器官蛋白质数据库构建   总被引:19,自引:0,他引:19  
钟伯雄 《遗传学报》2001,28(3):217-224,T002
为构建家蚕蛋白质数据库,达到从蛋白质水平研究基因的表达及表达产物的加工修饰的目的,采用五龄家蚕休体壁、中肠和脂肪为材料获取蛋白质样品,用蛋白质双向电泳技术分离、纯化蛋白质,对其中的40个蛋白质斑点进行了氨基酸序列分析及同源性检索,发现其中58.5%的蛋白质与果蝇的有关蛋白质具有较高同源性,36.5%与其他生物的蛋白质具有较高同源性,只有5%与家蚕已知蛋白拷贝产高同源性,研究发现有27个蛋白质的N-末端氨基酸序列在家蚕中是第一次被检测到,并通过互联网向SWISS-PROT数据库进行了登录。研究证明利用蛋白质数据库的结果,可以得到基因表达及其产物修饰的信息。  相似文献   

5.
为研究云南野生蔷薇属中的NBS类抗病基因,根据已知抗病基因NBS LRR序列中的保守区域设计简并引物,利用RT PCR技术从云南悬钩子蔷薇中进行体外扩增,获得了对应区域的cDNA片段,回收、克隆这些特异片段,测序分析,共得到4个含有NBS LRR保守结构域的抗病基因同源序列(RGAs),分别命名为AC9、AC39、AC50和AC68。它们与已报道的11个NBS类抗病基因相应区段的氨基酸序列相似性为5.4%~79.2%,其中这4个RGAs片段与Mi、RPS2、Pib和RPM1基因聚为一类。表明这4条RGAs序列可进一步用作悬钩子蔷薇抗病候选基因的分子筛选及遗传图谱的构建。  相似文献   

6.
为研究云南野生蔷薇属中的NBS类抗病基因,根据已知抗病基因NBSLRR序列中的保守区域设计简并引物,利用RTPCR技术从云南悬钩子蔷薇中进行体外扩增,获得了对应区域的cDNA片段,回收、克隆这些特异片段,测序分析,共得到4个含有NBSLRR保守结构域的抗病基因同源序列(RGAs),分别命名为AC9、AC39、AC50和AC68。它们与已报道的11个NBS类抗病基因相应区段的氨基酸序列相似性为5.4%~79.2%,其中这4个RGAs片段与Mi、RPS2、Pib和RPM1基因聚为一类。表明这4条RGAs序列可进一步用作悬钩子蔷薇抗病候选基因的分子筛选及遗传图谱的构建。  相似文献   

7.
为了更多地挖掘隐藏在蛋白质序列中的信息,本研究将20种氨基酸均匀地排列在单位圆周上,得到每种氨基酸对应的二维坐标,再与氨基酸的6个理化指标结合起来,最终用一个八维向量来刻画蛋白质序列。为避免数据极差对分析结果造成的影响,本研究对蛋白质序列所对应的八维向量作归一化处理。基于归一化后的蛋白质序列的向量表示,运用神经网络对蛋白质序列进行分类,并根据向量之间的欧式距离来量化序列之间的相似性。最后,以9个不同物种的ND5蛋白质序列以及8个不同物种的ND6蛋白质序列为例,Clustal W序列比对方法为基准,对本研究的方法与5-字母方法进行验证和比较,结果表明本研的方法是有效的。  相似文献   

8.
SARS冠状病毒全基因组序列初步分析   总被引:4,自引:0,他引:4  
对已经完成全序列测定的12个SARS病毒基因组进行了多序列比对,发现序列主体部分29708 b具有99.82%的相同碱基,除2个序列各有5个和6个碱基的缺失外,其余部分共有42个位点核苷酸碱基的差异,其中28个位点的碱基差异可引起氨基酸残基改变。利用蛋白质二级结构和跨膜螺旋预测以及蛋白质定位等生物信息学工具,分析了这些产生氨基酸改变部位的蛋白质构像,推测了可能产生的结构和功能改变,为进一步生物学实验提供参考。所有分析结果同时在北京大学生物信息中心抗SARS网站(antisars.cbi.pku.edu.cn)上发布。  相似文献   

9.
严重急性呼吸综合征(SARS)冠状病毒核蛋白的鉴定与分析   总被引:5,自引:1,他引:5  
利用蛋白质组学技术,对纯化的严重急性呼吸综合征(SARS)冠状病毒颗粒所含核蛋白进行初步分离与鉴定。质谱分析结果最终表明,SARS冠状病毒核蛋白的分子量位于47kD与52kD之间,所获得的SARS冠状病毒核蛋白的质谱分析数据覆盖了所预测病毒核蛋白氨基酸序列的87%,且符合率为100%。从而首次从蛋白质水平对SARS冠状病毒核蛋白的氨基酸序列进行了证实。  相似文献   

10.
氨基酸序列集熵值计算工具实现及应用   总被引:1,自引:0,他引:1  
氨基酸序列保守区和可变区分析是蛋白质结构和功能分析预测的关键环节。本研究根据该需求,编写了Entropy软件,实现了氨基酸序列集熵值计算、统计分析和优势序列模型自动生成等功能,并利用其对A型流感病毒血凝素氨基酸序列的特征进行了分析。该软件为氨基酸序列集保守性分析提供了可靠工具。  相似文献   

11.
为了降低固有不规则蛋白质预测模型中特征矩阵的稀疏性,提高预测模型的性能,提出一种利用氨基酸结构倾向性预测固有不规则蛋白质的方法.利用氨基酸结构倾向性将20种氨基酸进行分类,构建氨基酸简化集合,从间接角度提取氨基酸序列中蕴含的不规则结构特征,利用新的简化集合重新描述氨基酸序列,构建固有不规则蛋白质预测模型.预测结果表明,基于氨基酸结构倾向性的预测模型能够有效地挖掘氨基酸结构倾向性中隐藏的不规则结构特征信息,提高固有不规则蛋白质预测模型的预测精度.  相似文献   

12.
为了研究一级结构对蛋白质耐热性的影响,利用软件DNAMAN对16个家族32种蛋白质序列进行了氨基酸含量分析,并统计分析了氨基酸组成对蛋白质耐热性的影响。通过比较同一家族的高低温蛋白质序列及16个家族中所有高温和低温蛋白质序列中氨基酸含量的变化可以推断(从低温到高温):Ser、Cys.含量降低显著,Arg、Ile、Pro含量升高显著。由此可知高温蛋白质倾向于含有疏水性氨基酸而避免亲水性氨基酸。  相似文献   

13.
报道了一个通过有限酶切蛋白质产生多肽片段的方法.蛋白质经单向SDS-聚丙烯酰胺凝胶电泳(SDS-PAGE)分离和用考马斯亮蓝短暂染色后,切下所需的蛋白质带,将其放入另一个SDS-PAGE凝胶的样品槽内,在电泳过程中该蛋白质被蛋白酶如蛋白酶V8降解,所产生的多肽片段随之被分离.电泳结束后,将多肽片段电印迹至聚偏二氟乙烯(polyvinylidene difluoride,PVDF)膜上.这些多肽片段从PVDF膜上切下后可以直接被用于分析氨基酸序列.该方法能广泛适用于分析一般蛋白质和N端被修饰蛋白质的氨基酸序列.  相似文献   

14.
基于氨基酸的疏水性和相对分子质量,先把20种氨基酸分为8类,按不同间隔角度放置于圆周上。根据z轴坐标的划分,建立一个坐标空间。将蛋白质序列中的氨基酸按排列顺序映射到空间坐标系中,得到序列的3D模型。将3D模型转换为20维矩阵图,分析序列中氨基酸对数量特征及相似性。进一步将空间坐标转换为数值序列,进行离散傅里叶变换(discrete Fourier transform,DFT),得到原蛋白质序列的功率谱,将不同长度的功率谱扩展到数据集中最长序列的长度m维。再通过计算功率谱序列间的欧氏距离来度量序列相似性,构建系统发育树。最后对不同数据集进行验证,结果显示:聚类结果与矩阵图的分析相符,且优于其他算法的效果,表明此算法对蛋白质相似性研究具有一定的有效性。  相似文献   

15.
蛋白质折叠速率的正确预测对理解蛋白质的折叠机理非常重要。本文从伪氨基酸组成的方法出发,提出利用序列疏水值震荡的方法来提取蛋白质氨基酸的序列顺序信息,建立线性回归模型进行折叠速率预测。该方法不需要蛋白质的任何二级结构、三级结构信息或结构类信息,可直接从序列对蛋白质折叠速率进行预测。对含有62个蛋白质的数据集,经过Jack.knife交互检验验证,相关系数达到0.804,表示折叠速率预测值与实验值有很好的相关性,说明了氨基酸序列信息对蛋白质折叠速率影响重要。同其他方法相比,本文的方法具有计算简单,输入参数少等特点。  相似文献   

16.
嗜热蛋白在高温下能保持稳定性和活性,是研究蛋白质热稳定性的理想模型,开发一个蛋白质热稳定性识别的方法将对蛋白质工程和蛋白质的设计很有帮助。目前的研究中,氨基酸的组成及其物化性质一直被认为和蛋白质的热稳定性相关。本研究筛选出可靠的数据集,包括915个嗜热蛋白和793个非嗜热蛋白。利用蛋白质氨基酸的物化性质和氨基酸的组成表征嗜热蛋白,将二肽氨基酸组成整合到9组氨基酸物化性质中使蛋白序列公式化。支持向量机5折叠交叉验证表明:当gap=0时,290个特征产生的精度最高,为92.74%。因此说明对于分析蛋白质的热稳定性,所建立的预测模型将是一个很有效的工具。  相似文献   

17.
广东番茄曲叶病毒G2分离物基因组DNA-A的分子特征   总被引:4,自引:0,他引:4  
从采集于广东的番茄曲叶病病株上分离到病毒分离物G2 ,序列分析结果表明 ,其DNA_A为单链环状 ,全长2 74 4nt,共有 6个ORF ,其中病毒链上编码AV1(CP)、AV2 ,互补链上编码AC1、AC2、AC3和AC4。BLAST结果显示 ,与G2基因组有同源关系的病毒均属双生病毒科菜豆金色花叶病毒属。序列比较结果显示 ,G2与菜豆金色花叶病毒属病毒的DNA_A序列同源率均不超过 83% ,其中同源率最高的是PaLCuCNV_[G10 ](82 8% )。进一步比较发现 ,它们的基因间隔区 (IR)变异最大 (同源率为 30 9%~ 81 8% ) ;CP氨基酸序列的同源率较高 (77 6 %~ 99 2 % ) ,AC4蛋白氨基酸序列的同源率较低 (4 3 5 %~ 78 8% )。系统进化关系分析结果也显示 ,G2与已报道的菜豆金色花叶病毒属病毒的亲缘关系均较远。因此 ,G2可能是双生病毒科菜豆金色花叶病毒属中一个未报道的新种 ,命名为广东番茄曲叶病毒 (TomatoleafcurlGuangdongVirus ,ToLCGDV)  相似文献   

18.
本文利用PCR技术扩增得到香蕉束顶病毒(BBTV)NS株DNA组分5的全基因,该基因全长为1014nt,具有一个开放阅读框,编码146个氨基酸,蛋白质二级结构包括6个α螺旋,7个β折叠。NS株系与南太平洋组澳大利亚、夏威夷、埃及分离物DNA组分5核苷酸和编码的氨基酸序列相比较,核苷酸序列同源率介于88%~89%之间,氨基酸序列同源率介于80%~88%之间。NS株系与其它分离物在编码成视网膜细胞瘤蛋白(Retinoblastomaprotein,Rb)的基元序列“LXCDE”附近的二级结构上表现明显的差异,推测这种差异可能影响与植物中Rb蛋白的结合效率。  相似文献   

19.
苏云金芽孢杆菌液体培养物上清液中杀虫活性物质的研究   总被引:11,自引:0,他引:11  
采用离心、拄层析、氨基酸组成及序列分析、生物鉴定等方法,对具有杀虫活性的苏云金芽孢杆菌培养物上清液进行了研究。发现上清液中杀虫活性的出现时间与菌的自溶同步。上清液中含有的分子量为60—kDa的蛋白是起杀虫作用的主成分,分离纯化该蛋白质,对其进行了氨基酸组分和N末端序列分析。结果表明,该蛋与P1蛋白在N端有18个氨基酸的序列完全一致,氨基酸的组分相似,说明二者同源。同时还发现,上清液与沉淀混用能提高杀虫活性。  相似文献   

20.
从蛋白质的分子结构、翻译后的蛋白质质量控制、蛋白质结构预测方法 3个方面阐述肽链的折叠方式不是引起蛋白质结构和功能多样性的直接原因:在氨基酸序列确定的情况下,肽链的折叠方式是保守的;肽链一旦折叠错误,蛋白质质量控制系统会对其进行纠正或降解清除,若质量控制失败,错误折叠的蛋白质便会引起疾病;从氨基酸序列出发利用分子力学模拟方法和建模软件预测蛋白质三维构象的研究技术侧面印证了氨基酸序列确定的肽链其折叠方式具有保守性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号