首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
不同结构的蛋白编码基因的密码子偏性研究   总被引:21,自引:0,他引:21  
利用聚类分析方法,对两类具有不同三级结构的75个蛋白的编码基因的密码子使用偏性进行了分析。75个基因样本序列按照对应蛋白的三级结构被很清晰的分成了两类,从而发现密码子的使用与蛋白质的三级结构有很大的相关性。这一重要结果证实了DNA的一维信息中蕴含着蛋白质的三级结构信息。  相似文献   

2.
本研究对眼镜蛇科广西华珊瑚蛇(Sinomicrurus peinani)线粒体基因组序列进行测定与分析,并探究其与近缘种的系统发育关系。结果表明,广西华珊瑚蛇线粒体基因组是一条全长19 477 bp的环状DNA,基因组碱基构成为A(33.4%)、T(28.1%)、C(26.6%)和G(11.9%)。共编码38个基因,包含2个核糖体RNA(rRNA)基因、22个转移RNA(tRNA)基因、13个蛋白质编码基因及1个线粒体基因控制区(D-loop)。13个蛋白质编码基因均采用AUG作为起始密码子,UAA和UGA作为终止密码子;蛋白质编码基因编码频率较高的氨基酸分别为亮氨酸(Leu)、异亮氨酸(Ile)、苏氨酸(Thr)和丝氨酸(Ser);相对密码子使用度(RSCU)频率最高的4个密码子依次是CGA、UGA、CUA和CCA。22个tRNA,除tRNASer(一臂两环)外其他均可形成典型三叶草结构。基于眼镜蛇科线粒体基因组系统发育分析结果表明,与广西华珊瑚蛇关系最密切的是中华珊瑚蛇(Sinomicrurus macclellandi),其次是孟加拉眼镜蛇(Naja kaouthia)与眼镜王蛇(Ophiophagus hannah)。  相似文献   

3.
 本文以牛生长激素基因为例,对合成编码蛋白质基因的微机设计原理进行了探讨。微机程序的编制采用高级BASIC语言,在IBM-PC微机上完成。设计合成编码蛋白质基因的要点为:(1)按照宿主系统中高表达蛋白质基因对密码子的使用频率选用氨基酸密码子,以期合成基因得到高效表达;(2)对较大的合成基因设计有能够进行分段克隆的酶切位点,从而将一个大的基因分解成为多个基因片段的合成,减少了酶促连接化学合成DNA片段的步骤;(3)对于酶促连接化学合成DNA片段有干扰的重复顺序和互补顺序,则利用变换简并密码子的办法予以消除。  相似文献   

4.
柯杨  黄原  雷富民 《遗传》2010,32(9):951-960
采用长PCR扩增的线粒体DNA和引物步移法, 测定并注释了中国特有鸟类-黑尾地鸦(Podoces hendersoni)的线粒体基因组全序列。黑尾地鸦的mtDNA序列全长16 867 bp, GenBank登录号GU592504。基因含量和排列次序与原鸡的一致, 包含13个蛋白编码基因、22个tRNA、2个rRNA和1个控制区(D-loop)。除COI基因以GTG作为起始密码子外, 其余12个蛋白质编码基因均以典型ATG密码子起始。11个蛋白编码基因以完全终止密码子TAA、AGG或AGA终止, COIII和ND4基因终止密码子为不完整的T。tRNASer(AGY)的DHU臂缺失, tRNALeu(CUN)的反密码子环由9个碱基构成, 而不是标准的7个碱基。其余的20个tRNA基因的二级结构均属典型的三叶草结构。预测了rRNA的二级结构, 其中, 12S rRNA二级结构包含4个结构域, 43个茎环结构; 16S rRNA的二级结构包含6个结构域, 55个茎环结构。此外, 在其他鸟类控制区中所发现的F-box、D-box、C-box、B-box、Bird similarity-box和CSB1-box也同样存在于黑尾地鸦中。  相似文献   

5.
大肠杆菌基因中密码子前后碱基的使用与蛋白质结构   总被引:4,自引:0,他引:4  
对一组E.coli基因中编码蛋白质各类二级结构(α-螺旋、β-折叠片、无规卷曲和回折)的密码子前后碱基的使用情况进行统计分析和比较,发现一些密码子前后碱基的使用有偏向,而且这些偏向与蛋白质的二级结构有关联,这同时亦表明,E.coli基因中同义密码子的选用与蛋白质的二级结构有一些关联。模型对于蛋白质结构预测算法的改进以及基因工程的研究有辅助作用。  相似文献   

6.
鳙的线粒体基因组核苷酸全序列分析   总被引:1,自引:0,他引:1  
对采集自我国长江的鳙的线粒体DNA全序列进行了测定.结果表明,鳙的线粒体DNA全长为166221 bp,其碱基因组成为A=31.6%;C=27.1%;G=16.0%;T=25.3%,A+T含量为56.9%.鳙线粒体基因组的排列、结构和组成与其它鲤科鱼类相似,包括37个基因,即13个蛋白质编码基因,2个rRNA基因,22个tRNA基因和一个非编码控制区(D-loop).在13个蛋白编码基因中,除ND6由轻链编码外,其余12个基因均由重链编码.COI基因的起始密码子为GTG,而其它12个蛋白编码基因的起始密码子均为ATG.  相似文献   

7.
石磺线粒体基因组全序列对研究石磺科分子系统进化具有重要意义。利用LA-PCR技术对一种石磺Platevin-dexmortoni线粒体基因组全序列进行了测定和分析。结果表明,线粒体基因组序列全长13 991 bp,碱基组成分别为27.27%A、16.78%C、20.23%G、35.72%T;由22个tRNA、2个rRNA、13个蛋白编码基因和25个长度为2-118 bp的非编码区组成。4个蛋白质编码基因和5个tRNA基因从L链编码,其余基因均从H链编码。蛋白质基因的起始密码子,除ND2为GTG以外,均为典型的起始密码子ATN。ND2和Cytb基因使用了不完全终止密码子T,其余基因均使用典型的TAA或TAG。预测了22个tRNA基因的二级结构,发现tRNASer和TrnaAsn缺少DHU臂,tRNASer和tRNAThr的反密码子环上有9个碱基,而不是通常的7个碱基。最长的非编码区含有两个类似于的tRNAGln和tRNAPhy的二级结构。  相似文献   

8.
人类蛋白编码基因局部GC水平相关性分析   总被引:2,自引:0,他引:2  
陈祥贵  胡军  杨潇 《遗传》2008,30(9):1169-1174
GC含量是基因组DNA序列碱基组成的重要特征, 蕴涵基因结构、功能和进化信息。文中通过从公共数据库提取7 992个非冗余的人类蛋白质编码基因DNA序列, 分析了基因序列不同区域的局部GC含量和相关性。结果表明: 基因局部GC含量呈现不均一性, 5′非翻译区GC水平最高, 为62.56%; 而3′非翻译区GC水平最低, 为43.97%。3′侧翼序列的GC含量能较好地代表基因所在区域DNA长片段的GC水平。虽然开放阅读框的GC含量比内含子、3′非翻译区和3′侧翼序列的GC含量高, 但4个区域的GC含量之间均存在较高的相关性。密码子第三位置的平均GC含量(GC3)为58.09%, 显著高于密码子第一位置和第二位置的GC含量, 且与开放阅读框的GC水平高度相关, 相关系数高达0.91。GC3与内含子、3′非翻译区、3′侧翼序列的GC水平相关性也较高, GC3对3′侧翼序列的GC含量的直线回归斜率为1.25。因此, GC3可作为基因所在区域GC水平变化的敏感性指标。而密码子第一位置和第二位置以及5′侧翼序列和5′非翻译区GC水平与基因其他区域的GC水平的相关性较弱。该研究结果提示: 基因蛋白编码区密码子第三位置、内含子、3′非翻译区和3′侧翼序列的碱基可能经历了相近的进化过程, 而蛋白编码区密码子第一位置和第二位置、5′侧翼序列和5′非翻译区由于功能的需要而经历了不同的突变和选择。  相似文献   

9.
克氏光唇鱼线粒体基因组测定及光唇鱼属的系统发育分析   总被引:1,自引:0,他引:1  
根据侧条光唇鱼(Acrossocheilus parallens)线粒体基因(mt DNA)序列设计引物,采用引物步移和PCR扩增产物测序,获得了克氏光唇鱼(A.kreyenbergii)的mt DNA全序列。结构分析表明,克氏光唇鱼mt DNA为首尾闭合的环状基因,全长16 596 bp,编码37个基因,包括13个蛋白编码基因、22个t RNA基因、2个r RNA基因和两段非编码区(D-loop和轻链复制起点OL),碱基组成具有明显的A+T偏好和反G偏倚现象。13个蛋白编码基因中,除COⅠ的起始密码子是GTG,其余基因的起始密码子均为ATG;终止密码子包括完全的终止密码子TAA(38.46%)和TAG(7.69%),不完全的终止密码子TA(15.38%)和T(38.46%)。在D-loop区的811~837 bp区间发现了一段"TA"短串联重复序列。从蛋白编码基因所包含的信息量、变异位点和变异率看,ND5、ND4、COⅠ和ND2最适合作为光唇鱼属种间系统发育分析的分子标记。采用贝叶斯法利用13个蛋白编码基因所构建的系统发育树显示,光唇鱼属和白甲鱼属(Onychostoma)的24种鱼类各自没有聚为单系群,相互间不能明确区分。  相似文献   

10.
Chen M  Tian LL  Shi QH  Cao TW  Hao JS 《动物学研究》2012,33(2):191-201
该文对柳紫闪蛱蝶Apaturailia(鳞翅目:蛱蝶科)的线粒体基因组全序列进行了测定,同时结合其它已知蛱蝶类的相应序列进行了比较分析。结果显示:柳紫闪蛱蝶的线粒体基因组(GenBankaccessionno.:JF437925)是一个15242bp的环状DNA分子,包含13个蛋白质编码基因、2个rRNA基因和22个tRNA基因。13个蛋白编码基因中,除了COI基因的起始密码子是CGA外,其余12个蛋白编码基因都具有标准的ATN起始密码子;柳紫闪蛱蝶与其它已测的10种蛱蝶在基因定位和排列顺序方面几乎相同,只是在非编码序列上存在细微的差异,其核苷酸的构成及密码子使用频率都处于鳞翅目昆虫的范围之内。22个的tRNA基因中,除了tRNASer(AGN)缺少DHU臂,其余的tRNA基因都显示为典型的三叶草结构。基因组共存在9处基因间重叠区(总长度为33bp)以及12个基因间隔区(总长为155bp,最长间隔是49bp,最短的是1bp)。在ND6和Cytb间的间隔区中还发现有(TA)23似微卫星结构。与其他蛱蝶类相似,403bp的AT富集区包含有ATAGA,ATTTA二个保守模块(一个21bp的poly-T,一个10bp的poly-A),以及二个似微卫星的重复结构((TA)10和(TA)7)。  相似文献   

11.
该研究以2株野生沙枣(Elaeagnus angustifolia Linn.)嫩枝经温室水培后的嫩叶为材料,采用CTAB法分别提取总DNA,并利用第二代测序技术进行总DNA从头测序,组装后得到2株沙枣叶绿体基因组全序列,并详细分析了其蛋白质编码基因密码子使用的偏好性及其原因,为沙枣叶绿体基因工程和分子系统进化等研究奠定基础。结果显示:(1)组装得到沙枣叶绿体基因组序列全长150 546 bp,由长度为81 113 bp的长单拷贝(LSC)区域和25 494 bp的短单拷贝(SSC)区域,以及1对分隔开它们的长18 445 bp的反向重复序列(IRS)组成;注释共得到132个基因,包括86个蛋白编码基因、38个tRNA基因和8个rRNA基因。(2)沙枣叶绿体基因组蛋白编码基因密码子的第三位碱基GC含量(GC_3)为28.47%,明显低于整个叶绿体基因组GC含量(37%),也低于第一位(GC_1)和第二位(GC_2)碱基的GC含量,说明密码子对AT碱基结尾有偏好性;其中, UCU、CCU、UGU、GCU、CUU、GAU、UCA和UAA为最优密码子。(3)同义密码子相对使用频率(RSCU)分析发现,影响密码子使用模式的因素并不单一,密码子的偏好性受到突变、选择及其他因素的共同影响,并且自然选择表达引起的序列差异比突变对密码子偏好性的影响要显著;中性绘图分析、有效密码子数(ENC-plot)分析和奇偶偏好性(PR2-plot)分析表明,沙枣叶绿体基因组使用密码子的偏性受选择的影响更大。(4)通过最大似然法、最大简约法和贝叶斯方法对胡颓子科6个物种和1个枣的叶绿体基因序列构建系统发育树,与它们使用密码子偏性聚类的结果一致,表明叶绿体基因组使用密码子偏性与物种的亲缘关系相关。  相似文献   

12.
密码子偏性的分析方法及相关研究进展   总被引:22,自引:0,他引:22  
密码子偏性是指生物体中编码同一种氨基酸的同义密码子的非均衡使用的现象,由于这一现象与遗传信息的载体分子DNA和生物功能分子蛋白质相关联,所以具有重要的生物学意义;本文概述了密码子偏性研究方面的基本理论和常用分析方法,归纳了密码子使用分析的常用软件和提供在线分析网站,介绍了与密码子偏性相关的生物学领域及最新的研究进展,并对深入研究进行展望。  相似文献   

13.
Wang XC  Sun XY  Sun QQ  Zhang DX  Hu J  Yang Q  Hao JS 《动物学研究》2011,32(5):465-475
该研究对斐豹蛱蝶(Argyreus hyperbius)(鳞翅目:蛱蝶科)线粒体基因组全序列进行了测定和初步分析。结果表明:斐豹蛱蝶线粒体基因全序列全长为15156bp,包含13个蛋白质编码基因、22个tRNA和2个rRNA基因以及1个非编码的A+T富集区,基因排列顺序与其它鳞翅目种类一致;线粒体全序列核苷酸组成和密码子使用显示出明显的A+T偏好(80.8%)和轻微的AT偏移(AT skew,?0.019)。基因组中共存在11个2~52bp不等的基因间隔区,总长96bp;以及14个1~8bp不等的基因重叠区,总长34bp。除COI以CGA作为起始密码子外,13个蛋白质编码基因中的其余12个基因是以ATN作为起始密码子。除COI和COII基因是以单独的一个T为终止密码子,其余11个蛋白质编码基因都是以TAA结尾的。除了缺少DHU臂的tRNASer(AGN),其余的tRNA基因都显示典型的三叶草结构。tRNA(AGN)和ND1之间的基因间隔区包含一个ATACTAA结构域,这个结构域在鳞翅目中是保守的。A+T富集区没有较大的多拷贝重复序列,但是包含一些微小重复结构:ATAGA结构域下游的20bp poly-T结构,ATTTA结构域后的(AT)9重复,以及位于tRNAMet上游的5bp poly-A结构等。这项研究所揭示的斐豹蛱蝶的线粒体基因组特征,不仅为认识蛱蝶科的遗传多样性贡献数据,而且对于该物种的保护生物学、群体遗传学、谱系地理及演化研究等具有重要意义。  相似文献   

14.
拟南芥基因密码子偏爱性分析   总被引:22,自引:0,他引:22  
密码子偏爱性对外源基因的表达强度有一定影响,特别是编码蛋白质N端7~8个氨基酸残基的密码子.通过对拟南芥染色体中26 827个蛋白质对应的基因密码子进行分析,得到了编码氨基酸的61种密码子在拟南芥中的使用频率,并与大肠杆菌和哺乳动物进行了比较,结果表明三者间的密码子偏爱性有较大差异.这一分析结果对于动物基因在植物中的表达,及植物基因在微生物中的表达具有一定指导意义.同时提供了一种直接以XML文档为数据源解析巨型XML格式染色体数据的方法.  相似文献   

15.
人基因中密码子前后碱基使用与蛋白质结构   总被引:5,自引:1,他引:4  
对62个人基因中编码蛋白质各类二级结构(α-螺旋、β-折叠片、无规卷曲和回折)的密码子前后碱基的使用情况进行统计分析和比较,发现多数密码子前后碱基的使用有一定偏向,而且这些偏向与蛋白质的二级结构有关联。这同时亦提示,同义密码子的选用与蛋白质的二级结构有一些关联。结果对于蛋白质结构预测算法以及基因工程的研究有辅助作用。  相似文献   

16.
本研究测定了昆虫纲半翅几姬缘蝽科Rhopalidae绿环缘蝽Stictopleurussubviridis Hsiao的完整线粒体基凶组.为异翅亚目蝽次目Penmtomomorha中的首例研究.该线粒体基因组为全长15 139 bp的双链环状DNA分子,含有后生动物线粒体基凶组中典型的37个基因,AT含量为75.7%.各基因的排列方式与六足动物假想祖先相同.该线粒体基因组结构紧凑,有基因重叠现象.在tRNA-Ⅱe与tRNA-GLn问发现一个罕见的79bp的非编码序列.tRNA-Ser的二级结构中DHU臂缺失,无法折叠成典型的三叶草结构.CO2和CO3终止密码子为T,其下游为同链编码的tRNA基因.基因组AT含量为75.7%,密码子使用频率也反映出AT偏好.两条链上蛋白质编码基凶的CG-skew趋势相反,密码子使用频率也反映出两链不同的CG偏好.蛋白编码序列并不总是使用与tRNA的反密码子相对应的密码子,密码子的使用并不随机.使用频率最高密码子为NNA,使用频率最低的密码子为NNG.与臭虫次目Cimicomomorpha中的锥猎蝽Triaatoma dimidiata线粒体基因组比较分析表明,ATP8为进化最快的蛋白质,CO1最慢,但tRNA和rRNA基因的进化速率比蛋白质基因低.  相似文献   

17.
基于同义密码子偏好分析,对54个原核基因组大、小染色体及质粒中蛋白质编码基因的序列特征进行了对比分析。结果表明,大、小染色体中蛋白质编码基因的GC含量分布相近,质粒中蛋白质编码基因的GC含量分布与所在物种全基因组的GC含量差别较大。进一步的分析表明,大、小染色体共同偏好的密码子最多,且具有相近的起始密码子和终止密码子使用特征。基于对应分析的同义密码子使用模式分析表明,大、小染色体具有相近的序列特征,且大、小染色体及质粒之间具有不尽相同的影响因素。这些结果可为今后原核生物基因组进化研究提供可靠的方法和理论依据。  相似文献   

18.
基于同义密码子偏好分析,对54个原核基因组大、小染色体及质粒中蛋白质编码基因的序列特征进行了对比分析。结果表明,大、小染色体中蛋白质编码基因的GC含量分布相近,质粒中蛋白质编码基因的GC含量分布与所在物种全基因组的GC含量差别较大。进一步的分析表明,大、小染色体共同偏好的密码子最多,且具有相近的起始密码子和终止密码子使用特征。基于对应分析的同义密码子使用模式分析表明,大、小染色体具有相近的序列特征,且大、小染色体及质粒之间具有不尽相同的影响因素。这些结果可为今后原核生物基因组进化研究提供可靠的方法和理论依据。  相似文献   

19.
高等植物和绿藻的叶绿体有自己的遗传系统.烟草、欧龙亚草和水稻叶绿体DNA的全部核苷酸序列含有130个基因密码.除叶绿体rRNA和30tRNA的基因外,已发现至少有70个密码子的40个ORF和已确定的40个及未定的11个叶绿体蛋白质基因.在一些植物种中,rRNA基因组附近的某些基因组出现二个反向重复片段.人们把质体基因分成三类:(1)编码光合系统的蛋白质基因.光合作用中蛋白质的合成  相似文献   

20.
采用LongPCR和引物步移法测得大豆蚜Aphis glycines Matsumura线粒体基因组约90%的序列,并与蚜总科Aphidoidea已报道的3种蚜虫进行了比较。结果表明:已测得的序列长度为13696bp,AT含量为83.3%;蛋白质编码基因起始密码子都为ATN,COI、ND4、CYTB、ND2使用不完整终止密码子T,其余都使用常见终止密码子TAA;15个tRNA基因除tRNA-W外都能折叠成典型的三叶草二级结构。比较大豆蚜、豌豆蚜Acyrthosiphon pisum(Harris)、麦二叉蚜Schizaphis graminum(Rondani)和葡萄根瘤蚜Daktulosphaira vitifoliae(Fitch)的线粒体基因组,结果表明4个种均具有后生动物线粒体基因组中常见的基因,基因顺序与假想昆虫祖先的排列方式相同,但豌豆蚜包含3个tRNA-M;蛋白质编码基因的起始密码子都为ATN,除葡萄根瘤蚜外,其他3种蚜虫的COⅠ、ND4使用不完整终止密码子T;tRNA-W的二级结构中都存在TψC臂中"茎"的结构缺失,只有环的结构;而蛋白质编码基因使用最频繁的氨基酸略有不同,大豆蚜为Leu,豌豆蚜和麦二叉蚜为Ile;大豆蚜和麦二叉蚜的ND4/ND4L都存在7bp的重叠序列,而豌豆蚜和葡萄根瘤蚜没有发现此现象。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号