首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
ncRNA和mRNA一样,都是重要的功能分子。以k-tuple(k字)含量为特征,对酵母ncRNA成熟序列和mRNA的编码区、上游序列与下游序列进行了分类与比较研究,结果显示:基于ncRNA成熟序列与mRNA编码区的3-tuple的含量,ncRNA和mRNA的交叉有效性分类精度(leave-one out cross-validation,LOOCV)平均值达到93.93%;基于上游序列4-tuple和5-tuple的含量,分类精度分别为92.49%和92.76%;基于下游序列4-tuple和5-tuple的含量,分类精度分别为91.58%和90.60%;利用上游序列和下游序列的4-tuple与5-tuple的含量,其平均分类精度分别为94.68%和94.83%;通过t检验,得到了在ncRNA和mRNA上、下游序列中具有显著统计学差异的k-tuple。上述结果表明,基于ncRNA成熟序列与mRNA编码区的3-tuple含量和基于ncRNA与mRNA上、下游序列的4或5-tuple含量可以有效地区分ncRNA与mRNA。此研究结果不仅有助于准确识别ncRNA与mRNA,还有助于发现ncRNA特异的转录因子结合位点。  相似文献   

2.
扩展青霉PF898碱性脂肪酶基因组DNA的克隆及序列分析   总被引:6,自引:0,他引:6  
扩展青霉 (Penicilliumexpansum)PF898可产生一种具有重要工业生产价值的碱性脂肪酶(PEL) .在通过 3′RACE和 5′RACE获得PEL完整的cDNA序列的基础上 ,通过PCR方法首次克隆了该脂肪酶的完整的基因组DNA序列 (GenBank登录号为AF330 6 35 ) .该脂肪酶DNA全长 14 0 4bp ,包括PEL编码区、3′非翻译区和部分 5′非翻译区基因的序列 .编码区DNA由 1135个碱基组成 ,含有 5个内含子 ,大小分别为 5 8bp、4 7bp、5 0bp、5 6bp和 6 9bp .在已报道的丝状真菌脂肪酶中 ,PEL基因的内含子数量最多 ,而其大小与其它丝状真菌脂肪酶基因的内含子一样 ,均为只有几十个碱基的小内含子 .PCR扩增获得的PLEDNA序列还包括由 195个碱基组成的 3′端非编码区序列 ,74个碱基的部分 5′端非编码区序列 .PELDNA全长序列中的 - 2 4至 - 2 7nt为TATAbox ,终止码TGA下游15 6nt出现AATAAA序列 ,TGA下游 182位出现poly(A)尾 ,为典型的真核基因结构 .同源性序列分析表明 ,PEL与其它真菌来源脂肪酶的基因组DNA序列同源性约为 39%~ 4 9% ,PEL内含子之间或PEL内含子与其它丝状真菌脂肪酶基因的内含子之间的序列同源性约 4 2 %~ 5 7% .  相似文献   

3.
通过3'RACE克隆策略获得绞股蓝(Gynostemma pentaphyllum)核糖体失活蛋白(ribosome-inactivating protein,RIP)Gynostemmin的5个cDNA序列gynostemmin Ⅰ~Ⅴ及其下游非编码区(3′untranslated region,3′UTR).它们的编码区长度除gynostemmin Ⅱ为825 bp外,其余均为831 bp.其下游非编码区的长度分别为279、174、170、161和171 bp.在3′UTR中,gynostemmin Ⅰ比另外4个多了两个小的茎环结构和一富含AU的不稳定子元件,其mRNA的稳定性可能因此受到影响.  相似文献   

4.
牛催乳素基因组及其cDNA全长序列的分子克隆和分析   总被引:17,自引:0,他引:17  
通过LongPCR等技术首次克隆得到全长9388bp的牛催乳素(bPRL)基因组序列(GenBank登录号AF426315),其中包括bPRL基因全部5个外显子和4个内含子,5′端854bp的上游调控区以及3′端69bp的UTR,AF426315基因编码的蛋白质在GenBank中的序号为AAL28075,由229个氨基酸残基组成,1-30位氨基酸残基为信号肽序列,成熟的多肽含有199个氨基酸残基,将bPRL基因组DNA真核表达载体转染COS-7细胞后通过RT-PCR得到长度为804bp的bPRLcDNA序列,该序列涵盖了bPRL基因的全部ORF区,证明本研究所获得的bPRL基因组DNA具有转录的生物学功能,Blast搜索结果显示,GenBank数据库中收集有多条bPRL基因的mRNA和EST序列,各序列间存在多个SNP位点,主要分布于下游编码区和3′端的UTR,这些位点均未改变相应的氨基酸残基的性质,此外,5′端编码信号肽序列的区域呈现高度保守性。  相似文献   

5.
家蝇卵黄蛋白基因编码的卵黄蛋白是家蝇胚胎发育的重要营养来源 .根据 3种家蝇卵黄蛋白cDNA保守序列设计引物 ,用PCR技术从家蝇基因组DNA中扩增到大小为 76 8bp的mdYP1基因的部分DNA片段 .经地高辛标记成特异性探针 ,从构建的家蝇基因组文库中筛选出一个阳性克隆 ,并从该克隆中分离到大小为 3991bp的mdYP1基因组基因 .序列分析显示 ,该基因组序列含有约1 6kb的 5′ 上游区和 1 0kb的 3′ 下游区 ,编码区由一个 6 1bp的内含子和大小分别为 2 2 2bp和10 2 8bp的 2个外显子组成 .5′ 上游区含有典型的CAAT TATA盒 .  相似文献   

6.
通过3'RACE克隆策略获得绞股蓝(Gynostemma pentaphyllum)核糖体失活蛋白(ribosome-inactivating protein,RIP) Gynostemmin的5个cDNA序列gynostemminⅠ~Ⅴ及其下游非编码区(3' untranslated region, 3'UTR)。它们的编码区长度除gynostemminⅡ为825 bp外,其余均为831 bp。其下游非编码区的长度分别为279、174、170、161和171 bp。在3'UTR中,gynostemminⅠ比另外4个多了两个小的茎环结构和一富含AU的不稳定子元件,其mRNA的稳定性可能因此受到影响。  相似文献   

7.
刘林梦  温权  欧竑宇 《微生物学通报》2014,41(12):2583-2592
【目的】为识别已完成全测序细菌基因组中的ncRNA基因,对3个常用ncRNA预测工具s RNAPredict、PORTRAIT和s RNAscanner进行评估。【方法】选择了细菌ncRNA数据库BSRD收录的含有已知ncRNA基因数目大于30的9个细菌基因组,并按基因组G+C含量进行分类,比较s RNAPredict和PORTRAIT工具的预测准确性。提取不同G+C含量基因组中ncRNA基因转录起始和终止区的序列特征,对s RNAscanner预测结果进行评估。【结果】s RNAPredict对细菌ncRNA基因的预测特异性和阳性检出率均高于PORTRAIT,而敏感性则较差;两种工具预测效果均随基因组G+C含量不同而产生明显变化。在不同G+C含量的细菌基因组中,ncRNA基因启动子和终止子区域的序列特征有明显差异。利用这些序列特征能提高s RNAscanner预测ncRNA基因的平均水平。【结论】3种ncRNA基因工具预测效果随基因组G+C含量变化而不同。不同G+C含量基因组中ncRNA基因的转录起始和终止区特征可作为ncRNA基因预测的重要参数之一。  相似文献   

8.
人类基因组计划的研究结果显示,仅有2.5万~3万个蛋白质编码基因,占总基因组序列不到3%,其余基因组序列转录产生的RNA都是非编码RNA(non-coding RNA,ncRNA).ncRNA与恶性肿瘤发生发展关系密切.近年来,关于ncRNA中的长链非编码RNA(lncRNA)以及环状RNA(circRNA)的研究进展迅速.本文就lncRNA以及circRNA在前列腺癌中作用机制的研究进展作一综述.  相似文献   

9.
鲫两种不同生长激素cDNA的分子克隆和分析   总被引:4,自引:1,他引:3  
从鲫脑垂体组织提取总RNA ,采用 3′RACE PCR的方法 ,从单一垂体总RNA中扩增出编码两种不同类型鲫生长激素的cDNA :生长激素Ⅰ (GrowthhormoneⅠ ,GHⅠ )和生长激素Ⅱ (GrowthhormoneⅡ ,GHⅡ )。将两种类型的鲫GHcDNA分别克隆到pGEM TEasyVector上进行序列测定和分析。克隆的鲫GHⅠ和GHⅡcDNA均包括编码 188个氨基酸残基的GH成熟肽序列和 3′端的非翻译区 ,但不含信号肽序列和 5′端非编码区。序列分析结果表明 ,鲫GHⅠ的碱基序列和推测的氨基酸序列与国外已经发表的金鱼GHⅠ的同源性分别为 98 7%和 97 9% ;GHⅡ的碱基序列和推测的氨基酸序列与金鱼GHⅡ的同源性分别为 99 1%和 99 5% ,虽然同源性较高 ,但仍具有一定的差异  相似文献   

10.
水稻条叶枯病毒(RStV)基因组组分4的克隆与序列分析   总被引:7,自引:0,他引:7       下载免费PDF全文
利用RTPCR技术合成并扩增了水稻条叶枯病毒(RStV)中国云南分离物基因组组分4的全长cDNA,将PCR产物克隆在载体pCRII上,并进行全序列测定,所得核苷酸序列及推测的氨基酸序列与日本分离物T进行比较。结果表明,在核苷酸水平,两分离物的vORF、vcORF及基因间非编码区序列的同源性分别为94.9%、94.1%、86.1%,5’端非编码区序列相同,而3’非编码区同源性为96.1%,仅有两个核苷酸不同;在氨基酸水平,vORF及vcORF编码蛋白的同源性分别为99.4%和98.3%。可见,编码区的大小及其氨基酸序列和两末端序列都是很保守的。因此,中国云南分离物Y与日本分离物T可能有很近的亲缘关系。  相似文献   

11.
鸡含锰超氧化物歧化酶cDNA克隆及序列分析   总被引:4,自引:0,他引:4  
 为弄清鸡含锰超氧化物歧化酶 (manganese containingsuperoxidedismutase ,MnSOD)的cDNA序列 ,以开展动物锰营养学的深入研究 ,根据已知鸡MnSOD的N端氨基酸序列设计简并引物 ,应用 3′RACE(rapidamplificationofcDNAends)技术 ,扩增克隆了鸡心肌MnSOD 990bp的 3′cDNA片段 .再根据 3′RACE片段测序结果设计引物进行 5′RACE ,结果获取了一个与 3′RACE片段相互重叠的鸡心肌MnSOD 52 1bp的 5′RACE片段 ,并对其进行了克隆测序 .最后根据 3′RACE片段和 5′RACE片段序列信息进行拼接 ,从而获取鸡MnSODcDNA的全序列信息 .研究结果表明 :鸡MnSODcDNA全长为 110 8个核苷酸 ,其中 5′非翻译区 2 5个核苷酸 ,编码区 675个核苷酸 ,3′非翻译区 4 0 8个核苷酸 ,编码一个长 2 2 4个氨基酸残基的蛋白质前体 .其中信号肽长 2 6个氨基酸残基 ,成熟肽长 198个氨基酸残基 ,分子量为 2 2kD .与人、大鼠、线虫、果蝇等真核生物MnSOD氨基酸序列的同源性分别为82 4 %、84 .7%、62 .4 %、59.3% .  相似文献   

12.
核转录因子κB抑制因子α(IκBα)是NFκB/IκB信号传导通路的重要成员,参与机体抗细菌感染等多种免疫反应,可通过蛋白质间的相互作用结合核转录因子NFκB,从而调控生物体多种免疫基因表达。该研究采用RACE技术从香鱼中克隆得到核转录因子κB抑制因子PaIκBα基因的cDNA全长序列(1341bp,GenBank Accession No.JN801027),开放阅读框ORF为936bp,编码311个氨基酸,5’非编码区为64bp,3’非编码区为341bp。生物信息学分析表明,香鱼IκBα蛋白的序列中包含5个保守的锚蛋白重复序列,N末端含有信号诱导蛋白,C末端含有PEST序列。同源性比对结果表明,香鱼IκBα蛋白与胡瓜鱼IκBα的同源性最高,为95%;其次是大西洋鲑、虹鳟、尼罗罗非鱼和鳜鱼等,同源性分别为76%、75%、70%和68%。系统进化树分析表明,香鱼IκBα蛋白与胡瓜鱼、虹鳟、尼罗罗非鱼、鳜鱼和大西洋鲑等亲缘关系最近。RT-PCR分析表明,PaIκBα基因在香鱼肝脏、肾脏、脾脏和鳃中表达水平较高,其次是肠、脑和肌肉,在心脏中表达极少。嗜水气单胞菌(Aeromonas hydrophil)感染香鱼后,PaIκBα基因表达增强,感染24h达最大值,表明PaIκBα基因在香鱼受到嗜水气单胞菌刺激的免疫过程中可能发挥着重要作用。  相似文献   

13.
对蛙病毒 (TFV)核糖核酸酶Ⅲ基因序列进行分析。TFV基因组中含有完整的核糖核酸酶Ⅲ基因序列 ,全长为 1113bp ,GC含量为 5 6 .6 3%。其推定蛋白质的分子量为 4 0 .4 7kD ,等电点为7.99。序列结构分析发现在编码区的下游有可形成茎环的反向重复序列和形成发夹结构的回文序列。与其它物种相比 ,TFV与虹彩病毒的LCDV 1和CIV的核糖核酸酶Ⅲ基因的氨基酸序列同源性较高 ,与酵母、线虫等物种的相应基因的同源性较低  相似文献   

14.
以低繁藏山羊和高繁金堂黑山羊为研究对象,分别提取处于发情期的5只藏山羊和5只金堂黑山羊的卵巢、子宫、输卵管、垂体的总RNA,并通过RT-PCR技术对MSH4、MSH5基因c DNA进行克隆、序列分析,以Real-time PCR技术对其进行组织表达研究。结果表明,藏山羊和金堂黑山羊MSH4基因编码区均长2 499 bp,编码832个氨基酸,两品种基因编码区有5处碱基不同,并导致3处氨基酸的差异;MSH5基因编码区均长2 496 bp,编码831个氨基酸,两品种基因编码区有9处碱基不同,并导致5处氨基酸的差异。藏山羊MSH4基因编码区核苷酸序列与金堂黑山羊、山羊、绵羊、牛、马、小鼠、褐家鼠、人的同源性分别为:99.8%、99.8%、99.4%、98.1%、94.4%、85.1%、84.7%和93.5%;藏山羊MSH5基因编码区核苷酸序列与金堂黑山羊、山羊、牛、家犬、小鼠、褐家鼠、人的同源性分别为:99.6%、99.6%、97.3%、88.0%、85.8%、85.3%和90.2%。MSH4和MSH5基因m RNA在两个山羊品种的卵巢、子宫、输卵管、垂体中均有表达,但两品种间无显著性差异(P0.05)。说明MSH4和MSH5基因在动物进化中比较保守,与山羊多羔性状的相关性有待进一步研究。  相似文献   

15.
编码序列和非编码序列的3-tuple分布特征   总被引:2,自引:0,他引:2  
傅强  钱敏平  陈良标  朱玉贤 《遗传学报》2005,32(10):1018-1026
非编码序列,特别是内含子的起源,是一个重要的悬而未决的问题。首先通过计算模式生物的编码序列和非编码序列的不同阅读框中3-tupie的频率分布,发现编码区中不同阅读框具有十分不同的3-tuple分布,而在非编码区中,不同阅读框的3-tuple分布几乎相等,并且这一性质不具有物种依赖性。为了描述分布差异的程度,引进夏量一对称相对熵,并通过比较原核生物和真核生物,发现无论是编码区还是非编码区,原核生物都具有比真核生物更高的SRE值。进一步研究表明,某一生物的SRE值与该生物全基因组中编码区所占的百分比存在一定的相关性(相关系数为0.86)。计算机模拟进化实验发现,2%的突变就足以使典型的嗯核生物编码区高SRE值变为真核生物内含子区特有的低SRE值。比对数据库中已经注释的内含子和编码区序列,证明确实有一部分与编码区具有很高同源性的内含子序列。实验表明,至少部分真核生物的内含子可能起源于编码序列,同时也说明SRE可能被用于研究物种基因组序列的进化。  相似文献   

16.
运用SMART RACE RT-PCR技术与DNA步移技术,首次从球孢白僵菌中克隆出完整的热休克蛋白基因Bbhsp70编码区序列及上游序列。该基因cDNA全长2405bp,5′端非翻译区171bp,3′端非翻译区263bp,开放阅读框(ORF)1971bp,编码656个氨基酸。成熟蛋白理论分子量为71.3kDa,理论等电点为4.92。上游序列长度3559bp,其中有305bp序列与cDNA序列重叠。分析表明,上游序列中没有明显的TATA-盒和CAAT-盒,但含有CCAAT-bindingfactor、GC-box等重要的转录因子结合位点,以及热激应答元件(HSE)和GATA元件等启动子顺式调控元件。  相似文献   

17.
利用染色体步移PCR检测辐射松的单核苷酸多态性   总被引:1,自引:0,他引:1  
李伟  李慧  陈晓阳 《西北植物学报》2007,27(8):1571-1576
用染色体步移技术(chromosome walking)的基本原理以辐射松(Pinus radiata)肌动蛋白基因(actin)为例,利用获得的EST序列设计定向引物,向上游和下游进行了染色体序列的步移.获得了包括启动子、5′端非编码区和编码区及3′端非编码区辐射松肌动蛋白基因基因组序列2154 bp.通过对200株不同辐射松个体进行PCR扩增及测序,共获得了21个SNPs,其中启动子区域3个,编码区15个,3′端非编码区4个.实验结果为今后染色体步移技术在基因非编码区SNP的检测提供了理论与技术参考.  相似文献   

18.
青花菜雄性不育相关基因BoDHAR的克隆与表达分析   总被引:2,自引:0,他引:2  
以一个与甘蓝显性核不育相关的差异表达片段的序列为信息探针,通过在NCBI与TAIR网站数据库中进行同源EST序列搜索,经人工拼接、RT-PCR、PCR克隆与序列分析,获得了青花菜脱氢抗坏血酸还原酶DHARdehydroascorbatereductase基因的cDNA与DNA全长序列,命名为BoDHAR。并利用双链接头介导PCR的染色体步行技术(genomewalking)克隆了其上游644bp的5′端序列。所获的BoDHAR基因全长1486bp,存在两个内含子,DNA编码区序列633bp,编码210个氨基酸;序列分析表明BoDHAR与同源基因AT1G19570.1cDNA序列有82.3%的一致性,推导的氨基酸序列有79.6%的一致性;编码的水溶性蛋白存在多个磷酸化位点;5′端上游区存在明显的转录调控序列。半定量RT-PCR结果表明BoDHAR在可育系花蕾中的表达量明显高于不育系花蕾,在花药中的表达明显高于其它部位。  相似文献   

19.
中华蜜蜂蜂毒镇静肽基因的cDNA克隆和表达   总被引:5,自引:0,他引:5  
从中华蜜蜂 (Apisceranacerana)工蜂毒腺中快速抽提总RNA ,用RT PCR扩增得到大小约为2 5 0bp的cDNA片段 ,测序得到的片段长度为 2 34bp ,为蜂毒前镇静肽原 (preprosecapin)基因编码区的cDNA .以 3′RACE方法 ,扩增和测定了 3′端非编码区 2 19bp序列 .中蜂前镇静肽原cDNA序列与已报道的欧洲意蜂该基因cDNA序列具有 92 %同源性 ,氨基酸序列具有 87%同源性 .代表成熟肽镇静肽的最后 2 5个氨基酸序列 ,中蜂与意蜂同源性为 88% .3′端非编码区cDNA序列与欧洲意蜂序列有 73 1%同源性 .将中华蜜蜂蜂毒镇静肽成熟肽编码区与 3′非编码区部分克隆 ,构建了镇静肽与谷胱甘肽转移酶融合表达的载体pGEX AcSecapin .将载体转化大肠杆菌BL2 1(DE3)进行融合表达 .表达产物与抗GST抗体在 2 9kD处有很强的交叉反应 .大肠杆菌超声破碎后的上清液用SDS PAGE检测到表达的蛋白多为可溶性融合蛋白 ,通过亲和层析柱纯化和凝血酶的切割得到了镇静肽蛋白  相似文献   

20.
长非编码RNA     
人类基因组序列的约5%~10%被稳定转录,蛋白质编码基因仅约占1%,其余4%~9%的序列虽能转录,但转录物功能尚不明确。尽管如此,已确证在非蛋白质编码转录物中,含有具备调节功能的非编码RNA(noncoding RNA,ncRNA)。与具有调节功能的短链非编码RNA[如微RNA(microRNA)、小干扰RNA(siRNA),、Piwi-RNA]相比,长非编码RNA(long noncoding RNA,lncRNA)在数量上占大多数。lncRNA通过多种方式产生,以多种途径调节靶基因表达,参与调控生物体生长、发育、衰老、死亡等过程;lncRNA功能异常往往导致疾病发生。本文综述了lncRNA的起源、分类、作用分子机制及lncRNA异常与疾病的相关性等内容,旨在充分了解这一重要新型调控分子。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号