首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 609 毫秒
1.
张德礼  李衍达  季梁 《遗传学报》2004,31(4):325-334
采用生物信息学分析与实验确认相结合的技术路线,通过所识别的基因在非冗余数据库比对发现了网上公布的计算机注释人类基因组编码序列存在各种类型的多处错误。该策略既有助于发现更多的人类新基因,又有助于纠正美国国家生物技术信息中心(NCBI)基因组注释项目公布的参考序列(REFSEQs)中所存在的错误。比如他们采用基因预测方法通过自动计算分析从NCBIcontig NT_010808预测到两个模式参考序列LOC124919和LOC147007,本该都是C17orf32,但却都是C17orf32的不同错误形式,分别为第1和2类型错误;再如,他们采用基因预测方法通过自动计算分析从NCBIcontig NT_004511预测到3个模式参考序列LOC14907、LOC200084和LOC91126,实际上都是.ZNF362一种基因,却提交了ZNF362的3种不同错误形式,分别为第4、5和7类型错误。本研究利用计算机识别并结合实验验证能够纠正或避免现有的人类基因组编码序列错误。以前公开发表的文献没有明确指出NCBI人类基因模式参考序列存在错误,因此直当慎重看待计算机注释的可能存在各种类型错误的人类基因组编码序列。人类新基因的正确识别和注释仍是一项长期而繁重的任务。  相似文献   

2.
目的:对引进的一株辛德毕斯病毒的基因组序列进行测定,阐明其与已报道毒株序列的关系。方法:对辛德毕斯病毒基因组编码区进行分段RT-PCR扩增,对非编码区采用RACE法进行扩增,将扩增产物直接进行测序,应用DNAStar软件将测序结果拼接得到基因组序列,采用MEGA3.1软件对9株辛德毕斯病毒基因组序列进行系统进化发生树的构建。结果与结论:此株辛德毕斯病毒基因组共11663nt,编码3745个氨基酸残基,其中5'端的2/3基因组编码4种非结构蛋白NSp1、NSp2、NSp3和NSp4,3'端的1/3基因组编码5种结构蛋白E1、E2、E3、6K和C;结构基因和非结构基因之间有48nt的连接区为非翻译区;病毒基因组5'末端和3'末端分别有59、318nt的非编码区;序列同源性分析结果表明,此株病毒与S.A.AR86株的同源性最高,两者核苷酸序列的同源性为99.7%,氨基酸序列的同源性为99.6%,而与本室保存的另一辛德毕斯病毒MEI株的遗传进化关系稍远,系统进化发生树处于不同分支上。  相似文献   

3.
本文利用同位素代谢标记在HEV感染85~10.5,6.5~7.5h分别检测到1及2个亚基因组RNA,而感染21h后及在成熟的病毒颗粒内未能检测到亚基因组RNA。通过杂交实验,发现HEV的亚基因组RNA具有典型的共3′端的半套式结构,且基因组RNA与亚基因组RNA的5′端不存在共同的引导序列。通过紫外转录图谱发现HEV的亚基因组RNA是通过独立转录的方式产生的。利用引物延伸反应发现两种亚基因组RNA的转录起始位点分别位于RNA聚合酶区及非结构区、结构区的基因间序列。  相似文献   

4.
张静  蔡军  李衍达 《中国科学C辑》2007,37(2):198-203
可变翻译事件是基因翻译过程中的一种非常重要的机制, 它可以增加基因产物的多样性. 虽然目前报道了一些可变翻译基因, 但是这些研究提供的信息还十分有限, 并不足以推广到整个基因组水平. 已知的可变翻译的基因数目很少, 因此对可变翻译机制的了解也是非常有限的, 这就需要发现更多的可变翻译基因. 然而, 依靠传统的实验方法去发现可变翻译基因十分费时费力, 因此通过系统地研究公共数据库中的大量已测序的蛋白质序列, 并且预测了1237个蛋白质簇作为可变翻译基因. 计人类基因组中大约有8%~10% 的基因会发生可变翻译现象. 这个结果大大地提高了可变翻译基因的数量级, 意味着可变翻译在基因的翻译过程中是一个十分普遍的现象.  相似文献   

5.
人类蛋白编码基因局部GC水平相关性分析   总被引:2,自引:0,他引:2  
陈祥贵  胡军  杨潇 《遗传》2008,30(9):1169-1174
GC含量是基因组DNA序列碱基组成的重要特征, 蕴涵基因结构、功能和进化信息。文中通过从公共数据库提取7 992个非冗余的人类蛋白质编码基因DNA序列, 分析了基因序列不同区域的局部GC含量和相关性。结果表明: 基因局部GC含量呈现不均一性, 5′非翻译区GC水平最高, 为62.56%; 而3′非翻译区GC水平最低, 为43.97%。3′侧翼序列的GC含量能较好地代表基因所在区域DNA长片段的GC水平。虽然开放阅读框的GC含量比内含子、3′非翻译区和3′侧翼序列的GC含量高, 但4个区域的GC含量之间均存在较高的相关性。密码子第三位置的平均GC含量(GC3)为58.09%, 显著高于密码子第一位置和第二位置的GC含量, 且与开放阅读框的GC水平高度相关, 相关系数高达0.91。GC3与内含子、3′非翻译区、3′侧翼序列的GC水平相关性也较高, GC3对3′侧翼序列的GC含量的直线回归斜率为1.25。因此, GC3可作为基因所在区域GC水平变化的敏感性指标。而密码子第一位置和第二位置以及5′侧翼序列和5′非翻译区GC水平与基因其他区域的GC水平的相关性较弱。该研究结果提示: 基因蛋白编码区密码子第三位置、内含子、3′非翻译区和3′侧翼序列的碱基可能经历了相近的进化过程, 而蛋白编码区密码子第一位置和第二位置、5′侧翼序列和5′非翻译区由于功能的需要而经历了不同的突变和选择。  相似文献   

6.
随着人类及其他多种模式生物基因组计划所取得的重大进展 ,目前 ,基因组研究正处于一个从“序列基因组”研究向“功能基因组”研究的重大转折时期。诚然 ,通过“序列基因组”研究可以了解到大量的有关组成基因组所有核苷酸排列顺序的信息 ,但是 ,我们对由这些核苷酸所组成的基因的功能及这些基因的时空表达顺序却知之甚少。比如 ,通过人类基因组计划可以知道组成人类基因组的大约 3 0亿个核苷酸在染色体上是如何排列的 ,而由这些核苷酸可构成哪些基因 ?这些基因具有何种功能 ?这些基因在不同的组织、不同的发育阶段又是如何表达的 ?这正是“…  相似文献   

7.
高等植物基因组中,大部分序列为非表达序列,基因序列所占的比例很小,了解基因在基因组中的分布是研究基因组结构的一个重要方面。在美国能源部资助下,一个毛果杨无性系的基因组测序已经完成并对公众发布。杨树全基因组序列的完成,为我们了解林木基因组中基因的分布提供了一个特例。在本文中,我们利用泊松分析对杨树基因组中基因在各个染色体上的密度进行了检测,结果表明杨树基因组中各条染色体的基因含量存在显著差异。杨树全基因组测序项目揭示现代杨树基因组起源于一次古全基因组复制事件(称为杨柳科基因组复制),所以杨树基因组不同染色体间存在很大的同源复制片段。但是我们的研究显示,杨树基因组中大多数高度同源的染色体上基因的密度与染色体间的同源性没有明显关系,这说明杨柳科全基因组复制事件后,各个高度同源染色体上的基因发生了流失,且基因流失的速率是不一样的。同时本文还对近九万条毛果杨EST序列进行了比对分析,结果显示这些EST序列覆盖的基因仅占杨树基因组中基因总数的16.8%左右。EST测序虽然是发现基因的一个重要手段,但小规模EST测序对基因的覆盖度很低,所以小规模EST测序的应用价值是有限的。  相似文献   

8.
非编码RNA与哺乳动物基因组印记的起源   总被引:2,自引:0,他引:2  
基因组印记是由亲本来源不同而导致等位基因表达差异的一种遗传现象,主要发生在胎盘哺乳动物(真哺乳类)和显花植物中.大部分印记基因都分布在印记基因簇内,其中包含大量的非编码RNA基因.印记基因的表达受印记控制区(ICRs)的顺式调控.基因组印记产生的原因及过程是现代遗传学研究的一个热点问题,分析印记同源区从非印记物种到印记物种的过渡,为解决这一问题提供了重要启示.最近,原始哺乳动物(有袋类和单孔类)模式物种全基因组测序的完成,极大地促进了印记同源区的比较分析研究.本文对这些研究进行了回顾和分析,发现非编码RNA与哺乳动物基因组印记获得关系密切.主要依据为:(1)伴随着基因组印记的获得,印记区有大量的非编码RNA新基因出现;(2)与基因组印记相关的一些保守非编码RNA的表达发生了显著变化.此外,对15种脊椎动物中印记snoRNA基因系统分析的结果表明:印记snoRNA起源于真哺乳类与有袋类动物分化之后,并且在真哺乳类辐射进化之前发生了迅速的扩张,主要的基因家族在这一时期已经形成.这些结果进一步证明了非编码RNA与基因组印记获得的密切联系.非编码RNA可能主要通过调控印记表达和诱导染色体表观遗传修饰两种机制,参与哺乳动物基因组印记的获得.  相似文献   

9.
登革病毒基因组核苷酸序列与血清学分型的相关性研究   总被引:1,自引:0,他引:1  
为证明登革病毒基因组核苷酸序列与病毒血清学分型的相关性,本文以病毒全基因组和病毒5′末端非编码区,E蛋白,NS1蛋白和3′末端非编码区四个基因区段分别进行病毒型间比较.比较结果表明病毒全基因组和病毒的各个基因区段均明显分为相互独立的4个分支,与病毒血清型分型完全吻合,不存在型间重组的现象.文章进一步分析了各型登革病毒型内核酸序列的相似性和型内病毒重组的可能性.  相似文献   

10.
扩展青霉PF898碱性脂肪酶基因组DNA的克隆及序列分析   总被引:6,自引:0,他引:6  
扩展青霉 (Penicilliumexpansum)PF898可产生一种具有重要工业生产价值的碱性脂肪酶(PEL) .在通过 3′RACE和 5′RACE获得PEL完整的cDNA序列的基础上 ,通过PCR方法首次克隆了该脂肪酶的完整的基因组DNA序列 (GenBank登录号为AF330 6 35 ) .该脂肪酶DNA全长 14 0 4bp ,包括PEL编码区、3′非翻译区和部分 5′非翻译区基因的序列 .编码区DNA由 1135个碱基组成 ,含有 5个内含子 ,大小分别为 5 8bp、4 7bp、5 0bp、5 6bp和 6 9bp .在已报道的丝状真菌脂肪酶中 ,PEL基因的内含子数量最多 ,而其大小与其它丝状真菌脂肪酶基因的内含子一样 ,均为只有几十个碱基的小内含子 .PCR扩增获得的PLEDNA序列还包括由 195个碱基组成的 3′端非编码区序列 ,74个碱基的部分 5′端非编码区序列 .PELDNA全长序列中的 - 2 4至 - 2 7nt为TATAbox ,终止码TGA下游15 6nt出现AATAAA序列 ,TGA下游 182位出现poly(A)尾 ,为典型的真核基因结构 .同源性序列分析表明 ,PEL与其它真菌来源脂肪酶的基因组DNA序列同源性约为 39%~ 4 9% ,PEL内含子之间或PEL内含子与其它丝状真菌脂肪酶基因的内含子之间的序列同源性约 4 2 %~ 5 7% .  相似文献   

11.
Chen Z  Xiu MH  Li SF  Xu M 《生理科学进展》2010,41(5):329-334
G-四联体是一种特殊的核酸二级结构,广泛存在于人类基因组DNA以及RNA中,如DNA的端粒序列、基因的启动子序列、RNA的5'端非翻译区(5'UTR)序列等。许多研究发现,G-四联体结构在基因的稳定性、端粒合成过程、基因转录和翻译水平的表达调控、基因重组等生命过程中起着至关重要的作用。目前的研究主要涉及DNA中的G-四联体、RNA中的G-四联体以及人工设计的G-四联体寡聚核苷酸,本文将从这三个方面介绍G-四联体的生物学功能相关研究进展。  相似文献   

12.
为了解2013年广东省引起手足口病的CVA6全基因组特征,探索研究暴发流行期与非流行期CVA6毒株间的基因异同,本研究选取18株广东省CVA6毒株进行全基因组序列扩增及测序,采用DNASTAR6.0、MEGA5.2和SimPlot3.5.1等软件对获取全基因组序列进行遗传进化、比对及重组分析。序列比对显示,18株广东省CVA6毒株基因组长度在7 390~7 392bp之间,与原型株Gdula比较,在编码区无碱基插入或缺失,在非编码区存在个别碱基的插入或缺失。遗传进化分析显示,18株广东省CVA6毒株全基因组序列核苷酸和氨基酸同源性分别为90.5%~99.6%和97.5%~99.9%。2013年广东省CVA6流行期毒株在全基因组进化树中处于Ⅲ、Ⅳ两个分支,2011年非流行期毒株只存在于Ⅳ分支。基因重组分析显示,广东省GD870/2013株在P2和P3区存在基因重组现象,GD839/2013株未发现明显的重组来源。结果表明,2013年广东省引起手足口病的CVA6在暴发流行期存在Ⅲ、Ⅳ两条病毒传播链的共同流行,其中Ⅲ传播链在非结构蛋白编码区存在基因重组现象,与Ⅳ传播链相比具有较大基因差异,然而2011年CVA6非流行期间只存在Ⅳ病毒传播链。  相似文献   

13.
【目的】鉴定洛斯里被毛孢OWVT-1菌株的线粒体基因组,验证公布的USA-87-5菌株线粒体基因组中的错误,对洛斯里被毛孢正确的线粒体基因组序列进行注释并开展不同被毛孢物种间的比较线粒体基因组学分析。【方法】借助DNA高通量测序数据并通过必要的Sanger测序组装OWVT-1的线粒体基因组。通过PCR验证OWVT-1与公布的USA-87-5线粒体基因组序列差异的真实性。利用多种生物信息方法分析和注释洛斯里被毛孢的线粒体基因组。【结果】公布的洛斯里被毛孢USA-87-5菌株的线粒体基因组存在几处序列错误,包括3处长片段的插入缺失和多处短片段的插入缺失。实际上,洛斯里被毛孢USA-87-5与OWVT-1菌株的线粒体基因组序列完全相同。该菌的线粒体基因组全长62949 bp,在7个基因中共插入13个内含子,部分内含子和基因间区显现出序列退化的特征。洛斯里被毛孢、明尼苏达被毛孢、线虫被毛孢的线粒体基因组具有较强的共线性关系。除一些独立的ORF外,核心蛋白编码基因、rRNA基因和tRNA基因的排列顺序非常保守。基因间区的长短是影响3种被毛孢线粒体基因组大小最主要的因素。【结论】公布的洛斯里被毛孢USA-87-5菌株线粒体基因组中存在序列错误。本文新报道了OWVT-1菌株的线粒体基因组,并进行注释和比较线粒体基因组学分析。  相似文献   

14.
为证明登革病毒基因组核苷酸序列与病毒血清学分型的相关性,本文以病毒全基因组和病毒5'末 编码区,E蛋白,NS1蛋白和3'末端非编码区四个基因区段分别进行病毒型间比较。比较结果表明病毒全基因组和病毒的各个基因区段均明显分为相互独立的4个分支,与病毒血清型分型完全吻合,不存在型间重组的现象。文章进一步分析了各型登革病毒型内核酸序列的相似性和型内病毒重组的可能性。  相似文献   

15.
piggyBac转座子在牛基因组的整合位点及特征分析   总被引:1,自引:0,他引:1  
piggyBac(PB)转座子作为一种遗传工具被广泛应用于多个物种的转基因及插入突变研究, 目前PB转座子在牛中的相关研究还较少。为了获得PB转座子在牛基因组中的整合位点, 总结其转座特征, 文章构建了PB[CMV-EGFP]和pcDNA-PBase二元转座系统, 利用细胞核电转技术共转染牛耳组织成纤维细胞, 经G-418筛选, 获得了稳定转染EGFP的转基因细胞系; 提取细胞基因组DNA, 利用基因组步移技术扩增PB转座子5′ Bac区插入位置的DNA序列; 通过与牛基因组序列进行BLAST比对, 得到PB转座子在牛基因组中的插入位点。文章共获得了8个有效的整合位点, 但仅有5个位点定位到染色体1、2、11和X染色体上。序列分析表明:在牛基因组中, PB转座子可特异性的插入到“TTAA”位置, 并整合到基因间的非调控区; 分析整合位点“TTAA”相邻一侧的5个碱基组成, 发现PB转座子5′端倾向于插入到GC(62.5%)碱基富集区。该研究表明, PB转座子可以在牛基因组中发生转座, 获得的整合位点信息为利用PB转座子在牛上开展遗传学研究提供了理论参考。  相似文献   

16.
突变热点区域是基因突变相对集中的区域,在生物的遗传和变异中有特殊的地位.针对特殊条件下发生突变形成的突变热点区域进行了相关研究.而人类基因组序列的测定和人类基因框架图的绘制,为在全基因组范围内进行突变热点研究提供了条件.分析了人类基因组中2 831个基因突变热点区域上简并度的性质,对突变热点区集中在高简并度区或者低简并度区的基因生物学功能进行了分析和分类.研究的焦点集中在某类功能的基因简并度特性一致的情况上.对搜集到的基因简并度特性利用聚类计算进行分析,找到了一些特殊的功能类,属于其中某类功能的基因能够通过聚类分析聚合到一起,从而说明简并度特性也是相近的,这为从基因的简并度特性预测表达物的功能提供了线索.  相似文献   

17.
采用普通PCR扩增、SHOT-GUN测序、软件拼接首次获得了池蝶蚌(Hyriopsis schlegelii)线粒体基因组全序列。线粒体基因组全长为15939 bp,由13个蛋白质编码基因、22个tRNA基因、2个SrRNA基因和28个长度为1—393 bp的非编码区组成;除ND3-ND5、ND4L、ATP6、ATP8、COX1-COX3、tRNA-D、tRNA-H之外,其他大多数基因在L链编码。池蝶蚌线粒体全基因组序列、蛋白编码基因、tRNA基因、rRNA基因及非编码区的A+T含量分别为60.36%、59.84%、61.7%、60.23%及62.5%,与其他淡水蚌类一致,均表现出A+T偏好性,淡水蚌类线粒体基因组长度的差异主要表现在非编码区长度的差异。池蝶蚌mtDNA的COX2-12SrRNA区域基因排列存在差异,是ND3、tRNAHis、tRNAAla、tRNASer1、tRNASer2、tRNAGlu、ND2、tRNAMet 8个基因发生重组造成。22个tRNA基因都具有典型的三叶草二级结构,tRNA-E与tRNA-W间的非编码区含有一个ORF区,而控制区并未发现。从GenBank上下载的14种双壳纲贝类的mtDNA序列构建的系统进化树,显示池蝶蚌与三角帆蚌亲缘关系最近。研究结果为淡水珍珠蚌线粒体基因重排及进化特征提供理论依据。  相似文献   

18.
植物抗性基因研究新趋势   总被引:5,自引:0,他引:5  
多种生物基因组的大规模测序结果表明,抗性基因在基因组上成簇存在,从结构基因组、比较基因组、功能基因组与生物信息学等方面论述了植物抗性基因研究的新趋势。  相似文献   

19.
目前,在植物系统发育研究中应用较多的核基因组的核糖体DNA基因间隔区序列主要有5S rDNA基因间隔区、内转录间隔区ITS和基因间间隔区IGS.虽然这些间隔区序列在长度、结构等方面各不相同,但都具有进化速率较快的特点,在植物属及属下分类水平的系统发育关系研究中非常有用.本文重点就核基因组的5S rDNA基因间隔区以及IGS在植物中的特点以及各自在植物系统发育研究中的应用进行了综述.  相似文献   

20.
张乃心  张玉娟  余果  陈斌 《昆虫学报》2013,56(4):398-407
研究双翅目昆虫线粒体基因组的结构特点, 并设计其测序的通用引物, 为今后双翅目昆虫线粒体基因组的研究提供参考和依据。利用比较基因组学和生物信息学方法, 分析了已经完全测序的26个双翅目昆虫线粒体基因组的结构特点、 碱基组成和保守区, 并据此设计了双翅目昆虫基因组测序的通用引物。结果表明: 双翅目昆虫线粒体基因组长14 503~19 517 bp, 其结构保守, 含有37个编码基因, 包括13个蛋白质编码基因, 22个tRNA编码基因和2个rRNA编码基因, 此外还包含一段长度差异很大的非编码区(AT富含区)。基因组内基因排列次序稳定, 除个别基因外, 其余都与黑腹果蝇Drosophila melanogaster基因排列次序一致。基因组的碱基组成不均衡, AT含量在72.59%~85.15%之间, 碱基使用存在偏向性, 偏好使用AC碱基。全基因组的核苷酸和氨基酸序列保守, 共鉴定了11个保守区。在保守区内共设计了26对双翅目线粒体基因组测序通用引物, 扩增的目标片段都在1 200 bp以内。将该套通用引物用于葱蝇Delia antiqua线粒体全基因组测序, 结果证明其高效、 合用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号