首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到6条相似文献,搜索用时 93 毫秒
1.
张德礼  季梁  李衍达 《遗传学报》2004,31(5):431-443
采用生物信息学分析与实验确认相结合的技术路线,通过所识别的基因在非冗余数据库比对发现了网上公布的计算机注释人类基因组编码序列存在各种类型的多处错误,包括cDNA水平的一个或一段碱基插入、缺失或突变,或是这些错误的不同排列组合,其中以错误插入为多,往往导致编码氨基酸的移码突变。最先举证了NCBIGENOME Annotation Project预测人类新基因的下列错误类型:(1)开放读码框架(0RF)中错误插入一个碱基造成编码氨基酸移码;(2)错误拼接;(3)开放读框中错误插入一个或一段碱基造成该读框提前终止。只编码N-端氨基酸的cDNA序列而不完整;(4)只有编码c一端氨基酸序列的cDNA而不完整;(5)只是正确基因0RF中间的一段编码蛋白cDNA序列而不完整,缺N-端与C-端氨基酸序列,并且将不完整蛋白氨基酸序列的第一个非起始码氨基酸错误地预测为起始码氨基酸,如将L错误地预测为M;(6)开放读框中错误插入一个或一段碱基造成前面出现不该有的终止码,因而编码蛋白缺开头部分氨基酸;(7)可能将污染基因组序列当作完整基因cDNA序列对待而预测出所谓单一外显子基因。即便真是基因,也只是较长单一外显子mRNA中有一小0RF,而0RF起始码上游同一相位确实存在终止码,无其他特点符合基因条件;(8)所预测基因只有0RF,而0RF两端没有任何EST证据,可据此0RF拼接出受EST和人类基因组双重支持的完整基因cDNA(开放读框上游同一相位有终止码),预示所预测0RF参考序列可能不正确;(9)有EST实验证据支持存在基因的人类基因组序列范围内又被预测出一条相似但更小的蛋白编码基因,因而新预测基因有可能是错误的。  相似文献   

2.
人类新基因C17orf32的电子克隆和编码区序列RT-PCR验证   总被引:16,自引:3,他引:16  
利用生物信息学与实验验证的技术路线,成功地克隆了人类新基因C17orf32的cDNA(GenBank登记号:AY074907和TPA: BK000260),发现C17orf32的完整开放阅读框架(ORF,31~657 bp)cDNA(627 bp)与人类假定基因LOC124919 ORF(25~807 bp)的25~651位只有一个碱基不同.经RT-PCR验证并cDNA测序、人类表达序列标签(EST)数据库的BLAST检索和基因组成规律分析三方面的结果,均支持C17orf32的序列,而不支持LOC124919的编码序列.C17orf32基因组序列全长4.610 kb,含有6个外显子和5个内含子,cDNA序列全长1 679 bp, ORF横跨全部6个外显子.该基因ORF翻译起始处符合Kozak规则,ORF起始码上游同一相位有终止码,ORF后有2个加尾信号和PolyA尾.C17orf32基因的成功克隆表明,NCBI GENOME Annotation Project在2001年12月预测的人类假定蛋白XP-058865编码基因LOC124919的模式参考序列XM-058865中存在偏差,即在C17orf32基因cDNA的406与407位碱基之间错误插入一个碱基G, 从而导致在插入位点后,ORF编码125位氨基酸以后蛋白质序列的改变,出现260个氨基酸的多肽.因此,应慎重看待计算机注释的人类基因组编码序列.建立的技术路线有助于发现更多新的人类功能基因.  相似文献   

3.
目的:人和大鼠WIPI-3基因的电子克隆和序列分析。方法:综合运用基因电子拼接和比较基因组分析等生物信息学手段进行新基因的电子克隆和注释。通过拼接CR593190、NM 019613和BC00097 cDNA序列获得人WIPI-3 cDNA全长序列,通过拼接EST序列CB727439、CB737031、BF557312、BG663387和预测的CDS获得大鼠WIPI3基因的cDNA序列。结果:成功克隆了人和大鼠自噬相关新基因WIPI-3的cDNA,上述两个新基因序列均得到了人类基因组序列和EST序列的双重支持,另外经RT-PCR验证电子克隆的基因序列也是正确的,而且序列均已被GenBank收录,其编号分别为:AM182326和NM-001039587。其中,人WIPI-3基因修正了目前基因库中注释的WIPI-3序列,而大鼠基因则是国际上首次克隆,井被确定为参考序列。结论:基因电子拼接结合种属同源基因比较分析,可大大提高电子克隆的精确性,这种方法可有效用于新基因的克隆和注释。  相似文献   

4.
为研究胰凝乳蛋白酶原在鱼类中的生理功能和作用机制,利用生物信息学的方法,成功获得了鲤鱼两种胰凝乳蛋白酶原的cDNA序列(ccCHTR1和ccCHTR2)并对其进行序列分析。结果显示,ccCHTR1 cDNA含有792 bp的开放阅读框,编码263个氨基酸;ccCHTR2 cDNA含有798 bp的开放阅读框,编码265个氨基酸。二者氨基端均含有18个氨基酸组成的信号肽,同时,在成熟肽的第15和16个氨基酸(R-I)之间存在一个切割位点。氨基酸比对结果显示,ccCHTR1和ccCHTR2具备胰凝乳蛋白酶原的保守结构特征,同时二者有72.8%的同源性,且都与斑马鱼有最高的同源性,分别是93.3%和73.5%。进化分析显示,二者分别与斑马鱼和鳕鱼亲缘关系最近,与哺乳动物的亲缘关系较远。  相似文献   

5.
采用mRNA差异显示RT-PCR方法克隆到人呼吸道合胞病毒感染的SPC-A1细胞中相关的50个表达序列标签,其中一个片段g17-1在HRSV感染的细胞中高表达。利用生物信息学的方法对g17-1进行分析鉴定,推测是一个新基因。利用电子克隆,得到一全长2101bp的cDNA,对其ORF、启动子、电子表达谱、染色体定位以及所编码的蛋白进行分析,结果表明,该cDNA含有1个ORF,与人类假定蛋白XP_097121同源性达90%,定位于人17号染色体,在肿瘤细胞、腺癌细胞、扁桃体初级B细胞中表达,其编码的蛋白预测定位于细胞核内,推测其与细胞抗病毒感染有一定的关系。  相似文献   

6.
采用mRNA差异显示RT-PCR方法克隆到人呼吸道合胞病毒感染的SPC-A1细胞中相关的50个表达序列标签,其中一个片段g17-1在HRSV感染的细胞中高表达。利用生物信息学的方法对g17-1进行分析鉴定,推测是一个新基因。利用电子克隆,得到一全长2101bp的cDNA,对其ORF、启动子、电子表达谱、染色体定位以及所编码的蛋白进行分析,结果表明,该cDNA含有1个ORF,与人类假定蛋白XP_097121同源性达90%,定位于人17号染色体,在肿瘤细胞、腺癌细胞、扁桃体初级B细胞中表达,其编码的蛋白预测定位于细胞核内,推测其与细胞抗病毒感染有一定的关系。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号