首页 | 本学科首页   官方微博 | 高级检索  
   检索      

用电子克隆新基因C17orf32和ZNF362对NCBI人类基因数据库模式参考序列5种错误类型的分析与纠正
引用本文:张德礼,李衍达,季梁.用电子克隆新基因C17orf32和ZNF362对NCBI人类基因数据库模式参考序列5种错误类型的分析与纠正[J].遗传学报,2004,31(4):325-334.
作者姓名:张德礼  李衍达  季梁
作者单位:1. 清华大学信息科学技术学院自动化系生物信息学研究所信息科学技术国家实验室,智能技术与系统国家重点实验室,生物信息学教育部重点实验室,北京,100084;北京大学医学部,北京,100083
2. 清华大学信息科学技术学院自动化系生物信息学研究所信息科学技术国家实验室,智能技术与系统国家重点实验室,生物信息学教育部重点实验室,北京,100084
基金项目:国家自然科学基金资助项目 (编号 :3 0 2 70 3 42 ) ~~
摘    要:采用生物信息学分析与实验确认相结合的技术路线,通过所识别的基因在非冗余数据库比对发现了网上公布的计算机注释人类基因组编码序列存在各种类型的多处错误。该策略既有助于发现更多的人类新基因,又有助于纠正美国国家生物技术信息中心(NCBI)基因组注释项目公布的参考序列(REFSEQs)中所存在的错误。比如他们采用基因预测方法通过自动计算分析从NCBIcontig NT_010808预测到两个模式参考序列LOC124919和LOC147007,本该都是C17orf32,但却都是C17orf32的不同错误形式,分别为第1和2类型错误;再如,他们采用基因预测方法通过自动计算分析从NCBIcontig NT_004511预测到3个模式参考序列LOC14907、LOC200084和LOC91126,实际上都是.ZNF362一种基因,却提交了ZNF362的3种不同错误形式,分别为第4、5和7类型错误。本研究利用计算机识别并结合实验验证能够纠正或避免现有的人类基因组编码序列错误。以前公开发表的文献没有明确指出NCBI人类基因模式参考序列存在错误,因此直当慎重看待计算机注释的可能存在各种类型错误的人类基因组编码序列。人类新基因的正确识别和注释仍是一项长期而繁重的任务。

关 键 词:人类基因组  表达序列标签  计算机克隆  模式参考序列  生物信息学
文章编号:0379-4172(2004)04-0325-10

Correction of Five Different Types of Errors of Model Refseqs Appeared in NCBI Human Gene Database Only by Using Two Novel Human Genes C17orf32 and ZNF362
ZHANG De-Li.Correction of Five Different Types of Errors of Model Refseqs Appeared in NCBI Human Gene Database Only by Using Two Novel Human Genes C17orf32 and ZNF362[J].Journal of Genetics and Genomics,2004,31(4):325-334.
Authors:ZHANG De-Li
Institution:ZHANG De-Li~
Abstract:
Keywords:human genome  EST  in silico cloning  REFSEQs  bioinformatics
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号