首页 | 本学科首页   官方微博 | 高级检索  
     

基于RefSeq数据库的人类标准转录数据集的构建
作者姓名:李稚锋  李玉鉴  赵东升  杭兴宜  王正志  骆志刚  张成岗
作者单位:1. 军事医学科学院放射与辐射医学研究所,北京100850;2. 国防科技大学机电工程与自动化学院,长沙410073;3. 北京工业大学计算机学院,北京 100822;4. 军事医学科学院卫生勤务与医学情报研究所,北京 100850;5. 国防科技大学并行与分布处理国防科技重点实验室,长沙 410073
基金项目:国家重点基础研究发展计划(973计划),国家科技攻关项目,国防科技重点实验室基金,中国教育网格生物信息学网格项目
摘    要:
美国国家生物信息技术中心(NCBI)提供了具有生物意义上的非冗余的基因和蛋白质序列的RefSeq参考序列数据库。然而,由于基因普遍存在的多态性以及不同实验室对于序列测定的质量控制存在差异等原因,已发现RefSeq数据库可能存在部分质量问题。文章基于“中心法则”提出“标准转录数据集”的概念,以人类基因和基因组序列为例,利用BLAT、Sim4和自行设计的EIparser等基因结构解析程序分析了RefSeq人类基因转录数据(2005-4-18)与目前所公布的人类标准基因组(2005-4-20)的对应关系。对于有实验证据支持的标记为NM_和NR_的记录,多种程序分析结果表明其与标准基因组完全相对应的记录为9 771个;符合多个程序修订标准的记录10 943个;而与标准基因组有较大差异的记录为203个,多种程序分析结果不一致的记录为2 676个,提示研究人员在使用此非标准转录组数据时,必须考虑到其存在非标准转录的原因甚至存在错误的可能性。本文为基于标准、高质量转录数据集的生物信息学数据分析、分子生物学实验设计、基因多样性和遗传变异分析等提供了重要的参考标准。相关结果可通过http://biocompute.bmi.ac.cn/transcriptome/index.htm访问。



关 键 词:人类标准转录数据集  质量控制  转录组  RefSeq数据库  
文章编号:0253-9772(2006)03-0329-05
收稿时间:2005-03-16
修稿时间:2005-07-12
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《遗传》浏览原始摘要信息
点击此处可从《遗传》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号