基因组二代测序数据的自动化分析流程 |
| |
作者姓名: | 李文轲 李丰余 张思瑶 蔡斌 郑娜 聂宇 周到 赵倩 |
| |
作者单位: | 1. 中国医学科学院, 北京协和医学院, 国家心血管病中心, 阜外心血管病医院, 心血管疾病国家重点实验室, 北京 100037;
2. 中南民族大学生物医学工程学院, 武汉430074 |
| |
基金项目: | 国家重点基础研究发展计划(973计划)项目(编号:2010CB529505);中央高校基本科研业务费专项资金(编号:2012-XHGX02)资助 |
| |
摘 要: | 二代测序技术的发展对测序数据的处理分析提出了很高的要求。目前二代测序数据分析软件很多, 但是绝大多数软件仅能完成单一的分析功能(例如:仅进行序列比对或变异读取或功能注释等), 如何能正确高效地选择整合这些软件已成为迫切需求。文章设计了一套基于perl语言和SGE资源管理的自动化处理流程来分析Illumina平台基因组测序数据。该流程以测序原始序列数据作为输入, 调用业界标准的数据处理软件(如:BWA, Samtools, GATK, ANNOVAR等), 最终生成带有相应功能注释、便于研究者进一步分析的变异位点列表。该流程通过自动化并行脚本控制流程的高效运行, 一站式输出分析结果和报告, 简化了数据分析过程中的人工操作, 大大提高了运行效率。用户只需填写配置文件或使用图形界面输入即可完成全部操作。该工作为广大研究者分析二代测序数据提供了便利的途径。
|
关 键 词: | 二代测序 自动化数据分析 流程 变异检测 |
收稿时间: | 2013-09-07 |
本文献已被 CNKI 等数据库收录! |
| 点击此处可从《遗传》浏览原始摘要信息 |
|
点击此处可从《遗传》下载全文 |
|