首页 | 本学科首页   官方微博 | 高级检索  
   检索      

Unix文本比对分析高通量RNA-Seq测序基因表达
引用本文:宋东光,卢博彬,陈柳婷.Unix文本比对分析高通量RNA-Seq测序基因表达[J].生物信息学,2018,16(2):119-129.
作者姓名:宋东光  卢博彬  陈柳婷
作者单位:佛山科学技术学院园艺系
摘    要:从RNA-Seq高通量测序短序列进行比对及拼接获得较长转录本并确定基因表达量的方法随着转录组测序的广泛开展仍在不断改进,本文利用类Unix系统的文本处理命令组合对山茶花开花期叶片及花瓣的转录组序列进行比对、序列拼接及其表达量分析。首先对测序序列进行每1万条准随机排序,选取10万条序列分别与100万条序列进行比对,从每个查询序列随机选取9组20 mer比对100万条序列去重后获得该序列的转录数量。利用查询序列首尾20 mer从匹配的比对重叠群进行拼接,初次拼接最长为410 mer,超过两个及以上拼接序列的再次进行相互比对及再拼接,最长1 174 mer。用查询序列的比对匹配数表示其拼接前后的表达量,与用互补链进行比对得到的负链表达量相当。用拼接序列进行NCBI联网blast比对获得了其基因注释。本文得到的结果表明,利用类Unix系统文本比对可以有效用于高通量测序基因表达量及进行序列从头组装等分析。

关 键 词:RNA-Seq  文本比对  基因表达量  重叠群拼接  类Unix系统
收稿时间:2017/9/18 0:00:00
修稿时间:2018/1/23 0:00:00

Gene expression analysis from high-throughput RNa-Seq sequencing by Unix Text-aligning
SONG Dongguang,LU Bobin and CHEN Liuting.Gene expression analysis from high-throughput RNa-Seq sequencing by Unix Text-aligning[J].China Journal of Bioinformation,2018,16(2):119-129.
Authors:SONG Dongguang  LU Bobin and CHEN Liuting
Institution:Department of Horticulture, Foshan University, Foshan 528231, Guangdong, China,Department of Horticulture, Foshan University, Foshan 528231, Guangdong, China and Department of Horticulture, Foshan University, Foshan 528231, Guangdong, China
Abstract:
Keywords:RNA-Seq  Text-aligning  Gene expression  Contig-joining  Unix-Like system
本文献已被 CNKI 等数据库收录!
点击此处可从《生物信息学》浏览原始摘要信息
点击此处可从《生物信息学》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号