首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
证明噬菌体高通量测序中高频出现的序列即是噬菌体基因组的末端序列。在T3噬菌体基因组末端连接特异性序列接头,然后进行高通量测序,同时将不加接头的T3基因组也进行高通量测序,对测序结果进行生物信息学比较分析。采用类似高通量测序技术分析N4样噬菌体的全基因组序列。加接头的序列与无接头序列中的高频序列完全一致,证明了高通量测序过程中得到的高频序列就是加接头的基因组末端序列,同时证明T4样噬菌体的末端具有序列特异性而非完全随机,此外我们还发现N4样噬菌体基因组左侧末端具有唯一序列,而其基因组右侧末端不均一。高通量测序技术方便快捷,可用于噬菌体基因组末端和全基因组序列的同时测定。  相似文献   

2.
综述了高通量测序技术在线粒体全基因组测序中的策略,利用该技术对线粒体全基因组进行序列测定的方法可以归纳为两种,一种是先对目标mt DNA进行富集,包括mt DNA的提取纯化,目标区域PCR扩增法以及特异性探针杂交富集法(可分为基于微阵列和基于PCR探针的杂交富集法),然后对富集出的线粒体DNA进行高通量测序;另一种是先从待测样本的基因组高通量数据中挖掘出线粒体基因组序列信息,之后利用诱饵序列或者近缘物种的线粒体全基因组参考序列,使用软件MITObim对其进行组装。此外,还给出了线粒体高通量测序的优化流程图和介绍了混合样品的线粒体高通量测序策略。  相似文献   

3.
正反向测序信息在全基因组序列拼接及分析中的应用   总被引:1,自引:0,他引:1  
插入片段双末端正反向测序信息(double-barreled data, DB信息)已广泛应用于大基因组测序组装项目. 根据绘制籼稻全基因组工作框架图的经验, 总结了DB信息在序列组装流程中的应用, 同时, 在原有基础上提出了改进的DB信息使用方法, 包括基因组序列拼接、质量检验和重叠群的连接. 此外, 进一步提出了DB信息在下游数据分析过程中新的应用, 包括利用DB信息获得基因组文库中每个克隆所包含的基因组片段的精确信息, 以及在此基础上设计低成本全基因组基因芯片的一种基因芯片设计新方法. 随着待测序物种的逐年增多, 相信正反向测序信息在基因组测序组装工作, 以及后续的基因组研究中将发挥越来越重要的作用.  相似文献   

4.
王志明  潘元龙  吴俊  朱宝利 《微生物学报》2012,52(10):1219-1227
【目的】对卡介苗(Bacillus Calmette-Guerin,BCG)美国株(BCG Tice)进行基因组补缺口(补洞)工作,以得到它的基因组完整序列。【方法】首先对BCG Tice进行高通量测序,使用SOAPdenovo软件对得到的数据进行拼接。由于在高通量测序的过程中基因组某些区域测序覆盖度低,测序质量差会使测序结果经拼接后形成众多的重叠群(contig),相邻的位置关系确定的contig形成一个scaffold,contig之间未测到的区域为缺口序列(gap),在contig末端设计引物进行PCR扩增,得到连接相邻contig的PCR产物,对PCR产物进行测序。通过优化PCR引物设计策略,尝试不同的聚合酶进行聚合反应,调整PCR反应条件并结合PCR产物构建克隆测序等方法,补齐contig之间的缺口序列。【结果】完成了BCG Tice的全基因组测序,得到了它的基因组完整序列,序列已提交到美国国立生物技术信息中心(NCBI)的GenBank数据库。【结论】BCG属于高GC含量的革兰氏阳性细菌,其基因组GC含量高达65.65%。本文以BCG Tice基因组补洞为例,对高GC含量基因组补缺口过程中遇到的问题与采取的策略给予概述,望给相关高GC含量基因组的物种全基因组测序补缺口工作提供一些借鉴。  相似文献   

5.
<正>来自中国农业科学院棉花研究所的棉花基因组测序团队,联合北京大学、武汉大学、华大基因、美国农业部南方平原研究中心以及河北农业大学等研究单位,综合利用第二代高通量测序技术并结合BAC末端大片段测序方法,完成了世界上最重要的棉种陆地棉(At Dt基因组)的全序列测定和组装,结束了棉花没有参考基因组图谱的历史.研究结果已于2015年4月20日在线发表在Nature Biotechnology[1]上,这是该团队继2012年发表二倍体雷蒙德氏棉基  相似文献   

6.
【背景】随着测序费用的降低,越来越多的科学家选择利用高通量测序技术研究噬菌体的基因组序列。通过对这些基因组数据的分析和研究,一些科学家也开发出了判断dsDNA噬菌体末端序列的方法,但这些方法是基于Linux系统下的命令,并没有在Windows操作系统下的软件。【目的】在Windows平台下开发一款免费的、可以在高通量测序获得的庞大序列文件中找到dsDNA噬菌体基因组末端序列的软件PhageGT。【方法】使用Visual Studio 2019开发一个基于对话框的微软基础类库(Microsoft Foundation Classes,MFC)应用程序。软件使用C++语言开发,逐行读取序列文件中的每条Reads,并设计相应的算法进行统计、计算。【结果】软件PhageGT可在高通量测序文件中提取出不同序列出现的频率、排序,并利用提取序列的最高频率和序列平均频率的比值(R值)判断噬菌体基因组是否存在末端序列。【结论】软件PhageGT的使用比较方便、简单。软件PhageGT和本文所利用的所有测试数据均可从https://zenodo.org/record/4674231#.YHADb-gzZxc免费获得。  相似文献   

7.
评价濒危植物四合木(Tetraena mongolica)基因组的大小及复杂程度,开展基因组研究可揭示四合木的超旱生机制,进一步挖掘其特色基因资源。为更好破解四合木的全基因组信息,采用第二代高通量测序技术的基因组Survey分析技术开展四合木基因组大小估测研究,并利用生物信息学方法估计了四合木杂合率、重复序列和GC含量等基因组信息。结果表明:四合木基因组大小为1 079.25 Mb,修正后的基因组大小为1 065.84Mb,杂合率为0.76%,重复序列比例为75.25%,GC含量为33.57%。在经过四合木基因组初步组装后,获得3502 126条contigs,总计682 Mb,其N50为187 bp,推测四合木基因组属于同源四倍体复杂基因组,全基因组测序组装难度较大。由于四合木的高杂合率,后续可采用第三代高通量测序技术(单分子测序)同时结合染色质区域捕获技术,有望最终获得高质量的四合木全基因图谱。  相似文献   

8.
水稻稻曲病是由稻曲病菌引起的真菌病害,现已成为水稻重要的病害之一。旨在寻找一种最佳的稻曲病菌基因组DNA提取方法,并构建基因组小文库。采用CTAB、SDS和真菌DNA试剂盒3种提取方法提取稻曲病菌基因组DNA,并用Illumina系统测序分析,构建基因组小文库。结果显示,CTAB提取法能得到高质量的基因组DNA,小文库测序组装共得29 350288碱基(bp)和17 908 Scaffold,总碱基的GC含量为49.79%。CTAB提取法是稻曲病菌基因组DNA最佳的提取方法,基因组小文库成功的构建为稻曲病菌的基因组gap的填补和致病相关基因的鉴定提供了数据资源。  相似文献   

9.
DNA甲基化的研究最近几年一直是表观遗传学研究的重点。有关DNA甲基化水平检测的方法大体上有十几种,随着第二代测序技术的发展,实现了在全基因组水平上对甲基化状态进行检测。目前,基于第二代高通量测序进行全基因组DNA甲基化水平检测的方法主要有BSP-seq(亚硫酸氢盐修饰结合直接测序法)、Me DIP-seq(甲基化DNA免疫共沉淀测序法)、MBD-seq(甲基化DNA富集结合高通量测序法)。就这3种方法在原理、流程、优缺点、优化使用及后期需要用到的部分生物信息学资源等方面的研究进展作一综述,旨在为研究者在采用高通量测序方法研究DNA甲基化模式时提供一些思路。  相似文献   

10.
近几年飞速发展的高通量测序技术(next generation sequencing,NGS)在生命科学研究的各个领域充分展现了其低成本、高通量和应用面广等优势。在现代农业生物技术领域,利用高通量测序技术,科学家们不仅能更经济而高效对农作物、模式植物或不同栽培品种进行深入的全基因组测序、重测序,也可以对成百上千的栽培品种进行高效而准确的遗传差异分析、分子标记分析、连锁图谱分析、表观遗传学分析、转录组分析,进而改进农作物的育种技术,加快新品种的育种研究。其中,获得农作物的全基因组序列是其他研究和分析的基础。本文通过介绍近年来发表的一些利用高通量测序技术进行的农作物全基因组测定和组装的工作,展示高通量测序技术在现代农业生物技术领域的广泛前景以及其建立起来的研究基础。  相似文献   

11.
12.

Background

Usually, next generation sequencing (NGS) technology has the property of ultra-high throughput but the read length is remarkably short compared to conventional Sanger sequencing. Paired-end NGS could computationally extend the read length but with a lot of practical inconvenience because of the inherent gaps. Now that Illumina paired-end sequencing has the ability of read both ends from 600 bp or even 800 bp DNA fragments, how to fill in the gaps between paired ends to produce accurate long reads is intriguing but challenging.

Results

We have developed a new technology, referred to as pseudo-Sanger (PS) sequencing. It tries to fill in the gaps between paired ends and could generate near error-free sequences equivalent to the conventional Sanger reads in length but with the high throughput of the Next Generation Sequencing. The major novelty of PS method lies on that the gap filling is based on local assembly of paired-end reads which have overlaps with at either end. Thus, we are able to fill in the gaps in repetitive genomic region correctly. The PS sequencing starts with short reads from NGS platforms, using a series of paired-end libraries of stepwise decreasing insert sizes. A computational method is introduced to transform these special paired-end reads into long and near error-free PS sequences, which correspond in length to those with the largest insert sizes. The PS construction has 3 advantages over untransformed reads: gap filling, error correction and heterozygote tolerance. Among the many applications of the PS construction is de novo genome assembly, which we tested in this study. Assembly of PS reads from a non-isogenic strain of Drosophila melanogaster yields an N50 contig of 190 kb, a 5 fold improvement over the existing de novo assembly methods and a 3 fold advantage over the assembly of long reads from 454 sequencing.

Conclusions

Our method generated near error-free long reads from NGS paired-end sequencing. We demonstrated that de novo assembly could benefit a lot from these Sanger-like reads. Besides, the characteristic of the long reads could be applied to such applications as structural variations detection and metagenomics.

Electronic supplementary material

The online version of this article (doi:10.1186/1471-2164-14-711) contains supplementary material, which is available to authorized users.  相似文献   

13.
根据物种学名、分类号、任意一段核酸或蛋白质的序列,判定其属于什么物种及其详细分类的信息如何,是生物信息分析的最为基础且重要的环节,但该过程的分析及结果的获取均为手动,费时费力且容易出错。本研究旨在解决如何在NCBI网站上自动或批量获取物种信息。通过解析NCBI在线BLAST结果及其网页源程序特点,利用Perl语言编写自动化脚本,以达到批量获取查询或比对结果的物种分类信息。本研究编写的Perl语言脚本可解决序列在NCBI在线比对后自动或批量获取物种的分类信息问题,适用于细菌、真菌、动物、植物等物种学名、分类号、核酸或蛋白质的任意序列,可以为同行生物数据分析提供参考。  相似文献   

14.
15.
超级杂交稻父本93-11的基因组序列测定的完成,为进行作物遗传改良和不同作物之间的比较基因组学研究提供了又一重要序列资源.但是,该基因组序列中还存在很多缺口",为使93-11的基因组序列更加精确,同时提供一些缺口"填补策略和方法,本研究采用PCR扩增、回收克隆测序的方法对该基因组中一段长约160kb、含有6个缺口"的基因组序列进行了完善,并运用相关分子生物学和生物信息学软件进行了详细分析,结果表明:该6个缺口"中,存在1个缺口"估计错误,2个序列拼接错误;缺口"主要位于非编码区,位于编码区的只有1个,其改变了对本处基因的注释,使此基因由原来的9个外显子增加为11个;填补缺口"后,基因密度增加.  相似文献   

16.
超级杂交稻父本‘93-11'的基因组序列测定的完成,为进行作物遗传改良和不同作物之间的比较基因组学研究提供了又一重要序列资源.但是,该基因组序列中还存在很多“缺口”,为使‘93-11'的基因组序列更加精确,同时提供一些“缺口”填补策略和方法,本研究采用PCR扩增、回收克隆测序的方法对该基因组中一段长约160 kb、含有6个“缺口”的基因组序列进行了完善,并运用相关分子生物学和生物信息学软件进行了详细分析,结果表明:该6个“缺口”中,存在1个“缺口”估计错误,2个序列拼接错误;“缺口”主要位于非编码区,位于编码区的只有1个,其改变了对本处基因的注释,使此基因由原来的9个外显子增加为11个;填补“缺口”后,基因密度增加.  相似文献   

17.
Non-random seed shadows are commonly seen in plant species whose seeds are dispersed by animals, in particular by birds. The behaviour of birds can influence the spatial pattern of seed dispersal and, consequently, the entire regeneration process of fleshy-fruited trees. This study examined regeneration patterns in a fleshy-fruited tree species, rowan (Sorbus aucuparia L.), growing in West Carpathian subalpine spruce forests, focussing on two problems: the temporal relationship between rowan regeneration and gap formation, and the spatial relationship between rowan regeneration and stand structure. It was found that rowan seedlings and saplings were recruited in advance of gap formation. Establishment of new rowan individuals in gaps was infrequent, but gaps enhanced their regeneration nearby under spruce canopy, where they occurred densely in a narrow belt about 15 m wide. Inside spruce stands, the highest density of young rowans was directly under crowns, especially near trunk bases. Few rowan saplings were found growing under mature rowan trees. The presence of a rowan seedling and sapling bank determines whether rowans fill spruce stand gaps. Dense rowan groves can develop mainly in extensive but slowly expanding gaps.  相似文献   

18.
BioPerl对于现今大量的生物数据来说,具有很好的获取和处理能力,并且NCBI提供了可以直接访问它下属的Entrez数据库(包括PubMed)的编程接口,即E-Utilities。为了从NCBI中自动获取大量抗逆基因序列,使得生物抗逆基因二次数据库得以搭建,该文基于BioPerl设计了远程自动获取大量抗逆基因序列的程序。此程序灵巧、精悍,Perl语言强大的文本处理功能使程序能实现不同类型基因序列的远程获取。  相似文献   

19.
Perl语言已经成为用于生物信息学应用程序开发最流行的语言。为了简化本地的序列同源性分析过程,作者基于Perl语言设计开发了序列同源性分析的自动化程序,该程序具有无需编译、可移植性好、简单易用等优点,大大提高了工作效率,充分体现了Perl语言在生物信息学研究中所具备的优势。  相似文献   

20.
瓦屋山中亚热带湿性常绿阔叶林的林窗形成特征   总被引:12,自引:0,他引:12  
调查了瓦屋山原生和次生的中亚热带性常绿阔叶林的林窗形成特征,并对林窗形成特征,林窗制造者的死亡方式和原因进行了探讨,结果表明,次生常绿阔叶林林窗面积均<10m^2,1hm^2仅9个,林下更新不明显,原生林林窗密度为1hm^215个,<40m^2的林窗占56%,>100m^2的林窗只有4个,林窗平均面积59m^2,扩展林窗平均面积105m^2,林窗和扩展林窗总面积占被调查林分的比例分别为11.1%和19.8%,林窗大小分布表现出负指数分布,即小林窗多,大林窗少,林窗形状的变异较大,大多数因边界木的多少而成不规则的多边形,大多数林窗是多个林木死亡事件的结果,因而大多数林窗有两个或两个以上的林窗制造者,各林窗年龄大多数在10a以上,最近形成的林窗极少,估计林窗表成率是0.01.a^-1,采用样地投影调查方法可提高测定精度,便于不同调查林分结果的有效比较,常绿阔叶林林窗形成原因较为复杂,小径木的死亡是竞争被压所致,而大径的较高冠层木的死亡则可能是树木生长发育以及与地形,风等自然因子相互作用的结果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号