首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 515 毫秒
1.
基因组是指一个生物体内遗传物质的总和,是生物学研究的关键之一.自2000年拟南芥基因组被测序发表以来,已有超过800个植物基因组相继被破解,极大促进了植物分子生物学、遗传学等领域的发展.即便如此,植物基因组学研究仍然面临一系列挑战,包括高杂合、高重复度、高倍性等复杂基因组的组装和泛基因组的构建等.本文从植物基因组学的发展概况、基因组测序技术、组装算法等三个方面,全面展示了植物基因组的快速发展.其中,介绍了简单基因组装和复杂基因组装的相关策略,总结了“端粒到端粒”(telomere-to-telomere或称T2T)的组装和泛基因组构建方法以及其重要性.最后,对未来植物基因组的发展进行了展望,认为随着技术的不断进步,基因组解析技术和方法将会更加完善,为植物基因组的深入研究提供更多支持.本文为植物T2T、复杂基因组组装和泛基因组的构建方法研究提供了参考依据.  相似文献   

2.
本研究采用高通量测序技术(Illumina Hiseq ~(TM)2000)首次对世界名贵园林花卉马缨杜鹃(Rhododendron delavayi)进行了基因组大小的测定,并评估了马缨杜鹃的GC含量、杂合率和序列重复度等信息参数,为马缨杜鹃全基因组测序策略的选择提供了有据参考。全基因组扫描结果如下:马缨杜鹃的基因组大小约为698 Mb,杂合率较高约为1.25%,GC含量约为39%,且具有一定的基因组序列重复度。研究表明:马缨杜鹃的全基因组测序分析不宜采用全基因组鸟枪法(WGS),可尝试WGS与fosmid或BAC-to-BAC相结合的测序策略,亦或采用杂合组装软件进行序列拼装,以提高全基因组序列的拼装质量。  相似文献   

3.
大麻状罗布麻的全基因组分析和SSR标记开发   总被引:1,自引:0,他引:1  
大麻状罗布麻是重要的经济和生态作物,由于基因组数据匮乏和分子标记少而限制其遗传研究工作的开展。本研究利用Illumina测序平台对大麻状罗布麻的基因组大小进行测定,通过生物信息学方法对其基因组杂合度和重复序列等基本信息进行预估,并做了基因组的初步组装,在此基础上对其基因组序列进行了SSR查找。研究结果表明,总测序量为31.94 Gb,测序质量正常(Q20≥90%,Q30≥85%),与NCBI核苷酸数据库(NT)比对显示样本不存在外源污染;K-mer分析(K=17)结果显示,大麻状罗布麻基因组大小为239.02 Mbp,杂合率为0.56%,重复序列占全基因组比例为36.72%,初步预估大麻状罗布麻基因组为复杂基因组;采用K-mer=41进行基因组初步组装,共获得273336条contigs,N50为3838 bp,总长为222723253 bp,进一步将contigs进行连接、延长,组装得到224587条scaffolds,N50为6421 bp,总长为226378236 bp;此外,对基因组数据进行SSR分子遗传标记分析,共鉴定出117511个SSR,不同类型核苷酸重复差异较大,单核苷酸重复最多,六核苷酸重复最少。该研究为后续全基因组de novo测序及组装策略提供依据。  相似文献   

4.
太行菊(Opisthopappus taihangensis)、长裂太行菊(O.longilobus),为太行山特有多年生崖壁草本植物,菊科(Compositae)重要野生资源,具有较高的经济与生态价值。为确定适合两物种的全基因组测序策略,该研究利用流式细胞法和高通量测序技术,分析两物种基因组大小、杂合率、重复序列及GC含量等信息。结果表明:(1)流式细胞法估算太行菊基因组大小约为2.1 Gb,长裂太行菊基因组大小约为2.4 Gb。(2)高通量测序修正后太行菊基因组大小为3.13 Gb,重复序列比例为84.35%,杂合度为0.99%,GC含量为36.56%;长裂太行菊基因组为3.18 Gb,重复序列比例为83.83%,杂合度为1.17%,GC含量为36.62%。(3)初步组装后GC含量分布及平均深度存在异常,出现分层现象,可能是两物种基因组杂合率较高所致。综上结果表明,太行菊、长裂太行菊均属于高重复、高杂合、大基因组的复杂基因组,建议使用Illumina+PacBio测序组装策略,进行全基因组测序分析。  相似文献   

5.
复杂基因组测序技术研究进展   总被引:1,自引:0,他引:1  
复杂基因组指的是无法使用常规测序和组装手段直接解析的一类基因组,通常指包含高比例重复序列、高杂合度、极端GC含量、存在难消除异源DNA污染的基因组。为了解决复杂基因组的测序和组装问题,需要分别从基因组测序实验方法、测序技术平台、组装算法与策略3个方面进行深入研究。本文详细介绍了复杂基因组测序组装相关的现有技术与方法,并结合复杂基因组经典实例介绍了复杂基因组测序的技术解决途径和发展历程,可为制订合适的复杂基因组测序策略提供参考。  相似文献   

6.
广西火桐(Firmiana kwangsiensis)和丹霞梧桐(F. danxiaensis)是我国南方特有物种, 其分布范围狭窄, 种群数量少。为了解其叶绿体基因组结构及系统发生关系, 本文通过高通量测序方法获得广西火桐和丹霞梧桐的浅层基因组数据, 通过生物信息学方法对叶绿体全基因组进行组装, 并对其结构特征进行分析。结果表明: 广西火桐和丹霞梧桐的叶绿体基因组大小分别为160,836 bp和161,253 bp, 具有典型被子植物叶绿体基因组环状四分体结构, 包含长度分别为89,700 bp、90,142 bp的大单拷贝区(large single copy, LSC), 长度分别为19,970 bp、20,067 bp的小单拷贝区(small single copy, SSC)及长度分别为25,583 bp、25,522 bp的2个反向重复序列区(inverted repeat sequence, IR)。两个物种的叶绿体基因组共注释得到131个基因, 包括86个蛋白编码基因、37个tRNA基因和8个rRNA基因。广西火桐的叶绿体基因组中共检测出26个正向重复序列、2个反向重复序列、21个回文重复序列、21个串联重复序列和98个简单重复序列; 丹霞梧桐叶绿体基因组中共检测出23个正向重复序列、5个反向重复序列、21个回文重复序列、30个串联重复序列和107个简单重复序列。系统发生分析结果表明5种梧桐属(Firmiana)植物构成两个强烈支持的分支(支持率100%), 一个分支为广西火桐、美丽火桐(F. pulcherrima)和火桐(F. colorata), 其中广西火桐与美丽火桐构成姐妹群; 另一分支是互为姐妹群的丹霞梧桐和云南梧桐(F. major)。综上所述, 广西火桐和丹霞梧桐的叶绿体基因组结构、基因排列及重复序列具有较高的相似性, 系统进化树将5种梧桐属物种分为两个分支, 其中广西火桐和美丽火桐最近; 而丹霞梧桐与云南梧桐关系最近。本研究鉴定的SSR位点可为梧桐属物种系统发生、进化关系的研究提供遗传信息。  相似文献   

7.
一种快速有效的识别DNA重复序列的方法   总被引:1,自引:0,他引:1  
按统计的相应分析方法设计和编制了基因组重复序列的识别软件。经众多Alu序列的回顾性分析,错报率为4.8%,漏报率为5.8%,又地剪入编码区的Alu序列的细致检查和对T细胞受体基因组的Alu序列的大尺度搜索,证实本程序是一种快束速和良好的识别DNA重复序列的工具。  相似文献   

8.
简单重复序列亦称微卫星,被成功应用于许多真核生物、原核生物和病毒的基因组和进化研究,但是噬菌体中的微卫星目前很少被研究。因此对60条尾病毒目基因组中的微卫星和和复合型微卫星(由两个或两个以上直接相邻的微卫星组成)做综合性分析,在这60个基因组中总共观察到11 874个微卫星和449个复合型微卫星。相关性分析表明微卫星个数与基因组大小成正线性相关(ρ=0.899, P<0.01)。参考序列中的微卫星个数少于对应的随机序列中微卫星个数,这种反常现象主要是因为参考序列含有较少的单核苷酸和二核苷酸重复。A/T和AT/TA重复是单核苷酸和二核苷酸重复中最主要的类型,因此单核苷酸重复中的GC含量明显低于相应的序列中的GC含量;相比之下,微卫星中的二核苷酸和三核苷酸重复的GC含量与对应的参考序列的GC含量无明显区别。尾病毒目基因组中的这些结果与其它生物体基因组存在一定的差别。有助于了解尾病毒目中微卫星的分布、进化和生物学功能。  相似文献   

9.
研发动态     
中国烟草基因组数据库(1.0版)开放运行中国烟草基因组数据库(1.0版)近日面向行业开放运行。数据库设在国家烟草基因研究中心,储存了去年底绘制的绒毛状烟草和林烟草全基因组序列图谱的所有原始数据以及基因注释结果,总数据量将近7T。这两张序列图谱是目前已知植物基因组序列图谱中基因组最大、组装精度最高、组装  相似文献   

10.
樟树全基因组调查   总被引:4,自引:1,他引:3  
樟树是我国特有的珍贵用材和经济树种,富含多糖多酚、萜类等次生代谢物质,是香精香料、油脂化工和医药等的重要原料树种。本研究采用高通量测序技术(Illumina HiseqTM2000)首次测定了樟树基因组大小,并利用生物信息方法估计樟树杂合率、重复序列情况和GC含量等基因组信息,为全基因组测序策略的选择提供依据。主要结论如下:(1)樟树基因组大小粗略估计为760 Mb左右;(2)樟树基因组有较高的杂合率和一定的重复,杂合率约为0.65%;(3)由于樟树杂合率较高,全基因组鸟枪法策略不适合该基因组测序分析,可尝试使用BAC-to-BAC策略或fosmid策略,有利于樟树基因组的序列拼接和组装。  相似文献   

11.
乙型肝炎病毒(hepatitis B virus,HBV)属于嗜肝DNA病毒科(hepadnaviridae),它分布在世界各地并严重危害人类的健康。本文从NCBI的GenBank中下载了106条B2亚型和130条C2亚型的基因组全长序列,以下载的数据为材料,分析简单重复序列(simple sequence repeats,SSRs)在B2和C2亚型基因组序列中的分布情况。结果显示,简单重复序列的重复次数比较少;二型简单重复序列在研究的五种简单重复序列类型中占绝对优势;这可能与B2和C2亚型基因组序列有较高的突变率有关。同时还发现最普遍的SSRs、序列间SSRs的平均相对丰度和平均相对密度在B2和C2亚型中分布情况相似。  相似文献   

12.
金莲花(Trollius chinensis)是毛茛科的一种药用及观赏植物,采用Illumina HiSeq2500高通量技术对其全基因组DNA测序,建立126 bp DNA小片段文库,以大兔葵(Megaleranthis saniculifolia)叶绿体基因组为参考,通过BLASTN比对提取后用CLC Genomics Workbench软件组装得到金莲花叶绿体全基因组序列,并对其特征进行分析。结果表明,金莲花叶绿体基因组全长160 191 bp,具有典型的被子植物叶绿体基因组环状四分体结构,两个反向互补重复序列(inverted repeat, IRA和IRB)的长度均为26 632 bp,大单拷贝区(large single copy, LSC)和小单拷贝区(small single copy, SSC)的长度分别为88 522 bp和18 405 bp;注释得到131个基因,包括85个蛋白质编码基因,36个tRNA基因,8个rRNA基因和2个假基因,其中18个基因包括一个或两个内含子;共检测到231个简单重复序列(short simple repeat, SSR)。此叶绿体基因组已在GenBank注册,序列号为KX752098。本研究为金莲花叶绿体分子标记研究提供了理论依据,有助于促进该物种分子育种、进化分析和系统发育的研究。  相似文献   

13.
前言在真核生物基因组中重复序列占有很大比重,它的绝大部分存在于诸如间隔序列和调控序列非编码序列中,但它也分布在有些结构基因的序列中,它多为轻度重复序列。植物的基因组重复序列一般占80%左右,基因组较大其重复序列所占比重较大,如玉米基因组(haploidgenome)大约有3×109,其中几乎80%以上是重复序列[12]。重复序列对维持染色体的空间结构、基因的表达、遗传重组都具有重要作用。重复序列单...  相似文献   

14.
罗汉果全基因组Survey分析   总被引:4,自引:0,他引:4  
罗汉果是广西特有药用及甜料植物,其主要成分之一甜苷V作为天然、非糖甜味剂,具有广阔的开发前景,但罗汉果目前完全来自于栽培,适生区狭窄,连作障碍严重,加之含量低导致甜苷V生产成本居高不下,严重限制了其应用。为了减少盲目性,在大规模全基因组深度测序之前,先做低覆盖度的基因组Survey测序,评价基因组的大小及复杂程度,以确定适合该植物全基因组的测序研究策略。该研究采用第二代高通量测序技术(Illumina Hiseq TM 2000)首次测定了罗汉果基因组大小,并利用生物信息学方法估计罗汉果杂合率、重复序列和GC含量等基因组信息。结果表明:(1)获得了18.1 Gb罗汉果基因组测序数据,基因组大小估计为344.95 Mb左右,测序深度为52×;(2)从K-mer分布曲线发现罗汉果基因组有明显的杂合峰,杂合率达1.5%,基因组高杂合导致组装的结果中Contig N50和Scaffold N50的长度比预期的要短很多,还造成GC平均深度及含量分布明显异常,存在一个低深度分布区域。基因组主峰后面有微弱的重复峰,说明罗汉果存在较多的重复序列;(3)由于罗汉果存在高杂合率和重复序列较多的特点,该基因组测序分析仅采用全基因组鸟枪法(WGS)策略不合适,为了更好地对全基因组进行序列拼接和组装,可尝试结合采用Fosmid-to-Fosmid或BAC-to-BAC策略。该研究结果对于揭示罗汉果产量、有效成分含量、发育及抗病虫的分子机制,以及通过分子育种来提高甜苷V含量和降低生产成本具有重要意义,为全基因组测序策略的选择提供了依据。  相似文献   

15.
小麦是世界上广泛种植的主要粮食作物,养活了全世界35%以上的人口。获取高质量的基因组图谱对于推动小麦基础理论和遗传育种研究至关重要。然而,庞大而复杂的基因组一度使小麦基因组测序被认为是"不可能完成的任务"。随着高通量测序和组装技术的成熟,近年来多个小麦基因组序列图谱陆续发布,序列组装质量日臻完善。仅最近两年就公布了5个不同倍性的小麦参考基因组序列,包括两个二倍体祖先种乌拉尔图小麦(Triticum urartu,AA)和粗山羊草(Aegilops tauschii,DD)、野生和栽培四倍体二粒小麦(T.turgidum ssp.dicoccoides, BBAA)和六倍体普通小麦(T. aestivum, BBAADD)。其中,作为多倍体小麦A亚基因组供体的乌拉尔图小麦基因组测序和分析是由中国科学院遗传与发育生物学研究所牵头完成。本文主要对小麦A基因组的结构解析和进化分析等方面的研究进展进行了综述,以期为相关领域的科研人员提供参考信息,促进小麦的基础和应用研究。  相似文献   

16.
本研究采用第二代测序技术对四川华绿螽的基因组进行测序,并组装得到了完整的线粒体基因组序列。结果显示:四川华绿螽线粒体基因组序列全长18 051 bp,包含37个基因和1个控制区。与大部分已测序的螽亚目昆虫类似,四川华绿螽线粒体基因组具有通常的基因方向、t RNA结构、相对较低的A+T偏好性。但其基因排列与祖先序列明显不同,具有新的基因排序12S r RNA-t RNA~(Ile)-t RNA~(Met)-nad2-CR-t RNA~(Gln)-t RNA~(Trp)。控制区较长,为3 074 bp,由两部分组成,一部分是与nad2相邻的高A+T偏向性区域(A+T-biased region,ATR),另一部分是与t RNA~(Gln)相邻的串联重复(tandem repeat,TR)区。另外,在t RNA~(Ser(UCN))和nad1之间也有一段长度为123 bp的串联重复序列。基于已测序的线粒体基因组序列,我们对直翅目昆虫线粒体基因组的结构和排序进行了比较分析。本研究为直翅目系统发生关系重建积累了有价值的数据资料。  相似文献   

17.
马菁菁  姚堃  汤华民 《病毒学报》2019,35(2):323-330
人类疱疹病毒6型(Human herpesvirus 6,HHV-6)是双链DNA病毒,其原发感染引起婴幼儿急疹,潜伏感染后的再激活亦引起多种严重疾患。近来,该病毒特有的潜伏感染形式—病毒基因组的宿主染色体整合(包括机制及临床相关性)被不断报道。HHV-6基因组的末端区域含有端粒重复序列,病毒基因组通过该重复序列整合到宿主细胞染色体中建立潜伏感染。当宿主免疫力受到抑制时,整合于宿主染色体上的病毒基因组会再次活化,引起疾患。本文综述了HHV-6基因组染色体整合的主要机制及临床意义。  相似文献   

18.
为探究桃儿七(Sinopodophyllum hexandrum)不同叶绿体基因组特征,本研究以桃儿七5个叶绿体基因组为研究对象,借助生物信息学工具进行基因组图谱构建、重复序列分析、密码子偏好分析、反向重复序列区(inverted repeat, IR)/单拷贝区(single-copy, SC)边界分析、基因组序列比较分析及系统发育分析。结果表明:桃儿七5个叶绿体基因组全长为157 203–157 940 bp,为典型的叶绿体四分体结构,共注释出133–137个基因,说明桃儿七叶绿体基因组具有多样性。桃儿七不同叶绿体基因组简单重复序列(simple sequence repeat, SSR)位点不同,单核苷酸A/T占主要优势,散在重复序列包括正向重复、回文重复和反向重复3类。密码子偏好分析显示有效密码子(effective number of codon,ENc)值为51.14–51.17,密码子偏好性弱,GC与GC3s所占比例小于50%,密码子偏向使用A和U碱基并且以A和U碱基结尾。桃儿七5个叶绿体基因组IR/SC边界和基因组序列均比较保守。系统发育分析结果表明桃儿七和北美桃儿七亲...  相似文献   

19.
对人类基因组3号染色体短臂的3pter-p26区域进行了初步分析, 序列组装后整个区域全长约为8.1 kb, 靠近端粒区还存在一个约20~30 kb的空洞. 序列比较分析表明: (ⅰ) 该区域的GC含量为38.5%, 为人类基因组所有近端粒区域最低; (ⅱ) 共含有42个基因, 平均大小为97.5 kb, 以前通过基因连锁分析定位于该区域的基因Cntn3存在定位错误, 应位于3p12.3; (ⅲ) 该区域散在重复序列活跃程度高于全基因组平均水平, 其中(TA)n含量是全基因组平均水平的2倍; (ⅳ) 该区域在小鼠6号染色体104.1~112.4 Mb的位置有一个保守的同源序列; 通过染色体进化分析推断, 3pter-p26区域可能于最近的一次染色体重排之后才转移到染色体的末端, 其发生时间应在人与小鼠的基因组分离之后, 在这次重排过程中, 染色体断裂点附近的一些序列, 连同所包含的基因发生了丢失, 而丢失的基因总拷贝数却在基因组的其他地方得到了增加; (ⅴ) 3pter-p26区域较低的GC含量可能不利于保持染色体末端的稳定, 容易发生DNA丢失, 而这又可能是引发基因表达异常导致疾病的原因之一.  相似文献   

20.
金缕梅科(Hamamelidaceae)银缕梅属(Parrotia C.A.Mey.)仅包含银缕梅(Parrotia subaequalis(H.T.Chang)R.M.Hao&H.T.Wei)和波斯铁木(Parrotia persica(DC.)C.A.Mey.)两种落叶阔叶乔木,其中银缕梅是我国华东地区特有的Ⅰ级濒危珍稀保护植物,属东亚第三纪孑遗成分;其姊妹种波斯铁木则间断分布于伊朗北部,属北极第三纪孑遗植物类群。本研究首次利用流式细胞术和K-mer分析方法对银缕梅属两姊妹种的基因组大小进行了测定,建立和优化了以萝卜(Raphanus sativus L.‘Saxa’)为内标、WPB(Woody plant buffer)为细胞核解离液的两种植物单倍体基因组的DNA含量(DNA C值)流式测定的适宜体系,旨在为金缕梅科银缕梅属植物的全基因组测序、基因组学研究、种质资源开发和利用以及物种保育等提供前期基础数据参考;同时也可为金缕梅科其他属、种的基因组大小测定提供借鉴。主要研究结果如下:(1)通过流式测定银缕梅基因组大小约为971.45±13.91 Mb,波斯铁木基因组大小约为890.52±24.69 Mb;(2)K-mer分析估测银缕梅基因组大小为951.70 Mb,杂合率为1.740%,重复序列比例为77.50%;波斯铁木基因组大小为858.50 Mb,杂合率为0.695%,重复序列占74.30%;(3)银缕梅属于高杂合和高重复基因组,波斯铁木则属于微杂合和高重复基因组。本研究的结果为银缕梅属植物后续基于DNA三代高通量测序技术的全基因组测序、组装及去冗余处理等工作提供了重要的数据参考。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号