首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
【背景】类诺卡氏菌(Nocardioides sp.) InS609-2是一株分离自南极洲罗斯海特拉诺瓦湾的恩克斯堡岛土壤中潜在的极地放线菌新种。尚无研究报道Nocardioides sp.InS609-2的全基因组序列,缺少对其功能基因、代谢产物合成途径及比较基因组学等的研究。【目的】解析Nocardioides sp.InS609-2的基因组序列信息,以深入挖掘次级代谢产物基因资源。【方法】利用Illumina HiSeq高通量测序平台对菌株InS609-2进行全基因组完成图测序,使用相关软件对测序数据进行基因组组装、基因预测和功能注释、预测次级代谢产物合成基因簇和共线性分析等。【结果】基因组最后得到的总长度为4 524 052 bp,G+C含量为69.42%,预测到4 656个基因、56个tRNA和6个rRNA。根据Nocardioides sp.InS609-2的全基因组测序结果,分别有3 761、3 052、1 767、4 134和2 725个基因在COG、GO、KEGG、NR和Swiss-Prot数据库中提取到注释信息。同时,还预测得到19个次级代谢产物合成基因簇。基因组测序数据提交至NCBI获得GenBank登录号为CP060034。Nocardioides sp.InS609-2与N. dokdonensis CP015079、N. yefusunii CP034929、N. euryhalodurans CP038267、N. seonyuensis CP038436、N. daphniae CP038462和N. okcheonensis CP087710这6株基因组同源性比较高的类诺卡氏菌进行共线性分析和蛋白聚类分类分析,得到的结果是7个基因组间既有保守性又各自有独特性。七个基因组共有44个蛋白聚类簇。最后进行16S rRNA基因系统发育树、泛基因组、core基因组和基因组进化树分析,进一步挖掘了Nocardioides sp.InS609-2的基因组信息。【结论】从基因组层面上预测了Nocardioides sp.InS609-2的次级代谢产物的生物合成基因簇,为InS609-2的后续相关研究提供了参考信息,具有重要意义。  相似文献   

2.
证明噬菌体高通量测序中高频出现的序列即是噬菌体基因组的末端序列。在T3噬菌体基因组末端连接特异性序列接头,然后进行高通量测序,同时将不加接头的T3基因组也进行高通量测序,对测序结果进行生物信息学比较分析。采用类似高通量测序技术分析N4样噬菌体的全基因组序列。加接头的序列与无接头序列中的高频序列完全一致,证明了高通量测序过程中得到的高频序列就是加接头的基因组末端序列,同时证明T4样噬菌体的末端具有序列特异性而非完全随机,此外我们还发现N4样噬菌体基因组左侧末端具有唯一序列,而其基因组右侧末端不均一。高通量测序技术方便快捷,可用于噬菌体基因组末端和全基因组序列的同时测定。  相似文献   

3.
【背景】枯草芽孢杆菌N2-10是一株具有较强抑菌能力且能产纤维素酶等多种水解酶的革兰氏阳性菌,在发酵饲料中具有较大的应用潜力。【目的】通过获得枯草芽孢杆菌N2-10的全基因组序列信息,进一步解析菌株次级代谢产物合成基因信息,并通过比较基因组学分析菌株N2-10与模式菌株的差异性,为阐明N2-10抑菌和益生机制提供理论基础。【方法】通过二代Illumina NovaSeq联合三代PacBio Sequel测序平台,对菌株N2-10进行全基因组测序,将测序数据进行基因组组装、基因预测与功能注释,并利用比较基因组学分析N2-10与其他菌株的差异。【结果】菌株N2-10基因组大小为4 036 899 bp,GC含量为43.88%;共编码4 163个编码基因,所有编码基因总长度为3594369bp,编码区总长度占基因组总长度的89.04%;含有85个tRNA、10个5S rRNA、10个16S rRNA、10个23S rRNA,以及2个CRISPR-Cas、1个前噬菌体和6个基因岛;在GO (gene ontolog)、COG (clusters of orthologous groups of...  相似文献   

4.
大麻状罗布麻的全基因组分析和SSR标记开发   总被引:1,自引:0,他引:1  
大麻状罗布麻是重要的经济和生态作物,由于基因组数据匮乏和分子标记少而限制其遗传研究工作的开展。本研究利用Illumina测序平台对大麻状罗布麻的基因组大小进行测定,通过生物信息学方法对其基因组杂合度和重复序列等基本信息进行预估,并做了基因组的初步组装,在此基础上对其基因组序列进行了SSR查找。研究结果表明,总测序量为31.94 Gb,测序质量正常(Q20≥90%,Q30≥85%),与NCBI核苷酸数据库(NT)比对显示样本不存在外源污染;K-mer分析(K=17)结果显示,大麻状罗布麻基因组大小为239.02 Mbp,杂合率为0.56%,重复序列占全基因组比例为36.72%,初步预估大麻状罗布麻基因组为复杂基因组;采用K-mer=41进行基因组初步组装,共获得273336条contigs,N50为3838 bp,总长为222723253 bp,进一步将contigs进行连接、延长,组装得到224587条scaffolds,N50为6421 bp,总长为226378236 bp;此外,对基因组数据进行SSR分子遗传标记分析,共鉴定出117511个SSR,不同类型核苷酸重复差异较大,单核苷酸重复最多,六核苷酸重复最少。该研究为后续全基因组de novo测序及组装策略提供依据。  相似文献   

5.
以美洲大蠊Periplaneta americana为原料生产的康复新液等药品临床疗效显著,得到了广泛应用。本文以四川好医生攀西药业有限责任公司饲养的药用美洲大蠊为材料,首次采用Illumina Hi Seq 2000和Pac Bio SMRT测序平台开展了全基因组测序,并进行基因组组装、注释和分析。原始测序数据经过滤后得到1.4 Tb的二代测序数据和33.81 Gb的三代测序数据。组装结果表明,美洲大蠊基因组大小为3.26 Gb,这在已报道的昆虫基因组中仅次于东亚飞蝗Locusta migratoria。基因组重复序列含量为62.38%,杂合度为0.635%,表明其为复杂基因组。组装的Contig N50和scaffold N50长度分别为28.2 kb、315 kb,单拷贝基因完整性为88.1%,小片段文库测序数据平均比对率为99.8%,测序和组装质量满足后续分析要求。采用De novo预测、同源预测和基于转录本预测3种方法共注释到14 568个基因,其中92.4%的基因获得了功能注释。本研究首次完成了美洲大蠊的全基因组测序,也是大蠊属Periplaneta昆虫的第一个基因组,为美洲大蠊遗传进化分析和药用基因资源挖掘打下了重要基础。  相似文献   

6.
罗汉果全基因组Survey分析   总被引:4,自引:0,他引:4  
罗汉果是广西特有药用及甜料植物,其主要成分之一甜苷V作为天然、非糖甜味剂,具有广阔的开发前景,但罗汉果目前完全来自于栽培,适生区狭窄,连作障碍严重,加之含量低导致甜苷V生产成本居高不下,严重限制了其应用。为了减少盲目性,在大规模全基因组深度测序之前,先做低覆盖度的基因组Survey测序,评价基因组的大小及复杂程度,以确定适合该植物全基因组的测序研究策略。该研究采用第二代高通量测序技术(Illumina Hiseq TM 2000)首次测定了罗汉果基因组大小,并利用生物信息学方法估计罗汉果杂合率、重复序列和GC含量等基因组信息。结果表明:(1)获得了18.1 Gb罗汉果基因组测序数据,基因组大小估计为344.95 Mb左右,测序深度为52×;(2)从K-mer分布曲线发现罗汉果基因组有明显的杂合峰,杂合率达1.5%,基因组高杂合导致组装的结果中Contig N50和Scaffold N50的长度比预期的要短很多,还造成GC平均深度及含量分布明显异常,存在一个低深度分布区域。基因组主峰后面有微弱的重复峰,说明罗汉果存在较多的重复序列;(3)由于罗汉果存在高杂合率和重复序列较多的特点,该基因组测序分析仅采用全基因组鸟枪法(WGS)策略不合适,为了更好地对全基因组进行序列拼接和组装,可尝试结合采用Fosmid-to-Fosmid或BAC-to-BAC策略。该研究结果对于揭示罗汉果产量、有效成分含量、发育及抗病虫的分子机制,以及通过分子育种来提高甜苷V含量和降低生产成本具有重要意义,为全基因组测序策略的选择提供了依据。  相似文献   

7.
对1株梅花鹿源性狂犬病街毒株(DRV)进行全基因组克隆,对全长cDNA进行测序分析.RT-PCR扩增克隆覆盖全基因组9个重叠基因片段,基因组3'和5'末端采取3,-RACE和5'-RACE方法,9个重叠基因片段序列拼接得到DRV全基因组cDNA序列,共11 863个核苷酸.DRV毒株全基因组构成与其他狂犬病毒基因组构成相似,由5个编码区组成,基因起始位点和终止位点高度保守,在核蛋白和糖蛋白的重要抗原位点有个别氨基酸发生变异,对已完成全基因组测序的几个基因1型毒株分别进行了N、P、M、G、L基因核苷酸及氨基酸的同源性比较.与其他具有代表性的毒株进行N基因序列比较建立的系统进化树表明,DRV毒株属于基因1型,与中国人用疫苗株3aG同源性最高为94%,与分类位置未确定的北高加索毒株(WCBV)的同源性最低为71%.本研究结果可为狂犬病毒各项分子生物学研究提供理论参考.  相似文献   

8.
采用二代和三代测序技术分别对金针菇单核体菌株“6-3”进行测序,应用4种组装策略进行基因组的de novo组装,对比组装效果。基因组组装的参数方面,仅使用二代测序组装的效果最差,长度大于10kb的Contig全长只有24.6Mb,Contig N50只有23kb,组装率只有59.27%。采用三代组装二代校正的组装策略效果最好,长度大于10kb的Contig全长为38.3Mb,Contig N50为2.8Mb,组装率高达92.16%。保守单拷贝基因拼接效果方面,4种组装策略获得基因组序列与BUSCO数据库里的担子菌的保守单拷贝基因比对,基因完整性均大于94%。在组装准确性方面,经过PCR扩增、Sanger测序验证,三代组装二代校正的基因组序列完整并且连续,同时序列上碱基的SNP、InDel数量最少。综上所述,三代组装二代校正得到的基因组序列具有Contig N50值大、组装率高、碱基准确性高的特点,是食用菌基因组测序较为理想的方案。  相似文献   

9.
【目的】阐述阿拉伯海假交替单胞菌(Pseudoalteromonas arabiensis)的分子进化与生态适应策略。【方法】借助Illumina HiSeq X Ten和Oxford Nanopore PromethION测序平台对一株分离自太平洋表层海水的菌株Pseudoalteromonas arabiensis N1230-9进行全基因组测序,利用相关生物信息学分析软件对原始数据进行组装和基因组注释,并与一株分离自深海沉积物环境的模式菌株Pseudoalteromonas arabiensis JCM 17292进行比较基因组分析。【结果】菌株N1230-9基因组由2条染色体组成,基因组大小为4 627 470 bp,G+C含量为40.85%,共编码4 202个蛋白。功能基因注释结果显示,菌株N1230-9具有适应海洋环境的多种类型功能基因,包括重金属抗性基因、多种铁离子摄取系统编码基因、多种噬菌体防御系统编码基因、种类丰富的水解酶编码基因、多种碳水化合物代谢相关基因,以及数量众多的二元信号传导系统编码基因。通过比较基因组分析发现,菌株N1230-9和菌株JCM 17292拥有适应不同生态位的特有基因,这些基因主要涉及血红素摄取、重金属抗性、噬菌体防御、二元信号系统传导和横向基因水平转移。【结论】来自表层海水的菌株P. arabiensis N1230-9已演化出了适应其生态位的特有基因。  相似文献   

10.
建立以Sanger测序为基础的H9N2亚型禽流感病毒全基因组测序方法。从GenBank和GISAID数据库中选取2000至2012年中国地区和中国国家流感中心病毒序列数据库中H9N2亚型禽流感病毒的8个片段基因序列,通过比对分析在相对保守的区域设计分段扩增引物,共16对。选用1株病例分离毒株和4株环境分离毒株对引物进行验证和进一步优化。优化后的16对引物能够有效扩增5株H9N2亚型禽流感病毒,仅个别反应出现非特异扩增。所有获得的目的片段仍能有效进行后续测序实验。建立了一种能够有效获得新型重配H9N2亚型禽流感病毒全基因组序列的Sanger测序方法,为该病原分子流行病学研究和开展风险评估提供技术支撑。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号