首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
厚朴为著名的传统药用植物,归于木兰科、木兰属,于我国广泛种植,其树皮、根皮、枝皮、叶片、花、果实均能入药或食用。为获取厚朴全基因组序列信息,该文以厚朴叶片DNA为材料,采用Pacbio Sequel第三代测序技术构建厚朴全基因组数据库,并利用生物信息学方法对获得的核苷酸序列进行组装、功能注释以及进化分析研究。结果表明:(1)原始测序数据过滤后获得140.91 Gb三代数据,Read N50约为13 784bp,经过组装得到厚朴基因组大小为1.68 Gb,Contig N50约为222 069 bp,单拷贝基因完整性为81.0%。(2)组装后的序列通过与NR、KOG、KEGG等功能数据库比对,共有98.40%的基因得到了功能注释,其中KOG功能注释结果发现厚朴的蛋白功能主要集中在一般功能预测、翻译后修饰、蛋白质转换、伴侣以及信号转导机制; GO功能分类表明厚朴的基因集中在细胞组分及生物学过程; KEGG分析发现厚朴参与代谢通路的基因占主要地位。(3)通过与葡萄、拟南芥、水稻、杨树、银杏、无油樟、茶树及牛樟基因组的比对分析,发现厚朴23 424个基因中有20 801个基因可以分类到12 129个家族,其中有515个基因家族为厚朴所特有,而厚朴与牛樟(樟科)亲缘关系较近,两者的分化时间约在122.5百万年前(mya)。该研究首次利用第三代测序技术对厚朴全基因组解析,有利于对其进一步进行深入的开发与利用,也为研究其他药用植物全基因组奠定了基础。  相似文献   

2.
以美洲大蠊Periplaneta americana为原料生产的康复新液等药品临床疗效显著,得到了广泛应用。本文以四川好医生攀西药业有限责任公司饲养的药用美洲大蠊为材料,首次采用Illumina Hi Seq 2000和Pac Bio SMRT测序平台开展了全基因组测序,并进行基因组组装、注释和分析。原始测序数据经过滤后得到1.4 Tb的二代测序数据和33.81 Gb的三代测序数据。组装结果表明,美洲大蠊基因组大小为3.26 Gb,这在已报道的昆虫基因组中仅次于东亚飞蝗Locusta migratoria。基因组重复序列含量为62.38%,杂合度为0.635%,表明其为复杂基因组。组装的Contig N50和scaffold N50长度分别为28.2 kb、315 kb,单拷贝基因完整性为88.1%,小片段文库测序数据平均比对率为99.8%,测序和组装质量满足后续分析要求。采用De novo预测、同源预测和基于转录本预测3种方法共注释到14 568个基因,其中92.4%的基因获得了功能注释。本研究首次完成了美洲大蠊的全基因组测序,也是大蠊属Periplaneta昆虫的第一个基因组,为美洲大蠊遗传进化分析和药用基因资源挖掘打下了重要基础。  相似文献   

3.
香瓜茄又名人参果,具有抗氧化、抗肿瘤、抗糖尿病等多种生物活性。为丰富茄科作物基因组信息及进化发育历程,获取香瓜茄全基因组序列信息,同时为香瓜茄相关分子研究奠定基础。以香瓜茄植物组织为试验材料,基于Illumina HiSeq构建小片段文库进行基因组特征评估,利用PacBio三代测序技术、Hi-C技术构建及组装香瓜茄全基因组数据库。利用生物信息学方法对获得的基因组序列进行组装、功能注释以及进化分析研究。结果表明,获得54.11 Gb Illumina HiSeq数据;获得55.08 Gb PacBio数据,reads平均长度为14 179 bp;获得Hi-C数据量约143 Gb;拼接得到该基因组contig序列总长为1.16 Gb,Hi-C纠错后contig N50为22.63 Mb;Hi-C挂载染色体,共有1.12 Gb长度的序列可以挂载到12条染色体上,占比97.16%;其中,能够确定顺序和方向的序列长度为1.08 Gb,占定位染色体序列总长度的96.11%,得到基因组大小1.25 Gb;预测有64.22%的重复序列,41 571个基因,99.06%的基因可以注释到NR、GO、KEGG等数据库中;预测得到4 360个tRNA、5 677个rRNA、154个miRNA;得到449个假基因。香瓜茄与马铃薯的进化时间大约在12.82 MYA。  相似文献   

4.
5.
本研究采用Illumina HiSeq TM 2500测序平台对阿尔泰蝠蛾Hepialus altaicola Wang幼虫进行转录组测序及生物信息学分析.经序列拼接后共获得100133个Unigenes,总长度86319112 bp,平均长度862 bp,N50长度1628 bp.将Unigenes与NR、COG/KOG、Pfam、Swiss-Prot、GO、KEGG数据库比对,共获得38198条Unigenes,其中Nr数据库注释的Unigenes最多,为32381条,占32.34%.通过GO功能分类,共有13216个Unigenes在GO数据库中细胞组分、分子功能和生物学过程等3大类57个分支中找到注释;KEGG通路分析,共有15058条Unigenes被注释,归属于305条代谢通路.CDS预测发现54002条序列可被编码,占全部基因的53.93%.基因注释进一步获得311个与冷适应相关的代谢调节基因,并用FPKM值对基因表达量进行评估.本研究获得的转录组信息及分析结果,为进一步研究阿尔泰蝠蛾的基因功能及低温生态适应性奠定分子基础.  相似文献   

6.
榆瘿蚜取食侵染榆树叶片形成了榆树虫瘿,本研究采用新一代的高通量Illumina Hi SeqTM 2000技术测序平台对榆瘿蚜取食刺激的榆树叶片进行转录组测序和功能注释,利用生物学方法对基因表达和功能进行研究。测序获得23.19 Gb碱基序列信息,通过对测序数据进行序列过滤、拼接和去冗余,共获得102 017个Unigenes,通过NR与BLAST等数据库比对,其中有37 899个(37.15%) Unigense被注释。利用KOG、GO、KEGG等数据库对榆树虫瘿叶片的Unigense进行比对,按功其能将匹配的Unigenes基因划分25大类;GO注释将信息归纳为基因的3大主类,57个亚类;以KEGG数据库为参考,将Unigene定位到110个不同的代谢通路,包括氧化应激防御、植物激素信号转导、碳水化合物以及次生物代谢等代谢相关的Unigenes通路。本研究通过二代高通量转录组测序技术研究榆瘿蚜侵染下榆树虫瘿的相关基因,为今后研究榆瘿蚜侵染榆树叶片形成虫瘿的分子机理提供了基础资料。  相似文献   

7.
内生真菌Shiraia sp. Slf14是从植物蛇足石杉(Huperzia serrata)中分离出来的一株能产生石杉碱甲和竹红菌素A的菌株。为了解菌株Shiraia sp. Slf14的基因特征,对该菌株进行全基因组测序。基于二代测序技术对蛇足石杉内生真菌Shi-raia sp. Slf14的全基因组进行测序分析,通过生物信息学相关软件进行质量控制及组装、功能注释、比较基因组学分析及系统发育分析和次生代谢产物分析。内生真菌Shiraia sp. Slf14的基因组大小为32 067 383 bp, N50的值为525 954 bp, G+C含量为47.96%;预测得到基因组中共有11 242个编码序列(coding sequences, CDS)、 106个tRNA和27个rRNA;在GO、 KEGG、 KOG和CAZY中分别注释到3 822个、 3 223个、 8 837个和563个基因;系统发育结果表明内生真菌Shiraia sp. Slf14属于竹黄菌属(Shiraia)。预测结果表明,内生真菌Shiraia sp. Slf14中存在50个次生代谢产物合成基因簇,具有合成多种...  相似文献   

8.
玉米象Sitophilus zeamais是一种世界性的储粮害虫,但其基因信息尚不完善.本研究利用高通量测序平台Illumina HiSeq TM2000对玉米象成虫进行转录组测序,总计获得64358条unigenes,总长度39481752 bp,最短201 bp,最长29046 bp,平均长度613 bp.将unigenes序列在7大数据库Nr、GO、Swissprot、KOG、Pfam、KEGG、TrEMBL中进行注释,分别有25271、20747、16477、12060、9471、3370、25500条unigenes获得注释.通过GO功能分类,共有20747条unigenes在GO数据库中生物学过程、细胞组分、分子功能3大类68个亚类功能组中找到对应.KOG结果显示,12606条unigenes归到25个基因家族.通过KEGG代谢通路分析,共有3370条unigenes被注释,分别归属于细胞进程、环境信息进程、遗传信息进程、新陈代谢和有机体系统5大类代谢途径,共33个亚类274个功能通路.进一步的数据分析,共鉴定出146081个SNP位点和5002个简单序列重复(SSR)位点.本研究获得的玉米象转录组信息,为玉米象的功能基因挖掘提供了重要的信息资源.  相似文献   

9.
刘莉  舒江平  韦宏金  张锐  沈慧  严岳鸿 《生物多样性》2016,24(12):1325-1568
岩穴蕨(Monachosorum maximowiczii)隶属于碗蕨科稀子蕨属, 是东亚中高海拔地区所特有的珍稀濒危植物。为了在分子水平对该物种有进一步的认识, 本文首次利用二代高通量测序技术(RNA-seq)对岩穴蕨进行了转录组测序分析。通过Illumina Hiseq 2500测序平台, 共计获得4.95 Gb原始数据(raw data), 经过滤后得到4.83 Gb有效数据(clean reads), 并进行从头组装得到了101,448条unigene。其中, 54,106条unigene预测到完整的开放阅读框。我们利用目前已知的51个植物基因组数据, 对岩穴蕨的unigene进行了详尽的功能注释, 并通过GO、COG、KEGG注释进一步了解了这些编码基因的作用方式、特征以及所参与的代谢通路。同时, 转录因子分析结果也为岩穴蕨的环境适应机制研究提供了初步线索。  相似文献   

10.
11.
【背景】枯草芽孢杆菌N2-10是一株具有较强抑菌能力且能产纤维素酶等多种水解酶的革兰氏阳性菌,在发酵饲料中具有较大的应用潜力。【目的】通过获得枯草芽孢杆菌N2-10的全基因组序列信息,进一步解析菌株次级代谢产物合成基因信息,并通过比较基因组学分析菌株N2-10与模式菌株的差异性,为阐明N2-10抑菌和益生机制提供理论基础。【方法】通过二代Illumina NovaSeq联合三代PacBio Sequel测序平台,对菌株N2-10进行全基因组测序,将测序数据进行基因组组装、基因预测与功能注释,并利用比较基因组学分析N2-10与其他菌株的差异。【结果】菌株N2-10基因组大小为4 036 899 bp,GC含量为43.88%;共编码4 163个编码基因,所有编码基因总长度为3594369bp,编码区总长度占基因组总长度的89.04%;含有85个tRNA、10个5S rRNA、10个16S rRNA、10个23S rRNA,以及2个CRISPR-Cas、1个前噬菌体和6个基因岛;在GO (gene ontolog)、COG (clusters of orthologous groups of...  相似文献   

12.
黄唇鱼(Bahaba flavolabiata)为国家二级重点保护野生动物、IUCN(世界自然保护联盟)红色名录的极度濒危物种(CR)。基于其样本数量极其有限,全基因组研究可以提供大量与重要性状相关的功能基因和分子标记,从而揭示其重要生命现象的遗传机制。采用二代测序技术于2018年5月完成了黄唇鱼基因组精细图的测序,分析结果表明,测序得到约202 Gb的高质量数据,总测序深度约为317×;组装得到的基因组大小为637.43 Mb,Contig N50约为88 Kb,Scaffold N50约为4.65 Mb;重复序列约142.72 Mb,占比22.39%,预测得到23743个基因、920个t RNA、85个rRNA、176个假基因;98.46%的基因可以注释到NR、GO等数据库中;有67个基因家族是黄唇鱼所特有的。本研究从单碱基错误率、核心基因完整性及二代Reads比对分析3个方面对黄唇鱼基因组精细图的组装结果进行了评估,结果显示所组装的基因区的完整性较好。黄唇鱼基因组序列图谱的绘制完成,对于黄唇鱼自然资源的保护和种质资源挖掘具有极其重要的科学意义。  相似文献   

13.
解淀粉芽孢杆菌生防菌BS-3全基因组测序及生物信息分析   总被引:1,自引:0,他引:1  
【背景】解淀粉芽孢杆菌BS-3是从健康橡胶树树根中分离获得的一株对真菌具有较强抗菌活性的内生细菌,有作为生物农药的潜力。【目的】解析菌株BS-3的基因组序列信息,以深入研究该菌株防病促生机制及挖掘次级代谢产物基因资源。【方法】采用第二代BGISEQ与第三代Pac Bio平台相结合的测序技术,对生防菌BS-3进行全基因组测序,并对测序数据进行基因组组装、基因预测与功能注释、共线性分析及次级代谢产物合成基因簇预测等。【结果】BS-3全基因组大小为3 870 130 bp,平均GC含量为46.88%,共编码4 161个基因;含有92个t RNA基因、28个r RNA、10个sRNA;含有122个串联重复序列、98个小卫星DNA、2个微卫星。在COG、GO、KEGG、NR和Swiss-Prot数据库分别注释到基因2 875、2 620、1 885、4 040和3 328个。同时,预测到BS-3中有10个次级代谢产物合成基因簇,编码表面活性素、丰原素、多烯类、儿茶酚型嗜铁素等抑菌物质。基因组测序数据提交至NCBI获得GenBank登录号为CP060384。【结论】为基因组层面上解析菌株BS-3具有良好防病效果的内在原因提供基础数据,为深入了解解淀粉芽孢杆菌次级代谢合成途径提供参考信息,对菌株BS-3后续相关研究具有重要意义。  相似文献   

14.
摘要:【目的】枯草芽孢杆菌ATCC 13952是一株肌苷工业生产菌株。为深入研究ATCC 13952菌株积累肌苷的分子机制以及为进一步分子育种研究提供序列背景信息,有必要解析ATCC 13952菌株的基因组序列信息。【方法】本研究采用高通量测序和Sanger测序相结合对ATCC 13952菌株进行全基因组测序,然后使用相关软件对测序数据进行基因组组装、基因预测与功能注释、GO/COG 聚类分析、共线性分析等。【结果】枯草芽孢杆菌ATCC 13952整个基因组大小为3876276 bp,GC含量为45.8%,序列已提交至GenBank 数据库,登录号为CP009748。比较基因组及嘌呤代谢相关基因分析结果显示:枯草芽孢杆菌ATCC 13952与其他几株芽孢杆菌具有较好的基因组共线性关系,嘌呤代谢相关基因编码的蛋白与标准菌株比较发生了一些缺失和突变。【结论】本研究首次报道了一株肌苷生产菌枯草芽孢杆菌ATCC 13952的全基因组序列,分析了基因组基本特征,初步探讨了该菌株积累肌苷的分子机制,为后续的进一步分子育种提供了理论基础。  相似文献   

15.
【背景】枝孢菌SYC63是一株具有重寄生作用和抗菌活性的潜在生防菌株,目前尚无研究报道该菌株的全基因组序列,因此限制了其开发与利用。对该菌株进行基因组测序与分析,将进一步了解其重寄生的分子机制,为其在生物防治上的应用奠定研究基础。【目的】解析枝孢菌SYC63基因组序列信息,初步探究该菌的重寄生作用机制。【方法】利用二代高通量测序平台对枝孢菌SYC63进行全基因组测序,运用相关软件对其测序数据进行基因组组装、基因功能注释、预测次级代谢产物合成基因簇并分析重寄生相关的碳水化合物酶类基因等。【结果】基因组组装后共得到17个contigs,总长度为31 912 211 bp,GC含量为52.80%,预测到12 327个编码基因。其中,4 029、949和6 595个基因分别能在KEGG、COG和GO数据库中被注释到,同时还预测到25个次级代谢产物合成基因簇。对重寄生机制相关的碳水化合物酶类进行分析并与重寄生菌株(拟盘多毛孢菌、木霉及盾壳霉)比较,发现该菌具有较多的糖苷水解酶和糖脂酶基因,而且细胞壁降解酶类基因经锈菌孢子壁处理后在转录组测序中显著上调表达,初步分析了该菌与重寄生木霉在分子水平上的...  相似文献   

16.
藤黄节杆菌(Arthrobacter luteus, A. luteus) ATCC 21606是一种革兰氏阳性短杆状的放线菌。该菌分泌的溶菌酶(Lyticase)能够有效裂解酵母细胞壁,同时能分泌限制性核酸内切酶AluⅠ和热稳定的黄嘌呤氧化酶,但目前还没有该菌株的全基因组序列相关的报道。本研究首先通过对A. luteus ATCC 21606菌株的基因组进行高通量测序;再利用SOAPdenovo、GeneMarks等软件对基因组进行组装和组分分析;接着与COG、GO、KEGG、NR、Swiss-Prot和CAZy数据库比对进行基因功能注释;并利用antiSMASH软件进行次级代谢产物合成基因簇预测;最终得到大小为4 209 480 bp的全基因组序列,GC含量为74.68%,共预测到编码基因3 741个。基因序列已提交至美国国立生物技术信息中心(NCBI)的GenBank数据库,登录号为RQIK000-00000。本研究首次报道了A. luteus ATCC 21606的全基因组序列,为后续该菌株的功能基因、代谢产物合成途径及比较基因组学等相关研究提供基础。  相似文献   

17.
颜氏大疣蛛Macrothele yani个体大、毒性强、易取毒,是农林生态系统中害虫的重要天敌,也是天然药物研究工作者进行新药挖掘和毒液开发利用的重要选择对象。本研究利用高通量测序平台Illumina Hiseq 2000对颜氏大疣蛛雌雄成体的毒腺进行转录组测序和生物信息学分析,共获得转录组样本数据37.8 G,总计301 024条unigenes,总长度170 512 372 bp,最短201 bp,最长36 105 bp,平均长度566 bp,GC含量平均值为38.17%,N50长度为705 bp。将unigenes序列与NR(非冗余蛋白序列数据库)、String(蛋白质相互作用数据库)、Swiss-prot(蛋白质序列数据库)、Pfam(蛋白质家族数据库)、GO(基因本体论)、KOG(真核生物蛋白质直系同源数据库)、KEGG(京都基因与基因组百科全书)数据库进行比对(e≤10^-10),分别获得31 409、6 549、11 817、8 216、11 480、7 804条unigenes注释。通过生物信息学对雌雄颜氏大疣蛛unigenes进行表达量分析,筛选高表达量且高可信度的差异表达基因,并进行对这些差异基因进行GO和KEGG功能富集分析;与雄蛛相比,雌成体有205条unigenes表达量上调,113条unigenes表达量下调。最后在所有的转录本数据中共比对到68条毒素相关序列。本研究获得的颜氏大疣蛛转录组信息,为颜氏大疣蛛的功能基因挖掘提供了重要的信息资源。  相似文献   

18.
小单孢菌(Micromonospora rifamycinica)AM105是一种高GC含量的革兰氏阳性放线菌,分离自中国南海红树林沉积物,能够合成利福霉素类抗生素。目前,还没有相关研究报道Micromonospora rifamycinica的全基因组序列,这限制了代谢产物合成途径和比较基因组学等研究。本研究首次通过高通量测序技术对小单孢菌AM105进行全基因组测序,使用Velvet软件进行组装拼接得到388个Contigs,整个基因组大小约6.85 Mb,GC含量为73.1%,序列已提交至美国国立生物技术信息中心(NCBI)的Gen Bank数据库(LRMV01000000)。本研究同时对基因组序列进行了基因预测与功能注释、COG和GO聚类分析及次级代谢产物合成基因簇预测等,相关研究结果将为小单孢菌Micromonospora rifamycinica的功能基因组学研究提供基础数据。  相似文献   

19.
麦红吸浆虫Sitodiplosis mosellana(Gehin)是一种世界性的小麦害虫。为获得其转录组信息,本研究采用新一代高通量测序技术Illumina HiSeq TM 2000对麦红吸浆虫成虫转录组进行测序。共获得转录组样本数据量为27.88 G,经分析共获得59257个Unigenes,总长度49861164 bp,最短20 bp,最长29282 bp,平均长度841 bp。将Unigenes序列与NR、NT、Swiss-Prot、KEGG、GO和KOG数据库进行比对(e≤10-10),共获得95029个结果。通过GO功能分类,共有19584个Unigenes在GO数据库中细胞组分、分子功能和生物学过程等3大类50个功能组中找到对应。与KOG数据库进行比对,共有11279个麦红吸浆虫Unigenes被注释,按功能大致可分为26类。通过KEGG pathways分析,共有9110个麦红吸浆虫Unigenes被注释,分别归属于细胞进程、环境信息进程、遗传信息进程、新陈代谢和有机体系统5大类代谢途径,主要包括细胞生长与死亡、细胞运动、信号转导、能量代谢等32类代谢途径。CDS预测发现30088条序列可被编码,占全部基因的50.78%。SSR位点查找发现,在59257个Unigenes中共找到36323个SSR位点,发生率为61.30%。本研究获得的巨大的麦红吸浆虫转录组信息,为麦红吸浆虫的功能基因挖掘提供了重要的信息资源。  相似文献   

20.
为发掘大鲵的功能基因,该研究以大鲵组织作为研究对象,利用RNA-seq技术对大鲵进行转录本测序和数据分析,经拼接组装共获得132 912条Unigenes,序列平均长度690 bp,N50为1 263 bp。另外从长度分布、GC含量与表达水平等方面对Unigenes进行评估,数据显示测序质量好,可信度高。此外,本研究也预测出132 416个能编码蛋白的Unigenes。使用9大数据库CDD、KOG、NR、NT、PFAM、Swiss-Prot、Tr EMBL、GO和KEGG注释大鲵转录组Unigenes,分别对应有24 049、18 406、36 711、15 858、20 500、27 515、36 705、28 879和10 958条Unigenes获得注释。其中,6 323条Unigenes在以上所有数据库中同时注释成功,39 672条Unigenes至少被一个数据库注释。KEGG分析结果显示:获得注释的10 958条Unigenes被划分到343个代谢通路中,参与信号转导通路的Unigenes数最多,共有2 644条(24.12%);其次是免疫系统通路的Unigenes有2 450条(15.29%)。最后本研究还检测到了29 790个SSR位点。通过对大鲵转录组测序,获得了大量的转录组信息,有助于进一步研究大鲵功能基因克隆、基因组学、遗传多样性分析和分子标记开发等。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号