首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 953 毫秒
1.
【目的】利用已获得的纳米孔长读段测序数据完善现有的蜜蜂球囊菌Ascosphaera apis参考基因组注释信息,并对未注释的新基因和新转录本进行鉴定和功能注释。【方法】基于已获得的纳米孔长读段测序数据,采用gffcompare软件将蜜蜂球囊菌全长转录本与参考基因组注释的转录本进行比较,进而对参考基因组注释基因的非翻译区(untranslated region, UTR)进行延长。利用TransDecoder软件对蜜蜂球囊菌基因的开放阅读框(open reading frame, ORF)及相应的氨基酸序列进行预测。通过MISA软件发掘长度在500 bp以上的全长转录本的SSR位点。通过Blast工具将鉴定到的新基因和新转录本比对Nr, KOG, eggNOG, Swiss-Prot, Pfam, GO和KEGG数据库进行功能注释。【结果】共对蜜蜂球囊菌的9 481个基因进行了UTR延长,其中5′UTR和3′UTR延长的基因分别有4 744和4 737个。共预测出10 492个完整ORF,其中编码长度分布在0~100和100~200个氨基酸的ORF最多,分别占ORF总数的38.96%和3...  相似文献   

2.
【目的】利用前期获得的高质量纳米孔长读段测序数据对意大利蜜蜂Apis mellifera ligustica的丝氨酸/苏氨酸蛋白激酶基因和全长转录本进行鉴定和分析,为深入开展功能研究提供参考信息和基础。【方法】基于前期获得的高质量意大利蜜蜂纳米孔长读段测序数据,通过Blast工具将意大利蜜蜂全长转录本比对Nr数据库筛选出丝氨酸/苏氨酸蛋白激酶基因和全长转录本;利用gffcompare软件将筛选出的丝氨酸/苏氨酸蛋白激酶全长转录本与西方蜜蜂A.mellifera参考基因组(Amel_HAv3.1)上注释的转录本进行比较,以鉴定未注释的新基因和新转录本;使用Astalavista软件鉴定丝氨酸/苏氨酸蛋白激酶基因的可变剪接(alternative splicing, AS)事件类型,采用IGV浏览器对剪接体的结构进行可视化,通过RT-PCR验证随机选取的6次AS事件的真实性。【结果】共鉴定到意大利蜜蜂丝氨酸/苏氨酸蛋白激酶71个基因和335条全长转录本,发掘出未注释的1个新基因和97条新转录本;共对14个已注释基因进行了结构优化,分别延伸了6个基因的5′端和8个基因的3′端。共鉴定到意大利...  相似文献   

3.
【目的】柞蚕核型多角体病毒(Antheraea pernyi nucleopolyhedroviruses, AnpeNPV)能引起柞蚕脓病大面积暴发。尽管之前已完成了两株核型多角体病毒的基因组测序,但基于比较基因组的方法调查AnpeNPV间的遗传变异研究则相对较少。【方法】为了研究AnpeNPV不同地理株系间的遗传多样性,我们测序了1株从中国河南省分离的柞蚕NPV(AnpeNPV-H)基因组,并和之前从辽宁省分离的2株柞蚕NPV(AnpeNPV-L和AnpeNPV-Z)进行了比较基因组学分析。【结果】AnpeNPV-H的全基因组大小为125 605 bp,总共预测了146个开放阅读框(ORF),包括95个功能注释蛋白和51个假定蛋白。我们发现这3株AnpeNPV间的基因组成非常相似。在这3个AnpeNPV株系间,有6个开放阅读框存在碱基变异而导致基因的变短。并鉴定超过200个单核苷酸多态性(single nucleotide variations, SNVs),其中85%位于蛋白编码区。同时,odv-e 56, p94-like 和 egt 3个基因的非同义突变较高,表明这3个蛋白质编码基因可能经历了正向选择或纯化选择。我们发现在这3株AnpeNPV间一些基因的氨基酸发生变异,例如编码膜蛋白的基因、抑制凋亡和蜕皮的基因及与DNA复制相关的DNA聚合酶和解旋酶等基因。最后,展示了3株AnpeNPV间遗传重组的证据。【结论】本研究揭示了AnpeNPV种内水平的变异和株系内基因组的动态结构。  相似文献   

4.
【目的】新金分枝杆菌(Mycobacterium neoaurum)MN4是1株经诱变育种获得的高产雄烯二酮,并且能够耐受高浓度底物植物甾醇的突变菌株。为深入研究MN4菌株耐底物的机制及雄烯二酮的生物合成途径,有必要解析MN4菌株的全基因组序列信息。【方法】本研究采用高通量测序技术对MN4进行全基因组测序,然后使用相关软件对测序数据进行基因组装、基因预测与功能注释、COG聚类分析以及次级代谢产物合成基因簇预测等。【结果】新金分枝杆菌MN4基因组装获得33个Contigs,整个基因组大小为5.39 Mb,GC含量为66.9%,编码4920个蛋白基因,序列提交至Gen Bank数据库,登录号为JXYZ00000000。【结论】本研究首次报道了1株高产雄烯二酮菌株MN4的全基因组序列,分析了基因组的基本特征,初步解析了该菌株降解植物甾醇生产雄烯二酮的关键基因,将为MN4的功能基因组学研究及相关次级代谢产物的生物合成途径与异源表达研究提供基础。  相似文献   

5.
【目的】鉴定洛斯里被毛孢OWVT-1菌株的线粒体基因组,验证公布的USA-87-5菌株线粒体基因组中的错误,对洛斯里被毛孢正确的线粒体基因组序列进行注释并开展不同被毛孢物种间的比较线粒体基因组学分析。【方法】借助DNA高通量测序数据并通过必要的Sanger测序组装OWVT-1的线粒体基因组。通过PCR验证OWVT-1与公布的USA-87-5线粒体基因组序列差异的真实性。利用多种生物信息方法分析和注释洛斯里被毛孢的线粒体基因组。【结果】公布的洛斯里被毛孢USA-87-5菌株的线粒体基因组存在几处序列错误,包括3处长片段的插入缺失和多处短片段的插入缺失。实际上,洛斯里被毛孢USA-87-5与OWVT-1菌株的线粒体基因组序列完全相同。该菌的线粒体基因组全长62949 bp,在7个基因中共插入13个内含子,部分内含子和基因间区显现出序列退化的特征。洛斯里被毛孢、明尼苏达被毛孢、线虫被毛孢的线粒体基因组具有较强的共线性关系。除一些独立的ORF外,核心蛋白编码基因、rRNA基因和tRNA基因的排列顺序非常保守。基因间区的长短是影响3种被毛孢线粒体基因组大小最主要的因素。【结论】公布的洛斯里被毛孢USA-87-5菌株线粒体基因组中存在序列错误。本文新报道了OWVT-1菌株的线粒体基因组,并进行注释和比较线粒体基因组学分析。  相似文献   

6.
【目的】解析出芽短梗霉CCTCC M2012223的基因组序列信息,分析其代谢产物聚苹果酸、黑色素、普鲁兰多糖合成相关基因,为深入研究遗传多样性和代谢工程改造提供序列背景信息。【方法】使用Illumina Hi Seq高通量测序平台对出芽短梗霉CCTCC M2012223菌株进行全基因组测序,并对测序数据进行序列拼接,基因预测与功能注释,COG/GO聚类分析,比较基因组学分析等。下载其他5株出芽短梗霉基因组序列,比较分析6株菌的种内同源基因、全基因组进化以及代谢产物合成相关基因。【结果】出芽短梗霉CCTCC M2012223基因组序列全长30756831 bp,GC含量47.49%,编码9452个基因。比较基因组分析表明出芽短梗霉CCTCC M2012223的基因组组装长度最长,6株菌的同源基因数达到7092个,普鲁兰多糖和聚苹果酸合成相关基因的蛋白序列有很高的保守性。出芽短梗霉CCTCC M2012223和Aureobasidium pullulans var.melanogenum亲缘关系最近,而这2株菌的黑色素合成相关基因的蛋白序列有一些插入和突变。【结论】本研究解析了出芽短梗霉CCTCC M2012223的基因组序列信息,获得黑色素、普鲁兰多糖和聚苹果酸合成相关基因,为后续的代谢机制解析和改造提供相关依据。  相似文献   

7.
【目的】荔枝蒂蛀虫Conopomorpha sinensis Bradley是专一性危害我国华南地区荔枝和龙眼的重要害虫,隐蔽性强,防治困难,基因组信息缺乏。本研究的目的是获得荔枝蒂蛀虫的基因数据,寻求有效控制害虫的分子靶标。【方法】采用新一代高通量测序技术Illumina Hi SeqTM4000对荔枝蒂蛀虫进行转录组测序和生物信息学分析。【结果】经序列拼接获得68 996条unigenes。进一步利用七大公共数据库进行同源比对,注释了22 348 unigenes。注释到Nr数据库的unigenes数量最多,达27.01%,其中Nr注释的荔枝蒂蛀虫unigenes中与小菜蛾Plutella xylostella unigenes同源性最高,达34.1%。将unigenes与GO数据库比对发现,15 585条unigenes根据其功能大致可分为3类47亚类。KEGG pathways分析表明,7 272条unigenes定位为267个代谢通路。基因注释进一步筛选鉴定获得100个荔枝蒂蛀虫嗅觉相关基因;与鳞翅目相关气味结合蛋白基因联合分析发现,与荔枝蒂蛀虫气味结合蛋白基因直系同源的有18组,部分基因形成独立一簇。【结论】本研究首次获得了荔枝蒂蛀虫的转录组数据,研究结果为生物控制荔枝蒂蛀虫提供了重要的基础数据和候选分子靶标。荔枝蒂蛀虫独有的气味结合蛋白基因可能与其生境中特有的化学物质相关。  相似文献   

8.
【目的】为了阐明乳酸乳球菌乳酸亚种KLDS4.0325的生理及代谢机制,并对其重要功能基因进行挖掘,我们对菌株KLDS4.0325的全基因组序列进行测定和基因组图谱的绘制,并利用生物软件和数据库完成对序列的注释及相关功能性分析。【方法】在菌株序列完成测序、组装和注释后,根据序列信息进行全基因组图谱的绘制,并对菌株的蛋白质水解系统、氨基酸来源的风味形成途径和B-族维生素合成途径进行了比较基因组分析,并对细菌素合成基因组和冷应激蛋白基因进行了预测。【结果】菌株KLDS4.0325基因组全长2589250 bp,G+C含量为35.4%,共预测出2662个开放阅读框,其中1310个具有潜在的生物学功能。菌株可以有效的对细胞外蛋白质进行有效的水解,具有潜在的降低苦味肽以及产生一系列能够抑制血管紧张素转化酶活性的活性肽。在转氨途径方面,菌株KLDS4.0325具有较为完成的酶系统,可以催化相关氨基酸转化为风味物质。在菌株KLDS4.0325的基因组中,我们发现了较多编码糖转运、代谢以及L-乳酸合成的基因。关于叶酸和核黄素合成途径的编码基因在菌株KLDS4.0325的基因组中也较为完整。此外,我们在菌株KLDS4.0325的基因组中预测出了一个关于乳球菌素的基因簇和两个冷应激蛋白Csp D和csp E的编码基因。【结论】这些编码菌株显著特性基因的存在为菌株KLDS4.0325能够进行工业发酵提供了理论基础,并为其进一步研究提供了方向。  相似文献   

9.
【目的】构建入侵种松树蜂Sirex noctilio毒腺转录组数据库,筛选并分析松树蜂毒腺基因数据。【方法】采用新一代高通量测序平台Illumina HiSeqTM 4000对松树蜂雌成虫毒腺进行转录组测序、数据组装和生物信息学分析。【结果】共获得12.7 Gb松树蜂雌成虫毒腺有效转录组数据,并组装到37 098条unigenes,平均长度968 bp,N50长度为2 364 bp。将所得的unigenes数据使用BlastX与各大数据库比对,共注释到13 515条unigenes,并且在NR数据库中注释的unigenes最多,共11 108条(占总数的29.94%),其中相似基因占比最高的物种为丽蝇蛹集金小蜂Nasonia vitripennis,达815条(占总数的7.29%)。在GO数据库中注释到5 726条unigenes,根据功能被分为生物学进程、细胞组分和分子功能3大类63个亚类。KEGG代谢通路分析表明,7 602条unigenes注释到357个代谢通路。根据基因注释信息进一步筛选到43条嗅觉相关基因,包括嗅觉受体(odorant receptor, Or)基因25条、化学感受蛋白(chemosensory protein, CSP)基因10条、离子型受体(ionotropic receptor, IR)基因5条和气味结合蛋白(odorant binding protein, OBP)基因3条。此外,还筛选出11条漆酶基因,包括漆酶1(laccase1, LAC1)基因5条、漆酶2(laccase2, LAC2)基因4条、漆酶4(laccase4, LAC4)基因1条和漆酶9(laccase9, LAC9)基因1条,且其中1条LAC2基因在所有被注释的基因中表达量最高(FPKM值=21 126)。【结论】本研究获得的松树蜂毒腺转录组数据为松树蜂毒液组分的鉴定和生物学功能的研究奠定了一定的理论基础。  相似文献   

10.
目的虹鳟热应激下肝RNA-seq数据中新转录本的分析及已注释基因结构优化。方法以虹鳟肝为材料提取总RNA,构建cDNA文库,并利用Illumina双端测序Hiseq 2500平台进行测序。运用Cufflinks软件对测序数据进行组装,将其与虹鳟参考基因组进行序列比对。结果发掘新转录本6555个,其中30个新转录本在热应激前后差异表达(P<0.05)。与GO数据库比对对新转录本进行功能注释,获得3097个新转录本的注释。与KEGG数据库比对,共有3617个新转录本注释到284条代谢通路中。对19 424个已注释基因的结构进行优化,延伸了14 719个基因的5′端和14 796个基因的3′端。结论通过对发掘的6555个新转录本分析,并对19 424个已注释基因结构优化,为虹鳟基因组注释信息的完善提供了有力的借鉴,并为进一步了解虹鳟热应激的机制提供更有力的理论基础。  相似文献   

11.
【目的】利用纳米孔(nanopore)测序技术鉴定中华蜜蜂Apis cerana cerana工蜂幼虫肠道中细胞色素P450(cytochrome P450, CYP450)基因及其全长转录本,为后续功能研究提供参考信息和基础。【方法】通过Nanopore PromethION平台对中华蜜蜂工蜂4-6日龄幼虫肠道进行转录组测序。利用Guppy软件对原始读段(raw reads)进行质控以得到有效读段(clean reads)。通过识别两端引物鉴定全长转录本序列。使用BLAST工具将上述全长转录本的序列比对到Nr和GO数据库以鉴定CYP450基因及其全长转录本。采用Astalavista软件鉴定基因的可变剪接(alternative splicing, AS)事件。通过RT PCR验证不同类型AS事件的可靠性。【结果】在中华蜜蜂工蜂4-6日龄幼虫肠道中分别测得7 338 627, 7 003 419和7 434 233条原始读段,经质控得到的有效读段数分别为7 289 494, 6 959 880和7 387 756条。鉴定到的非冗余全长转录本总数为48 200条。共鉴定到47个CYP450基因和265条CYP450基因全长转录本。共鉴定到CYP450基因的90次AS事件,包括36次外显子跳跃事件、20次可变5′端剪接位点事件、17次内含子保留事件、9次可变3′端剪接位点事件及8次外显子互斥事件。RT PCR结果证实随机选取的3种AS事件类型真实可靠。【结论】鉴定了中华蜜蜂的CYP450基因及其全长转录本,补充了东方蜜蜂参考基因组的相关注释,并揭示中华蜜蜂CYP450基因可通过多种AS类型产生丰富的剪接体。  相似文献   

12.
[目的]本研究旨在探究蜜蜂球囊菌Ascosphaera apis(简称“球囊菌”)菌丝(Aam)和孢子(Aas)中的全长转录本与菌丝生长、孢子萌发以及有性生殖的相关性.[方法]将前期获得的Aam和Aas的Nanopore长读段测序数据中的有效读段与球囊菌参考基因组注释的已知转录本进行序列比对,获取全长转录本与已知转录本...  相似文献   

13.
草地贪夜蛾雄性成虫和5龄幼虫的转录组比较分析   总被引:1,自引:0,他引:1  
【目的】草地贪夜蛾Spodoptera frugiperda是一种新近入侵我国的重要害虫。本研究旨在对草地贪夜蛾雄性成虫和5龄幼虫两个不同发育阶段的转录组进行比较分析。【方法】利用高通量测序技术对草地贪夜蛾雄性成虫和5龄幼虫进行转录组测序和数据组装,并对转录组数据进行功能注释和比较分析。【结果】经de novo组装共获得209 002条转录本,平均长度为687.55 bp,N50为982 bp。共有46 198条(57.43%) unigene在至少一个数据库中获得功能注释,其中1 713条(2.13%) unigene在所有数据库中均能获得注释。在GO数据库中获得205 269条unigene的注释,主要包括68个功能分类;在KEGG数据库中共有3 408条unigene得到注释,涉及277个代谢通路。共鉴定到424个嗅觉相关的基因,并且在雄性成虫和5龄幼虫之间的表达存在差异。通过比较转录组分析,在雄性成虫中鉴定到9 162个上调和6 399个下调差异表达基因(DEGs);功能富集分析发现在上调DEGs中涉及信息素以及信号转导的代谢通路显著富集,而下调DEGs中涉及解毒相关的通路显著...  相似文献   

14.
15.
16.
17.
德国小蠊全基因组中微卫星分布规律   总被引:3,自引:0,他引:3  
【目的】分析德国小蠊 Blattella germanica 全基因组中微卫星的数量和分布规律,并对外显子中含有微卫星的基因进行功能注释。【方法】使用微卫星搜索软件查找德国小蠊基因组中微卫星的数量、重复次数以及所有微卫星的位置信息,编写Python脚本对微卫星进行定位,并通过Blast2Go和KASS程序对外显子中含有微卫星的基因进行功能注释。【结果】共找到1~6碱基重复类型的微卫星序列604 386个,总长度15 301 255 bp,约占全基因组序列(约2.04 Gb)的0.75%,分布频率为1/3.37 kb,微卫星序列的长度主要在12~60个碱基长度范围内。不同类型的微卫星中,三碱基(226 876)重复类型微卫星数量最多,占微卫星总数的37.54%;四碱基(150 355)重复类型次之,占微卫星总数的24.88%;其余依次是单碱基(141 167)、二碱基(60 877)、五碱基(21 570)和六碱基(3 541)重复类型,分别占微卫星总数的23.36%, 10.07%, 3.57%和0.59%。出现最多的重复拷贝类别有:ATT, AAT, A, T, AAAT, ATTT和AT,共411 789个微卫星,占微卫星总数的68.13%,这7种类别的微卫星数量均大于30 000个。共有2 372个微卫星在外显子上,它们分别位于1 481个基因上。GO功能注释结果表明,其中434条归类于细胞组分(cellular component),402条归类于分子功能(molecular function),660条归类于生物学过程(biological process)。KEGG通路分析结果表明,与新陈代谢相关的基因最多(380个),其次是与机体系统相关的(276个),与遗传信息进程相关的基因最少(92个)。【结论】本研究为进一步系统深入分析德国小蠊微卫星功能及微卫星分子标记筛选打下了基础。  相似文献   

18.
张锋  洪波  王远征  李英梅  陈志杰 《昆虫学报》2019,62(11):1305-1314
【目的】从线粒体基因组水平上探讨枣食芽象甲Scythropus yasumatsui与近缘种的系统发育关系。【方法】利用Illumina MiSeq测序平台对枣食芽象甲线粒体基因组进行测序,对基因组序列进行拼装、注释和特征分析;利用贝叶斯法和最大似然法构建基于象甲科13个物种的线粒体基因组13个蛋白质编码基因核苷酸序列的系统发育树。【结果】结果表明,枣食芽象甲线粒体基因组全长为16 472 bp (GenBank登录号: MF807224),包含13个蛋白质编码基因、22个tRNA基因、2个rRNA基因和2个非编码控制区,37个基因的排列顺序与祖先昆虫的线粒体基因排列顺序一致。13个蛋白质编码基因的起始密码子为ATN,其中除了cob和nad1基因的完全终止密码子为TAG外,其余11个基因的完全终止密码子为TA(A)。22个tRNA基因中除了trnS1缺少DHU臂,反密码子由GCT变为TCT外,其余均能形成典型的三叶草结构。基于13个蛋白质编码基因序列构建的系统发育树结果显示,象甲科8个亚科系统发育关系为:(((隐喙象亚科(Cryptorhynchinae)+(象虫亚科(Curculioninae)+魔喙象亚科(Molytinae)))+长小蠹亚科(Platypodinae))+(粗喙象亚科(Entiminae)+Cyclominae亚科))+隐颏象亚科(Dryophthorinae)+小蠹亚科(Scolytinae))。【结论】在13种象甲科昆虫物种中,同属于粗喙象亚科的枣食芽象甲与南美果树象甲Naupactus xanthographus在系统发育树中聚为同一分支,表明基于线粒体基因组全序列的分子系统发育结果与传统的形态分类结果是一致的。  相似文献   

19.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号