首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
红豆越橘是一种新兴水果,具有较高的营养及食疗药用价值。本研究利用高通量测序技术对野生红豆越橘的幼叶转录组进行了测序,并对测序数据进行生物信息学分析。总共获得大约2 G的纯净数据,拼装了48 736条Unigenes。GO数据库注释到的Unigenes分别涉及到生物学过程、细胞成分及分子功能相关的共43种生理代谢功能;18 728条Unigenes能被KOG数据库注释,共涉及25条代谢通路;8 321条Unigenes能被KEGG数据库成功注释,共涉及到5个功能大类、20个功能中类、123条代谢通路;30 467条Unigenes可被Nr数据库注释;21 551条Unigenes可被Swissprot数据库注释;以上4个数据库共注释到30 545条Unigenes,占全部Unigenes的62.67%;被以上4个数据库均注释到的Unigene为6 075条,占全部Unigenes的12.47%。同时,生物信息学分析还显示:全部Unigenes中,有5 197条Unigenes编码转录因子,涉及57个家族;2 747条Unigenes编码抗性基因,涉及19个家族。共检测到8 099个SSR位点,其中2碱基重复的SSR位点达5 791个,占SSR位点总数的71.52%。以上研究结果对了解红果越橘的生长发育、生理生化等分子机制,对进一步进行红豆越橘分子方面的相关研究均具有较强的参考价值。  相似文献   

2.
韩霜  徐浩  余静雅  韩赟  张发起 《广西植物》2023,43(7):1335-1346
皱边喉毛花为藏药藏茵陈基源植物之一,其包含丰富的药用成分。为进一步了解皱边喉毛花转录组,丰富其基因注释、代谢通路等遗传信息,该研究利用PacBio测序平台对皱边喉毛花叶片进行全长转录组测序。结果表明:(1)全长转录组测序共获得17 Gb的高质量数据,对795 698 个CCS序列进行聚类和去冗余,最终获得87 814 条高质量的全长转录本。(2)与7个数据库比对后,共有277 451 条转录本注释成功,其中注释到NR数据库的转录本最多,有39 214 条。26 396 条转录本成功注释到KOG数据库中,共有26 个子类。39 104 条转录本注释到KEGG数据库中,涉及6 个主要通路和40 个子通路。39 102 条转录本注释到GO数据库中,按分子功能、生物学过程和细胞成分3大类对注释成功的转录本进行分类。(3)SSR分析共鉴定到22 861 个SSR,其中单碱基重复最为丰富; 共检测到1 874 个转录因子和15 166 个长非编码RNA(LncRNA),而注释到转录本最多的转录因子家族是C3H。(4)筛选出55 条与单萜类及黄酮类化合物合成相关的转录本。该研究结果丰富了皱边喉毛花的转录组信息,为进一步筛选皱边喉毛花药用成分合成相关的关键基因提供了重要的遗传资源。  相似文献   

3.
榆瘿蚜取食侵染榆树叶片形成了榆树虫瘿,本研究采用新一代的高通量Illumina Hi SeqTM 2000技术测序平台对榆瘿蚜取食刺激的榆树叶片进行转录组测序和功能注释,利用生物学方法对基因表达和功能进行研究。测序获得23.19 Gb碱基序列信息,通过对测序数据进行序列过滤、拼接和去冗余,共获得102 017个Unigenes,通过NR与BLAST等数据库比对,其中有37 899个(37.15%) Unigense被注释。利用KOG、GO、KEGG等数据库对榆树虫瘿叶片的Unigense进行比对,按功其能将匹配的Unigenes基因划分25大类;GO注释将信息归纳为基因的3大主类,57个亚类;以KEGG数据库为参考,将Unigene定位到110个不同的代谢通路,包括氧化应激防御、植物激素信号转导、碳水化合物以及次生物代谢等代谢相关的Unigenes通路。本研究通过二代高通量转录组测序技术研究榆瘿蚜侵染下榆树虫瘿的相关基因,为今后研究榆瘿蚜侵染榆树叶片形成虫瘿的分子机理提供了基础资料。  相似文献   

4.
本研究采用Illumina HiSeq TM 2500测序平台对阿尔泰蝠蛾Hepialus altaicola Wang幼虫进行转录组测序及生物信息学分析.经序列拼接后共获得100133个Unigenes,总长度86319112 bp,平均长度862 bp,N50长度1628 bp.将Unigenes与NR、COG/KOG、Pfam、Swiss-Prot、GO、KEGG数据库比对,共获得38198条Unigenes,其中Nr数据库注释的Unigenes最多,为32381条,占32.34%.通过GO功能分类,共有13216个Unigenes在GO数据库中细胞组分、分子功能和生物学过程等3大类57个分支中找到注释;KEGG通路分析,共有15058条Unigenes被注释,归属于305条代谢通路.CDS预测发现54002条序列可被编码,占全部基因的53.93%.基因注释进一步获得311个与冷适应相关的代谢调节基因,并用FPKM值对基因表达量进行评估.本研究获得的转录组信息及分析结果,为进一步研究阿尔泰蝠蛾的基因功能及低温生态适应性奠定分子基础.  相似文献   

5.
对‘华仲12号’杜仲的幼嫩叶片(绿色)和成熟叶片(红色)及‘华仲11号’杜仲成熟叶片(绿色)进行转录组测序,进行测序数据的拼接和组装,且对转录组获得的基因(Unigenes)进行SSR分析。研究得到54 517条平均长度为806.90 bp的Unigenes,其中25 993条Unigenes在Nr、Swiss-Prot、KEGG和COG蛋白数据库获得功能注释,占所有Unigenes的47.68%。参照KEGG数据库,可将注释到的6 910条Unigenes划分到122个代谢途径分支,其中花色苷代谢途径相关酶基因39个,类黄酮代谢途径38个,类胡萝卜素合成途径34个。54 517条Unigenes中共包含17 010个完整型SSR位点,占总SSR位点的96.28%。完整型SSR位点共包含67种重复基元,其中出现频率最高的重复基元类型为单核苷酸重复中的A/T (7 747个),其次是AG/CT (5 039个)和AT/AT (850个)从花色苷代谢途径、类黄酮代谢途径及类胡萝卜素代谢途径中共找到13个SSR位点。为今后杜仲遗传多样性分析、遗传图谱构建及杜仲红叶性状分子标记开发等方面奠定了分子基础。  相似文献   

6.
刘丹  曾钦朦  刘斌  李煜  陈世品 《植物研究》2020,40(4):613-622
采用第二代Illumina HiSeq测序技术对闽楠的木质部、韧皮部、叶片进行转录组测序,分别获得Clean Reads片段41 383 707条、43 343 922条、44 191 586条,经转录本拼接后得到序列总长度达120 535 288 bp的383 331条Conting片段,进一步组装得到平均长度为542 bp的151 729条Unigenes。将闽楠转录组Unigenes进行基因功能注释,与NR数据库比对发现,其与葡萄的相似序列最多(34%),与黄瓜、野草莓、大豆的同源性较低(各占3%);进行GO功能注释,可将其划分为生物过程、细胞成分、分子功能3大类共计52个分支,与eggNOG数据库比对可分为25类,通过KEGG功能注释可知转录组中涉及的基因共参与了176条代谢通路,其中核糖体和碳代谢获得的注释较多。另外通过MISA软件分析,共获得35 972个SSR位点。其中,单核苷酸、二核苷酸和三核苷酸为优势重复类型,SSR位点数分别为21 762(60.50%),8 931(24.83%),4 924(13.69%)。闽楠转录组分析及基因功能注释为深入开展闽楠遗传育种及分子生物学相关研究奠定基础。  相似文献   

7.
麦红吸浆虫Sitodiplosis mosellana(Gehin)是一种世界性的小麦害虫。为获得其转录组信息,本研究采用新一代高通量测序技术Illumina HiSeq TM 2000对麦红吸浆虫成虫转录组进行测序。共获得转录组样本数据量为27.88 G,经分析共获得59257个Unigenes,总长度49861164 bp,最短20 bp,最长29282 bp,平均长度841 bp。将Unigenes序列与NR、NT、Swiss-Prot、KEGG、GO和KOG数据库进行比对(e≤10-10),共获得95029个结果。通过GO功能分类,共有19584个Unigenes在GO数据库中细胞组分、分子功能和生物学过程等3大类50个功能组中找到对应。与KOG数据库进行比对,共有11279个麦红吸浆虫Unigenes被注释,按功能大致可分为26类。通过KEGG pathways分析,共有9110个麦红吸浆虫Unigenes被注释,分别归属于细胞进程、环境信息进程、遗传信息进程、新陈代谢和有机体系统5大类代谢途径,主要包括细胞生长与死亡、细胞运动、信号转导、能量代谢等32类代谢途径。CDS预测发现30088条序列可被编码,占全部基因的50.78%。SSR位点查找发现,在59257个Unigenes中共找到36323个SSR位点,发生率为61.30%。本研究获得的巨大的麦红吸浆虫转录组信息,为麦红吸浆虫的功能基因挖掘提供了重要的信息资源。  相似文献   

8.
基于枇杷转录组序列的SSR分子标记引物开发   总被引:1,自引:0,他引:1  
为获得更多的枇杷SSR引物,对枇杷转录组测序得到的1 kb以上的11 798条Unigenes进行SSR位点搜索。结果在3515 条Unigenes(6.77%)中共获得4438个SSR位点,其中主要重复类型为双碱基重复和三碱基重复,二者占SSR总数的68.27%,而四、五、六碱基重复类型较少,仅占1.42%。对选出的SSR标记采用Primer3进行引物设计,得到7911 对SSR位点特异引物,可用于枇杷遗传多样性分析、分子标记辅助育种、育种群体的建立等研究。  相似文献   

9.
蓝莓营养丰富,富含花青素等抗氧化性活性物质,被誉为"小浆果之王"。为了加深对蓝莓优良品种"瑞蓝"生长发育分子机制的了解,利用第二代测序技术对其2年生苗的幼叶转录组进行测序。获得总共约1 G的有效测序数据,共拼装成41 987条unigenes,其中23 555条unigenes能被GO数据库成功注释,分别涉及到生物学过程、细胞成分及分子功能相关的共35种生理代谢功能;20 379条unigenes能被KOG数据库注视到,共涉及25条代谢通路;9 771条unigenes能被KEGG数据库成功注释,共涉及到5个大类、20个中类、124条代谢通路;27 293条unigenes被Nr数据库成功注释,这些unigenes共对应32 949条蛋白质的编码区。同时,生物信息学分析还显示:全部unigenes中,有5 221条unigenes编码转录因子,涉及到54个家族;2 487条unigenes编码抗性基因,涉及19个家族;共检测到6 261个SSR序列,其中2碱基重复的SSR占68.2%。转录组测序分析结果阐明了"瑞蓝"的生长发育的部分分子信息,对利用其进一步开展分子标记辅助育种等具有较为重要的意义。  相似文献   

10.
采用新一代高通量测序技术平台Illumina Hiseq 2 000对云南松转录组测序,得到的数据进行de novo组装,获得80 000条Unigenes,N50为1 881 nt、平均890 nt。与公共数据库进行比对,注释到NR、NT、Swiss-Prot数据库的Unigenes分别为43 434、46 415、29 418条。将Unigenes与COG数据库比对,有14 792条Unigenes成功注释,根据功能大致分成25类;与GO数据库比对,有26 743条Unigenes获得注释,按功能分为细胞组分、分子功能和生物过程3大类55亚类,其中参与的生物过程较多;以KEGG数据库参考,有25 873条Unigenes参与128条代谢途径分支,以代谢相关的通路较为集中,并找到与木质素合成关键酶的Unigenes。这些研究极大地扩充了云南松的基因资源,将有助于云南松基因的发掘与利用、分子标记的开发及其种质资源遗传改良的研究等。  相似文献   

11.
【目的】中华大仰蝽Notonecta chinensis为中国和日本冲绳分布的重要水生天敌昆虫,可用于蚊虫的生物防治。本研究旨在建立中华大仰蝽转录组数据库,挖掘其基因信息。【方法】采用高通量测序平台Illumina NextSeq500对中华大仰蝽进行转录组测序、de novo组装及生物信息学分析;利用MISA软件基于转录组unigenes数据进行SSR新分子标记筛选。毛细管电泳检测SSR多态性。【结果】总计获得34782282条clean reads(NCBI SRA数据库登录号:SRR13259254),组装成37801条unigenes,N50为913 bp。将unigenes与已知数据库比对进行基因功能注释,分别有36474,32470,27781,35079和5638条序列注释到nr,Swiss-Prot,GO,eggNOG和KEGG数据库。通过GO数据库注释,unigenes的功能可分为生物学过程、细胞组分和分子功能三大类,其中参与细胞、细胞部分及结合功能的unigenes比例较大。eggNOG数据库注释结果显示,37801条unigenes归到25个基因家族,注释到未知功能的最多。KEGG代谢通路富集分析显示,5638条unigenes注释到245个代谢通路,注释到核糖体的数目最多。此外,用MISA软件在转录组测序数据中的37801条unigenes中搜索到3124个SSR位点(占总unigenes的8.26%),发生频率为7.07%。通过PCR筛选出16个SSR位点。7个中华大仰蝽地理种群3个位点NcCF/NcCR,NcKF/NcKR和NcLF/NcLR的多态信息含量(PIC)分别为0.870,0.902和0.857,具高度多态性。【结论】本研究成功获得了中华大仰蝽转录组数据,为其基因功能分析提供了分子理论基础;SSR新标记的开发为中华大仰蝽遗传多样性分析、隐存种鉴定及基因图谱构建提供了更丰富的候选分子标记。  相似文献   

12.
[目的]中华大仰蝽Notonecta chinensis为中国和日本冲绳分布的重要水生天敌昆虫,可用于蚊虫的生物防治.本研究旨在建立中华大仰蝽转录组数据库,挖掘其基因信息.[方法]采用高通量测序平台Illumina NextSeq500对中华大仰蝽进行转录组测序、de novo组装及生物信息学分析;利用MISA软件基于...  相似文献   

13.
李白盾蚧Pseudaulacaspis prunicola (Maskell)寄主范围广泛,是一种重要的入侵害虫。本研究利用高通量测序平台(Illumina NovaSeq 6000)对李白盾蚧进行转录组测序、de novo从头组装及功能注释,在此基础上筛选其微卫星(SSR)位点,并挖掘微卫星引物。研究共获得李白盾蚧转录组60 296条转录本,24 967条单基因(unigenes)序列。通过GO数据库注释,将所有unigenes的功能分为生物学进程、细胞组分和分子功能三大类41个亚类功能区。KOG数据库注释结果显示,5 085条unigenes归到25个基因家族,注释到一般功能预测的数目最多。KEGG代谢通路富集分析显示6 668条unigenes注释到280个代谢通路,其中注释到内质网中蛋白质加工的数目最多。利用MISA软件共搜索到微卫星位点18 193个,分布在9 043条unigenes中,占总unigenes数量的36.22%,平均每2.29 kb出现一个SSR位点。其中主要重复类型为单核苷酸重复,占SSR位点总数的72.03%,其次为三核苷酸重复(15.90%)和二核苷酸重复(8.48%)。单核苷酸重复主要为A/T(71.16%),二核苷酸重复主要为AG/CT(5.20%)。基于Primer Primer 3软件设计出12 538对李白盾蚧SSR引物,从中随机挑选50对引物进行PCR验证,共29对引物可以稳定扩增出目的片段。本研究成功组装了李白盾蚧转录组数据,并基于转录组数据成功筛选出其微卫星位点,为未来该虫的种群遗传学以及入侵生物学研究提供了数据支撑。  相似文献   

14.
草地贪夜蛾雄性成虫和5龄幼虫的转录组比较分析   总被引:1,自引:0,他引:1  
【目的】草地贪夜蛾Spodoptera frugiperda是一种新近入侵我国的重要害虫。本研究旨在对草地贪夜蛾雄性成虫和5龄幼虫两个不同发育阶段的转录组进行比较分析。【方法】利用高通量测序技术对草地贪夜蛾雄性成虫和5龄幼虫进行转录组测序和数据组装,并对转录组数据进行功能注释和比较分析。【结果】经de novo组装共获得209 002条转录本,平均长度为687.55 bp,N50为982 bp。共有46 198条(57.43%) unigene在至少一个数据库中获得功能注释,其中1 713条(2.13%) unigene在所有数据库中均能获得注释。在GO数据库中获得205 269条unigene的注释,主要包括68个功能分类;在KEGG数据库中共有3 408条unigene得到注释,涉及277个代谢通路。共鉴定到424个嗅觉相关的基因,并且在雄性成虫和5龄幼虫之间的表达存在差异。通过比较转录组分析,在雄性成虫中鉴定到9 162个上调和6 399个下调差异表达基因(DEGs);功能富集分析发现在上调DEGs中涉及信息素以及信号转导的代谢通路显著富集,而下调DEGs中涉及解毒相关的通路显著富集。【结论】这些转录组数据为探究草地贪夜蛾的生长发育、嗅觉相关功能基因以及候选分子靶标提供资源信息。  相似文献   

15.
【目的】构建入侵种松树蜂Sirex noctilio毒腺转录组数据库,筛选并分析松树蜂毒腺基因数据。【方法】采用新一代高通量测序平台Illumina HiSeqTM 4000对松树蜂雌成虫毒腺进行转录组测序、数据组装和生物信息学分析。【结果】共获得12.7 Gb松树蜂雌成虫毒腺有效转录组数据,并组装到37 098条unigenes,平均长度968 bp,N50长度为2 364 bp。将所得的unigenes数据使用BlastX与各大数据库比对,共注释到13 515条unigenes,并且在NR数据库中注释的unigenes最多,共11 108条(占总数的29.94%),其中相似基因占比最高的物种为丽蝇蛹集金小蜂Nasonia vitripennis,达815条(占总数的7.29%)。在GO数据库中注释到5 726条unigenes,根据功能被分为生物学进程、细胞组分和分子功能3大类63个亚类。KEGG代谢通路分析表明,7 602条unigenes注释到357个代谢通路。根据基因注释信息进一步筛选到43条嗅觉相关基因,包括嗅觉受体(odorant receptor, Or)基因25条、化学感受蛋白(chemosensory protein, CSP)基因10条、离子型受体(ionotropic receptor, IR)基因5条和气味结合蛋白(odorant binding protein, OBP)基因3条。此外,还筛选出11条漆酶基因,包括漆酶1(laccase1, LAC1)基因5条、漆酶2(laccase2, LAC2)基因4条、漆酶4(laccase4, LAC4)基因1条和漆酶9(laccase9, LAC9)基因1条,且其中1条LAC2基因在所有被注释的基因中表达量最高(FPKM值=21 126)。【结论】本研究获得的松树蜂毒腺转录组数据为松树蜂毒液组分的鉴定和生物学功能的研究奠定了一定的理论基础。  相似文献   

16.
17.
为全面了解余甘子转录组SSR位点的分布特征和变异规律,本研究利用Illumina Hiseq 4000平台对余甘子叶片转录组进行测序,通过MISA软件对获得的Unigenes进行SSR位点搜索和统计分析。结果发现9 538条包含SSR位点的Unigenes,共检测到9 991个SSR位点,平均每5.49 kB出现1个SSR。单碱基和二碱基为余甘子转录组SSR主要重复类型,分别占SSR总数的42.3%和30.79%。位于基因编码区的SSR位点共有1 731个,出现频率为0.039 SSRs/kB,优势重复类型为三碱基重复。余甘子转录组SSR中共有169种重复基元,其中所占比例最高的是A/T(42.10%),其次是AG/CT(22.91%)和AAG/CTT(5.02%)。SSR各基元的重复次数波动于4~75次,且多数集中于4~20次。重复片段长度≥ 20 bp的SSR占21.20%,且SSR发生频率与片段长度呈显著负相关(P<0.01),相关系数为-0.561。本研究获得的余甘子转录组SSR位点出现频率较高、分布密度较大、低级重复基元较多,重复次数较高、长片段较多,大多数SSR位点的多态性潜能较高,用于余甘子遗传多样性分析的潜力较大,为下一步余甘子转录组SSR标记的大规模开发和群体遗传学研究提供了重要的数据信息,进而为余甘子野生资源的保护和合理开发利用提供了参考依据。  相似文献   

18.
19.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号