首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 546 毫秒
1.
红豆越橘是一种新兴水果,具有较高的营养及食疗药用价值。本研究利用高通量测序技术对野生红豆越橘的幼叶转录组进行了测序,并对测序数据进行生物信息学分析。总共获得大约2 G的纯净数据,拼装了48 736条Unigenes。GO数据库注释到的Unigenes分别涉及到生物学过程、细胞成分及分子功能相关的共43种生理代谢功能;18 728条Unigenes能被KOG数据库注释,共涉及25条代谢通路;8 321条Unigenes能被KEGG数据库成功注释,共涉及到5个功能大类、20个功能中类、123条代谢通路;30 467条Unigenes可被Nr数据库注释;21 551条Unigenes可被Swissprot数据库注释;以上4个数据库共注释到30 545条Unigenes,占全部Unigenes的62.67%;被以上4个数据库均注释到的Unigene为6 075条,占全部Unigenes的12.47%。同时,生物信息学分析还显示:全部Unigenes中,有5 197条Unigenes编码转录因子,涉及57个家族;2 747条Unigenes编码抗性基因,涉及19个家族。共检测到8 099个SSR位点,其中2碱基重复的SSR位点达5 791个,占SSR位点总数的71.52%。以上研究结果对了解红果越橘的生长发育、生理生化等分子机制,对进一步进行红豆越橘分子方面的相关研究均具有较强的参考价值。  相似文献   

2.
为发掘大鲵的功能基因,该研究以大鲵组织作为研究对象,利用RNA-seq技术对大鲵进行转录本测序和数据分析,经拼接组装共获得132 912条Unigenes,序列平均长度690 bp,N50为1 263 bp。另外从长度分布、GC含量与表达水平等方面对Unigenes进行评估,数据显示测序质量好,可信度高。此外,本研究也预测出132 416个能编码蛋白的Unigenes。使用9大数据库CDD、KOG、NR、NT、PFAM、Swiss-Prot、Tr EMBL、GO和KEGG注释大鲵转录组Unigenes,分别对应有24 049、18 406、36 711、15 858、20 500、27 515、36 705、28 879和10 958条Unigenes获得注释。其中,6 323条Unigenes在以上所有数据库中同时注释成功,39 672条Unigenes至少被一个数据库注释。KEGG分析结果显示:获得注释的10 958条Unigenes被划分到343个代谢通路中,参与信号转导通路的Unigenes数最多,共有2 644条(24.12%);其次是免疫系统通路的Unigenes有2 450条(15.29%)。最后本研究还检测到了29 790个SSR位点。通过对大鲵转录组测序,获得了大量的转录组信息,有助于进一步研究大鲵功能基因克隆、基因组学、遗传多样性分析和分子标记开发等。  相似文献   

3.
采用新一代高通量测序技术平台Illumina Hiseq 2 000对云南松转录组测序,得到的数据进行de novo组装,获得80 000条Unigenes,N50为1 881 nt、平均890 nt。与公共数据库进行比对,注释到NR、NT、Swiss-Prot数据库的Unigenes分别为43 434、46 415、29 418条。将Unigenes与COG数据库比对,有14 792条Unigenes成功注释,根据功能大致分成25类;与GO数据库比对,有26 743条Unigenes获得注释,按功能分为细胞组分、分子功能和生物过程3大类55亚类,其中参与的生物过程较多;以KEGG数据库参考,有25 873条Unigenes参与128条代谢途径分支,以代谢相关的通路较为集中,并找到与木质素合成关键酶的Unigenes。这些研究极大地扩充了云南松的基因资源,将有助于云南松基因的发掘与利用、分子标记的开发及其种质资源遗传改良的研究等。  相似文献   

4.
麦红吸浆虫Sitodiplosis mosellana(Gehin)是一种世界性的小麦害虫。为获得其转录组信息,本研究采用新一代高通量测序技术Illumina HiSeq TM 2000对麦红吸浆虫成虫转录组进行测序。共获得转录组样本数据量为27.88 G,经分析共获得59257个Unigenes,总长度49861164 bp,最短20 bp,最长29282 bp,平均长度841 bp。将Unigenes序列与NR、NT、Swiss-Prot、KEGG、GO和KOG数据库进行比对(e≤10-10),共获得95029个结果。通过GO功能分类,共有19584个Unigenes在GO数据库中细胞组分、分子功能和生物学过程等3大类50个功能组中找到对应。与KOG数据库进行比对,共有11279个麦红吸浆虫Unigenes被注释,按功能大致可分为26类。通过KEGG pathways分析,共有9110个麦红吸浆虫Unigenes被注释,分别归属于细胞进程、环境信息进程、遗传信息进程、新陈代谢和有机体系统5大类代谢途径,主要包括细胞生长与死亡、细胞运动、信号转导、能量代谢等32类代谢途径。CDS预测发现30088条序列可被编码,占全部基因的50.78%。SSR位点查找发现,在59257个Unigenes中共找到36323个SSR位点,发生率为61.30%。本研究获得的巨大的麦红吸浆虫转录组信息,为麦红吸浆虫的功能基因挖掘提供了重要的信息资源。  相似文献   

5.
本研究采用Illumina HiSeq TM 2500测序平台对阿尔泰蝠蛾Hepialus altaicola Wang幼虫进行转录组测序及生物信息学分析.经序列拼接后共获得100133个Unigenes,总长度86319112 bp,平均长度862 bp,N50长度1628 bp.将Unigenes与NR、COG/KOG、Pfam、Swiss-Prot、GO、KEGG数据库比对,共获得38198条Unigenes,其中Nr数据库注释的Unigenes最多,为32381条,占32.34%.通过GO功能分类,共有13216个Unigenes在GO数据库中细胞组分、分子功能和生物学过程等3大类57个分支中找到注释;KEGG通路分析,共有15058条Unigenes被注释,归属于305条代谢通路.CDS预测发现54002条序列可被编码,占全部基因的53.93%.基因注释进一步获得311个与冷适应相关的代谢调节基因,并用FPKM值对基因表达量进行评估.本研究获得的转录组信息及分析结果,为进一步研究阿尔泰蝠蛾的基因功能及低温生态适应性奠定分子基础.  相似文献   

6.
榆瘿蚜取食侵染榆树叶片形成了榆树虫瘿,本研究采用新一代的高通量Illumina Hi SeqTM 2000技术测序平台对榆瘿蚜取食刺激的榆树叶片进行转录组测序和功能注释,利用生物学方法对基因表达和功能进行研究。测序获得23.19 Gb碱基序列信息,通过对测序数据进行序列过滤、拼接和去冗余,共获得102 017个Unigenes,通过NR与BLAST等数据库比对,其中有37 899个(37.15%) Unigense被注释。利用KOG、GO、KEGG等数据库对榆树虫瘿叶片的Unigense进行比对,按功其能将匹配的Unigenes基因划分25大类;GO注释将信息归纳为基因的3大主类,57个亚类;以KEGG数据库为参考,将Unigene定位到110个不同的代谢通路,包括氧化应激防御、植物激素信号转导、碳水化合物以及次生物代谢等代谢相关的Unigenes通路。本研究通过二代高通量转录组测序技术研究榆瘿蚜侵染下榆树虫瘿的相关基因,为今后研究榆瘿蚜侵染榆树叶片形成虫瘿的分子机理提供了基础资料。  相似文献   

7.
对‘华仲12号’杜仲的幼嫩叶片(绿色)和成熟叶片(红色)及‘华仲11号’杜仲成熟叶片(绿色)进行转录组测序,进行测序数据的拼接和组装,且对转录组获得的基因(Unigenes)进行SSR分析。研究得到54 517条平均长度为806.90 bp的Unigenes,其中25 993条Unigenes在Nr、Swiss-Prot、KEGG和COG蛋白数据库获得功能注释,占所有Unigenes的47.68%。参照KEGG数据库,可将注释到的6 910条Unigenes划分到122个代谢途径分支,其中花色苷代谢途径相关酶基因39个,类黄酮代谢途径38个,类胡萝卜素合成途径34个。54 517条Unigenes中共包含17 010个完整型SSR位点,占总SSR位点的96.28%。完整型SSR位点共包含67种重复基元,其中出现频率最高的重复基元类型为单核苷酸重复中的A/T (7 747个),其次是AG/CT (5 039个)和AT/AT (850个)从花色苷代谢途径、类黄酮代谢途径及类胡萝卜素代谢途径中共找到13个SSR位点。为今后杜仲遗传多样性分析、遗传图谱构建及杜仲红叶性状分子标记开发等方面奠定了分子基础。  相似文献   

8.
刘丹  曾钦朦  刘斌  李煜  陈世品 《植物研究》2020,40(4):613-622
采用第二代Illumina HiSeq测序技术对闽楠的木质部、韧皮部、叶片进行转录组测序,分别获得Clean Reads片段41 383 707条、43 343 922条、44 191 586条,经转录本拼接后得到序列总长度达120 535 288 bp的383 331条Conting片段,进一步组装得到平均长度为542 bp的151 729条Unigenes。将闽楠转录组Unigenes进行基因功能注释,与NR数据库比对发现,其与葡萄的相似序列最多(34%),与黄瓜、野草莓、大豆的同源性较低(各占3%);进行GO功能注释,可将其划分为生物过程、细胞成分、分子功能3大类共计52个分支,与eggNOG数据库比对可分为25类,通过KEGG功能注释可知转录组中涉及的基因共参与了176条代谢通路,其中核糖体和碳代谢获得的注释较多。另外通过MISA软件分析,共获得35 972个SSR位点。其中,单核苷酸、二核苷酸和三核苷酸为优势重复类型,SSR位点数分别为21 762(60.50%),8 931(24.83%),4 924(13.69%)。闽楠转录组分析及基因功能注释为深入开展闽楠遗传育种及分子生物学相关研究奠定基础。  相似文献   

9.
多裂骆驼蓬为西北荒漠地区常见植物,具有抗风固沙、防止水土流失、抑菌杀虫和抗肿瘤等功效。为了增加骆驼蓬属植物开发利用的强度,弥补其基因功能、代谢通路等分子生物学研究层面的空缺,该文利用Illumina高通量测序平台对多裂骆驼蓬叶片进行转录组测序,根据测序结果进行转录组数据拼接、功能注释、序列水平和表达水平等分析。结果表明:共获得7 723 653 900 bp核苷酸序列信息,拼接组装得到78 641条Unigene,预测出55 535条CDS序列。与多个数据库对比后,获得33 184个NR数据库注释信息;31 835个GO数据库注释信息; 17 206个KOG数据库Unigene功能分类信息; 7 617个KEGG数据库代谢通路注释信息。对单核苷酸多态性位点和微卫星信息进行检测分析,共发现86 113个SNP位点,6 987个SSR信息。该研究首次获得并分析了多裂骆驼蓬的转录组数据,通过基因比对、CDS预测、通路注释、SNP检测和SSR检测等方法,对该植物的基因、通路以及分子标记等方面有了初步的认识,为本种植物后续研究及资源的开发利用奠定了基础。  相似文献   

10.
为加强特有濒危植物长梗杜鹃资源的评价、保护和鉴定工作,及为今后遗传育种和改善其农艺性状提供有益参考。本研究采用新一代高通量测序平台Illumina HiSeq 4000对其转录组测序,得到的数据过滤后进行de novo组装并聚类去冗余,获得74 092个Unigenes,平均长度、N50、Q20、Q30以及GC含量分别为938 nt、1 616 nt、98.22%、95.20%和43.24%,其中1 Kb以上的Unigenes有23 879条。通过与七大功能数据库比对,分别有39 876(NR:53.82%)、38 065(NT:51.38%)、27 384(Swissprot:36.96%)、16 099(COG:21.73%)、30 401(KEGG:41.03%)、17 518(GO:23.64%)以及29 676(Interpro:40.05%)条Unigenes获得功能注释。长梗杜鹃转录组中的Unigenes根据GO功能大致可分为生物学过程、细胞组分和分子功能3大类56亚类,其中执行生物学过程的基因最多,占41.53%;与COG数据库比对,根据其功能大致可分为25类;以KEGG数据库为参考,可归为6个代谢通路大类、32类代谢途径,并发掘出176条与人类疾病相关的Unigenes,包括内分泌及代谢疾病(167条)和抗药性(9条)。根据注释结果共检测出39 418个CDS,未注释上的Unigenes使用ESTScan预测后获得3 194个CDS。同时,预出到1 488个编码TF的Unigenes,以及检测到57 927个SNP多态位点。该转录组分析为今后长梗杜鹃乃至杜鹃属植物功能基因挖掘与利用、基因克隆、抗性机理分析、遗传资源分类和进化、分子标记开发以及分子辅助育种等研究提供了基础数据和重要参考。  相似文献   

11.
张雨  夏铭泽  张发起 《植物研究》2020,40(3):458-467
为了增强对资源植物山莨菪的深入了解,本研究采用高通量测序技术对山莨菪进行转录组测序分析,经过处理得到71 463个Unigenes。通过与多个数据库进行比对,对基因进行分类和分析注释,最终成功获得注释的基因有47 624条。将Unigenes比对到KOG蛋白质库中,有13 110个基因被注释,共有26个子类;比对到NR库中后有39 621个Unigenes被注释;转录本与Swissprot、Tr EMBL的比对结果得到GO功能注释信息,注释得到的29 309个Unigenes可被分为分子功能、生物学过程和细胞组分3个大类,62个子类;以KEGG数据库为参考,3 679条基因被注释,参与的代谢通路可归为4个大类,分别是代谢相关的通路、遗传信息处理、细胞过程、环境信息处理,其中与代谢相关的通路最多,约占所有代谢通路的一半。对山莨菪的药用活性成分的代谢通路及相关Unigenes数量和类型的统计结果表明,与生物碱相关的代谢通路最多,萜类和苯丙素类所对应的Unigenes数量最多。另外,结果还检测到31 382个SNP位点,6种SSR重复类型,其中单碱基重复类型所占的比例最高,每百万碱基中出现的单碱基重复的SSR个数有56. 52个,占45. 30%。该结果丰富了山莨菪的转录组信息数据,为该物种分子生物学方面的研究奠定了基础,有助于进一步开展对山莨菪的合理保护及开发利用工作。  相似文献   

12.
【目的】中华大仰蝽Notonecta chinensis为中国和日本冲绳分布的重要水生天敌昆虫,可用于蚊虫的生物防治。本研究旨在建立中华大仰蝽转录组数据库,挖掘其基因信息。【方法】采用高通量测序平台Illumina NextSeq500对中华大仰蝽进行转录组测序、de novo组装及生物信息学分析;利用MISA软件基于转录组unigenes数据进行SSR新分子标记筛选。毛细管电泳检测SSR多态性。【结果】总计获得34782282条clean reads(NCBI SRA数据库登录号:SRR13259254),组装成37801条unigenes,N50为913 bp。将unigenes与已知数据库比对进行基因功能注释,分别有36474,32470,27781,35079和5638条序列注释到nr,Swiss-Prot,GO,eggNOG和KEGG数据库。通过GO数据库注释,unigenes的功能可分为生物学过程、细胞组分和分子功能三大类,其中参与细胞、细胞部分及结合功能的unigenes比例较大。eggNOG数据库注释结果显示,37801条unigenes归到25个基因家族,注释到未知功能的最多。KEGG代谢通路富集分析显示,5638条unigenes注释到245个代谢通路,注释到核糖体的数目最多。此外,用MISA软件在转录组测序数据中的37801条unigenes中搜索到3124个SSR位点(占总unigenes的8.26%),发生频率为7.07%。通过PCR筛选出16个SSR位点。7个中华大仰蝽地理种群3个位点NcCF/NcCR,NcKF/NcKR和NcLF/NcLR的多态信息含量(PIC)分别为0.870,0.902和0.857,具高度多态性。【结论】本研究成功获得了中华大仰蝽转录组数据,为其基因功能分析提供了分子理论基础;SSR新标记的开发为中华大仰蝽遗传多样性分析、隐存种鉴定及基因图谱构建提供了更丰富的候选分子标记。  相似文献   

13.
14.
李白盾蚧Pseudaulacaspis prunicola (Maskell)寄主范围广泛,是一种重要的入侵害虫。本研究利用高通量测序平台(Illumina NovaSeq 6000)对李白盾蚧进行转录组测序、de novo从头组装及功能注释,在此基础上筛选其微卫星(SSR)位点,并挖掘微卫星引物。研究共获得李白盾蚧转录组60 296条转录本,24 967条单基因(unigenes)序列。通过GO数据库注释,将所有unigenes的功能分为生物学进程、细胞组分和分子功能三大类41个亚类功能区。KOG数据库注释结果显示,5 085条unigenes归到25个基因家族,注释到一般功能预测的数目最多。KEGG代谢通路富集分析显示6 668条unigenes注释到280个代谢通路,其中注释到内质网中蛋白质加工的数目最多。利用MISA软件共搜索到微卫星位点18 193个,分布在9 043条unigenes中,占总unigenes数量的36.22%,平均每2.29 kb出现一个SSR位点。其中主要重复类型为单核苷酸重复,占SSR位点总数的72.03%,其次为三核苷酸重复(15.90%)和二核苷酸重复(8.48%)。单核苷酸重复主要为A/T(71.16%),二核苷酸重复主要为AG/CT(5.20%)。基于Primer Primer 3软件设计出12 538对李白盾蚧SSR引物,从中随机挑选50对引物进行PCR验证,共29对引物可以稳定扩增出目的片段。本研究成功组装了李白盾蚧转录组数据,并基于转录组数据成功筛选出其微卫星位点,为未来该虫的种群遗传学以及入侵生物学研究提供了数据支撑。  相似文献   

15.
新疆天山雪莲(Sasussured involucrata)具有较高的极端低温耐受特性,为低温耐受机制研究提供了一种非常好的模式植物。新疆天山雪莲转录组注解知识库(http://www.shengtingbiology.com/Saussurea KBase/index.jsp)是基于网络数据资源的综合性数据库,由html、Perl、Perl CGI/DBD/DBI、Java和Java Script编程所设计的前端界面和用于数据存取、注释及管理的后端数据库管理系统Postgrel SQL构成。知识库包含基因组数据、转录组原始数据、质量控制数据、GC含量、功能基因序列及注释、功能基因代谢通路、功能基因的注释统计、雪莲与其它物种的转录组或基因组比较分析数据和生物分析软件包等资源。该数据库不仅有利于低温功能基因组学及低温耐受机制研究,而且为冷耐受性状物种的分子育种提供基因资源平台和理论依据。  相似文献   

16.
[目的]中华大仰蝽Notonecta chinensis为中国和日本冲绳分布的重要水生天敌昆虫,可用于蚊虫的生物防治.本研究旨在建立中华大仰蝽转录组数据库,挖掘其基因信息.[方法]采用高通量测序平台Illumina NextSeq500对中华大仰蝽进行转录组测序、de novo组装及生物信息学分析;利用MISA软件基于...  相似文献   

17.
18.
【目的】建立花椒窄吉丁 Agrilus zanthoxylumi 转录组数据库,挖掘其基因组数据。【方法】采用高通量测序平台Illumina NovaSeq6000对花椒窄吉丁成虫不同组织(触角、头、胸、腹、足、翅)进行转录组测序、序列组装,使用BLAST软件将花椒窄吉丁unigenes序列与公共数据库进行比对,BLAST同源性搜索的方法从中筛选出与其化学感受相关的基因,并与其他已研究发表的鞘翅目昆虫化学感受相关基因的核酸序列比对,进行系统发育分析。利用RPKM值对这些基因在花椒窄吉丁成虫不同组织中的表达量进行分析。【结果】经测序及序列拼接后共得到80 320条unigenes和 169 398 条contigs,其G+C比例分别是37.63%和39.18%,平均长度分别为828.75和1 084.33 bp;unigenes长度主要分布在200~400 bp的共有37 374条,占全部unigenes的46.53%。在NR数据库中注释的与花椒窄吉丁转录组相似基因所属物种分布为赤拟谷盗 Tribolium castaneum 所占比例26.80%,其后依次是小家鼠 Mus musculus (13.87%),蛀犀金龟 Oryctes borbonicus (5.26%),山松甲虫 Dendroctonus ponderosae (4.10%),黑蚁 Lasius niger (2.36%),其他物种所占比例是47.61%。在GO数据库中比对到27 488个unigenes,可分为分子功能、细胞组分和生物学进程三大类共59个过程;利用KOG数据库功能注释分为25类,注释到unigenes 最多功能类别的是普通功能,共 4 666个,最少的是与细胞移动相关,共40个;将80 320个unigenes映射到KEGG数据库中,21 104条unigens注释到代谢通路35个,占26.27%,注释最多的代谢途径是转录途径,共涉及到2 037条unigenes。从NR数据库中共注释到8个气味受体(odorant receptor, OR)基因、7个离子型受体(ionotropic receptor, IR)基因和6个味觉受体(gustatory receptor, GR)基因,各组织中的基因表达量分析发现,这3类化学感受相关基因在成虫触角中的表达量显著高于其他组织中的表达量,雌、雄触角中表达量差异最显著的为 AzanOR 1,而在雌、雄成虫足中这3类化学感受相关基因表达量没有差异。【结论】本研究首次获得了花椒窄吉丁转录组数据,为进一步研究花椒窄吉丁的基因功能奠定了分子基础。  相似文献   

19.
【目的】本研究旨在分析甜菜夜蛾Spodoptera exigua蛹卵巢细胞建立细胞系的整个过程,探究细胞由体内到体外培养过程中其基因表达在转录水平的变化,为昆虫体外培养模型的建立提供理论基础。【方法】利用Illumina Hiseq测序平台对甜菜夜蛾蛹卵巢细胞离体培养过程中各阶段的细胞分别进行转录组测序,对获得注释的差异表达基因及其相关信号通路进行分析;通过荧光定量PCR对部分细胞周期相关基因(cycd和cdk4)、调控基因(cdc20,apc1,skp2和mad1)、增殖相关分子标志物(mcm4和pcna)在甜菜夜蛾卵巢细胞离体培养过程中的转录进行验证。【结果】甜菜夜蛾蛹卵巢细胞离体培养过程包括5个阶段:解剖获得离体的卵巢组织,卵巢组织贴壁培养后游离出原代细胞,细胞转化重新具备增殖能力,成功首次传代,以及能够连续传代15代以上建立细胞系。上述5个阶段的细胞经转录组测序、数据组装后共获得46 796条unigenes序列,组装得到序列长度完整性好;转录本unigenes序列拼接长度分布合理,样本碱基Q30均在94%以上。通过KEGG数据库获得注释的unigenes有1 473条,参与细胞过程紧密相关的20条信号通路,其中有92条unigenes在细胞周期信号通路中获得注释。聚类分析表明,在体内处于快速发育状态的卵巢细胞与同样处于增殖状态的细胞系基因表达模式非常接近。原代细胞由短暂停滞生长至成簇细胞的转化关键期,筛选到差异表达基因619个,cdk4在离体培养期表达量显著降低,cycd在细胞转化关键期之后表达量显著升高,cdc20,apc1,skp2和mad1在卵巢组织和细胞系的表达量显著高于原代细胞、转化关键期细胞和首次传代细胞的。从原代细胞至传代后,cycd的表达显著升高8.7倍,显著高于mcm4和pcna的变化水平。【结论】甜菜夜蛾卵巢细胞离体培养过程中5个阶段的细胞转录组测序获得的序列质量符合数据分析的基本要求。筛选获得了甜菜夜蛾蛹卵巢细胞经离体培养过程中的差异表达基因。原代细胞逆转增殖可能与cdk4,cycd,skp2和mad1等细胞周期调控基因表达有关。另外,cycd可作为原代细胞具备传代能力的标志物。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号