首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
应用Illumina Hi-seqTM2000高通量测序技术对文冠果花芽进行转录组分析。共获得N50为1 180bp、平均长度为686bp的unigene 58 311条。与公共数据库Nr和Swiss-Prot同源性比较后发现37 047条unigene获得基因注释,另有21 264条unigene未被注释。利用COG数据库将unigene分成25类。通过GO分类和KEGG Pathway富集性分析,将unigene分别归类于55个GO term和128个代谢途径。此外,在9 794条unigene中共搜索到12 213个SSR位点,单核苷酸重复基元出现频率最高(34.95%),其次分别为二核苷酸(32.74%)和三核苷酸(28.64%)。在获得的unigene中发掘出涉及4个开花调控途径(光周期途径、春化途径、GA途径和自主途径)多个基因的同源序列。研究结果可在一定程度上解析文冠果花芽形态分化的分子调控模式与机制。  相似文献   

2.
随着新一代测序技术的发展,大量的转录组数据和表达序列标签(EST)成为开发简单重复序列(SSR)标记的可利用资源。本研究利用MISA软件筛选龙眼(Dimocarpus longan)顶芽转录组数据库序列,从114 445条龙眼转录组unigene序列中发现11 546个SSR位点,SSR出现频率为10.09%。其中1 975条unigene含有两个或两个以上EST-SSR位点,占所有SSR位点的比例为17.10%,SSR出现的平均距离为7.52 kb。从龙眼转录组SSR核苷酸基序类型来看,二核苷酸(52.11%)和三核苷酸(46.15%)出现频率最高,占所有核苷酸出现频率的99.26%。在龙眼转录组SSR中二核苷酸重复基元出现频率最高的是AG/CT(4 250个,占36.81%),三核苷酸重复基元出现频率最高的是AAG/CTT(1 109个,占9.61%)。对含SSR位点的9 571条unigene序列进行引物设计,共设计出了8 347对SSR位点特异引物。随机挑选合成50对EST-SSR引物,以‘石硖’、‘储良’、‘古山2号’、‘立冬本’等四份龙眼材料的基因组DNA为模板对这批引物进行PCR扩增、筛选,结果表明,其中21对引物能产生理想的PCR产物,有效扩增率为42%;16对引物扩增条带具有多态性,占有效引物的76.2%;16对多态性引物共扩增获得50个条带,其中多态性片段21个,每对引物平均产生1.31个多态性片段。  相似文献   

3.
甘薯EST资源的SSR信息分析   总被引:1,自引:0,他引:1  
从NCBI公共数据库下载获得22371条甘薯EST序列,去除低质量的和冗余的序列后,得到总长为5.09×10^3kb的9204条唯一序列。从这些序列中搜索到总共436个SSR位点,平均相距11.68kb出现一个SSR。这些SSR的出现频率和平均长度分别为4.4%和24.28bp。在2-6bp的重复基元中,六核苷酸重复基元出现频率最(30.96%),其次是三核苷酸重复基元(29.59%)和二核苷酸重复基元(24.54%)。出现最多的重复基元是AG/CT(16.28%),其次是AAG/CTT(11.01%)。  相似文献   

4.
陆地棉EST长度多态性与其SSR分布特征相关性分析   总被引:2,自引:1,他引:1  
目的:分析陆地棉EST长度多态性与其SSR分布特征的相关性。方法:从NCBI公共数据库下载陆地棉EST序列,应用SSRIT搜索SSR,分析20 000条无冗余的EST序列。结果:在剔除低质量和冗余的序列后,得到全长为7 363.878kb的无冗余EST序列7 322条,其中含有SSR位点的EST序列数520条,占被分析EST比例的2.60%。长度在400bp以下的EST序列含SSR的比例为1.46%;长度在400bp以上的EST序列含SSR的比例为8.94%。在1~6bp的重复基元中,二核苷酸重复基元的SSR重复频率最高,占总数的63.46%,其次是三核苷酸,占总数的34.04%。二核苷酸类型(AG)n、(AT)n和三核苷酸类型(AAG)n、(ACC)n、(ACT)n、(AAT)n是SSR的主要重复基元。结论:棉花EST-SSR可用于棉花分子标记,为有针对性设计陆地棉EST-SSR引物奠定基础。  相似文献   

5.
采用新一代高通量测序技术Illumina Solexa Hiseq 2500对发芽荞麦转录组进行测序,结合生物信息学方法开展基因表达谱研究和功能基因预测。通过测序,获得了42 953 962个序列读取片段(reads),包含了5.37 Gb碱基序列信息。对reads进行序列组装,获得45 278个单基因簇(unigenes),平均长度862 bp,序列信息达到了39 Mb。另外,从长度分布、GC含量、表达水平等方面对unigenes进行评估,数据显示测序质量好,可信度高。数据库中的序列同源性比较表明,2 127个unigenes与其他生物的己知基因具有不同程度的同源性。发芽苦荞转录组中的unigenes与细胞进程、细胞和蛋白结合相关。将unigenes与KOG数据库进行比对,根据其功能大致可分为24类。以KEGG数据库作为参考,依据代谢途径可将unigenes定位到328个代谢途径分支,包括核糖体代谢通路、碳水化合物代谢等,并且筛选出38条参与GABA合成的氧化磷酸化代谢的unigenes。SSR位点查找发现,从71 366个unigenes中共找到7 141个SSR位点。SSR不同重复基序类型中,出现频率最高的为A/T,其次是AAG/CTT和AT/AT。  相似文献   

6.
基于高通量测序的发芽苦荞转录组学研究   总被引:1,自引:0,他引:1  
采用新一代高通量测序技术Illumina Solexa Hiseq 2500对发芽荞麦转录组进行测序,结合生物信息学方法开展基因表达谱研究和功能基因预测。通过测序,获得了42 953 962个序列读取片段(reads),包含了5.37 Gb碱基序列信息。对reads进行序列组装,获得45 278个单基因簇(unigenes),平均长度862 bp,序列信息达到了39 Mb。另外,从长度分布、GC含量、表达水平等方面对unigenes进行评估,数据显示测序质量好,可信度高。数据库中的序列同源性比较表明,2 127个unigenes与其他生物的己知基因具有不同程度的同源性。发芽苦荞转录组中的unigenes与细胞进程、细胞和蛋白结合相关。将unigenes与KOG数据库进行比对,根据其功能大致可分为24类。以KEGG数据库作为参考,依据代谢途径可将unigenes定位到328个代谢途径分支,包括核糖体代谢通路、碳水化合物代谢等,并且筛选出38条参与GABA合成的氧化磷酸化代谢的unigenes。SSR位点查找发现,从71 366个unigenes中共找到7 141个SSR位点。SSR不同重复基序类型中,出现频率最高的为A/T,其次是AAG/CTT和AT/AT。  相似文献   

7.
以84份越橘种质为材料,从NCBI公共数据库下载22 402条越橘属(Vaccinium)EST序列,通过CAP3组装软件将EST序列拼接成11 541条unigene序列,其中2 076条unigene序列含有2 679个SSR位点。二核苷酸和三核苷酸重复是主要的SSR类型,约占SSR总数的96.01%。利用Primer Premier 5.0软件设计81对引物,其中55对引物在供试越橘种质中扩增出理想的PCR产物,55对引物均有多态性。聚类分析结果显示,在遗传相似系数为0.70时,可以将供试越橘种质分成两大类。越橘EST-SSR标记可以用于种质鉴定与遗传多样性分析。  相似文献   

8.
墨西哥湾扇贝是中国南方海域养殖的重要经济贝类,由于连续累代养殖,种质退化严重,扇贝“渤海红”为山东省近几年培育的国家级新品种,性状优势明显。课题组从北方引进扇贝“渤海红”拟与南方墨西哥湾扇贝进行育成杂交,创新墨西哥湾扇贝种质资源。本研究利用MISA软件对两种扇贝转录组测序获得的unigene序列进行检索,开发SSR标记,同时对SSR位点的生物学信息进行分析,对含SSR的unigene进行功能和KEGG代谢通路注释,并利用primer5软件设计SSR引物。结果显示:扇贝“渤海红”转录组中平均8.27 kb出现1个SSR,出现频率为0.11,检索到的11 512个SSR分布于9 681条unigene上,涉及到137种重复基元,二核苷酸SSR数最多(5 469),占比为46.66%,其次是单核苷酸(4 039),占比为34.46%。墨西哥湾扇贝转录组中,共发现12 241个SSR位点,分布于10 362条unigene序列上,平均8.78 kb出现1个SSR,出现频率为0.10,共包含140种重复基元,SSR重复类型以二核苷酸为主,占SSR总数的45.61%。两种扇贝转录组SSR的重复次数主要集中在5~10次。A/T、AT和ATC/ATG分别是单核苷酸、二核苷酸和三核苷酸的优势重复基元。两种扇贝转录组中共筛选出33个含SSR的生长相关unigene,且被注释到KEGG代谢通路的含特异SSR的unigene全部富集在新陈代谢和遗传信息处理两大一级通路中。两种扇贝SSR标记的开发,为杂交双亲遗传差异分析、杂交子代鉴定和杂种优势预测等奠定了分子辅助育种基础。  相似文献   

9.
对丝瓜(Luffa cylindrica)开展转录组测序分析,共获得58 073条unigene(序列总长约52 087 451 bp),共检测到8 693个SSR(simple sequence repeat)位点,平均分布距离为5.99 Kb;其中,SSR位点中主导类型为二核苷酸重复类型,占总SSR的45.89%;其次,三核苷酸重复类型,占38.89%。二核苷酸重复基序中以AG/CT为主,三核苷酸重复基序以AAG/CTT为主。通过Primer 3.0设计得到7 563对SSR引物,随机选择30对SSR引物,对32种不同来源的丝瓜进行多态性验证分析,其中,22对(占73.33%)引物表现稳定可重复的多态性。利用UPGMA作图,将32份供试材料分为普通丝瓜和有棱丝瓜2类,这2类丝瓜可以进一步分别被分为2个亚群,丝瓜类群的划分与有无棱沟密切相关,与形状、颜色有较高的相关性。通过对丝瓜转录组分析可获得较高频率的SSR位点且类型丰富,为丝瓜遗传多样性分析和遗传图谱构建提供更加丰富可靠的标记选择。  相似文献   

10.
刘丹  曾钦朦  刘斌  李煜  陈世品 《植物研究》2020,40(4):613-622
采用第二代Illumina HiSeq测序技术对闽楠的木质部、韧皮部、叶片进行转录组测序,分别获得Clean Reads片段41 383 707条、43 343 922条、44 191 586条,经转录本拼接后得到序列总长度达120 535 288 bp的383 331条Conting片段,进一步组装得到平均长度为542 bp的151 729条Unigenes。将闽楠转录组Unigenes进行基因功能注释,与NR数据库比对发现,其与葡萄的相似序列最多(34%),与黄瓜、野草莓、大豆的同源性较低(各占3%);进行GO功能注释,可将其划分为生物过程、细胞成分、分子功能3大类共计52个分支,与eggNOG数据库比对可分为25类,通过KEGG功能注释可知转录组中涉及的基因共参与了176条代谢通路,其中核糖体和碳代谢获得的注释较多。另外通过MISA软件分析,共获得35 972个SSR位点。其中,单核苷酸、二核苷酸和三核苷酸为优势重复类型,SSR位点数分别为21 762(60.50%),8 931(24.83%),4 924(13.69%)。闽楠转录组分析及基因功能注释为深入开展闽楠遗传育种及分子生物学相关研究奠定基础。  相似文献   

11.
独行菜种子为我国传统常用中药,从中已提取出多种药用活性成分,但目前尚不清楚其次级代谢过程中这些活性物质合成的遗传基础。采用Illumina HiseqTM 2000高通量测序平台对独行菜种子转录组进行测序,经de novo组装后获得40 303条unigene。进一步利用六大公共数据库进行同源比对,注释了27 935条unigene。研究发现,534个基因参与了独行菜次生物质的合成和代谢,其中在芥子苷、黄酮类和芪类化合物生物合成途径中的unigene分别有4个、19个和69个,在苯丙氨酸代谢途径中的unigene有92个。这些基因可能参与独行菜种子药性活性物质的生物合成,并分析获得了参与上述合成代谢途径的13个关键基因的同源序列。另外,从转录组序列中搜索到6 304个SSR位点,分布于5 306条unigene中,出现频率为15.64%。研究结果不仅为挖掘独行菜种子药用次生代谢物生物合成关键基因提供了基础数据信息,而且为独行菜遗传多样性研究和分子标记开发奠定了分子基础。  相似文献   

12.
利用MISA软件对密花香薷转录组42 362条Unigene进行SSR位点搜索,并对其SSR序列结构及分布特征进行了分析。结果表明:(1)密花香薷转录组Unigene序列中共检测到17 564个SSR重复序列,分布于11 903条Unigene上,出现频率为28.10%,平均每3 200 bp出现一个SSR位点。(2)单、二、三核苷酸重复类型为密花香薷转录组SSR位点的主导基序类型,占总SSR位点的97.27%,3种主导基序类型中,单核苷酸所形成基元类型数量最多,共检测到169个基元类型(51.22%),单核苷酸(A/T)n基元类型占明显优势,二核苷酸重复类型(AG/CT)n基元类型占优,分别占总SSR位点的50.60%和12.17%。(3)单核苷酸SSR位点所包含重复次数最多(49),重复次数介于10~66,同一基序类型不同重复次数所形成的SSR位点数量差异较大,随重复次数的增加,SSR位点数呈下降趋势。(4)密花香薷转录组二至六核苷酸基序SSR序列长度集中在12~30 bp区间,共包含有8 190个SSR位点,占所统计SSR位点的95.60%,1 589 (≥20 bp)个SSR序列具有极高的多态性,占所统计SSR位点的18.54%。综合出现频率、分布密度、基元重复次数和长度变异等多个研究结果发现,密花香薷转录组检索到的SSR序列表现出较高的多态性潜能,具有较大的开发价值。该研究为后续密花香薷SSR分子标记引物开发奠定了理论基础。  相似文献   

13.
从NCBI的EST数据库中获得的木麻黄EST序列共有34 752条,进行拼接后得到全长7 278.578 kb的非冗余序列(Unigene)12 062条,并从中检索得到分布于353条Unigene的367个SSR位点,SSR检出率为2.93%,平均分布距离为19.83 kb,包括39种重复基序类型。其中,以二核苷酸和三核苷酸为主要类型,在总SSRs中所占比例分别为57.77%和34.60%;而二核苷酸重复基序中,AG/CT所占比例最高,为93.87%;在三核苷酸重复基序中AAG/CTT所占比例最高,为44.09%。对检索出的EST-SSR位点设计得到97对引物,其中32对为可有效扩增引物。Blastx分析发现77.3%的含SSR位点的EST序列与非冗余蛋白序列数据库中功能序列具有同源性,而功能已知的序列中葡萄来源的序列占有最大比例(10.4%)。GO功能分类发现,含有SSR位点的EST序列中有47.3%至少具有1个GO注释,归入细胞组分的序列最多,而其中细胞质和细胞核的功能项所占比例较大。  相似文献   

14.
为挖掘番薯(Ipomoea)属EST-SSR资源,从NCBI数据库下载23406条甘薯(Ipomoea batatas (L.) Lam.)EST和62282条牵牛(Ipomoea nil (L.) Roth)EST,利用生物信息学软件预处理、去冗余、拼接处理后得到12812条无冗余的甘薯EST(6.70 Mb)和28422条牵牛唯一序列(17.19 Mb)。对这些序列进行SSR搜索,在甘薯上获得328个SSR位点,发生频率为2.56%;牵牛上筛选到962个SSR位点,出现频率为3.38%。甘薯和牵牛EST-SSR具有多个共同特征:在SSR位点中,主要是二核苷酸重复类型,其次是三核苷酸重复;在二核苷酸重复中,出现最多的重复基序为AG/CT,其次是AT/AT;在三核苷酸重复中,主要基序是AAG/CCT;SSR位点的长度主要集中在20~22 bp。结果表明,这些搜索出的EST-SSR重复基序类型丰富、多态性潜能高,具有较高的开发和利用价值。  相似文献   

15.
【目的】为开发假眼小绿叶蝉Empoasca vitis分子标记,采用高通量测序技术对假眼小绿叶蝉DNA进行了测序与分析。【方法】本研究基于Illumina Hi Seq测序技术,构建了PE文库(~400bp),对获得的测序数据利用生物信息学分析手段完成全基因组扫描,并进一步使用MISA分析鉴定基因组序列中出现的微卫星序列(SSR)。针对微卫星序列共设计10对引物,并使用3步法进行引物多态性筛选。【结果】共计检测Scaffold数量为183 194条,其中包含SSR的Scaffold共计1 545条,共计筛选出1 569个SSR位点。在假眼小绿叶蝉的微卫星中,共包括87种重复基元类型,二核苷酸与三核苷酸重复序列为主要重复类型,分别占SSRs总数的70.26%和27.84%;二核苷酸重复基元CA/TG和三核苷酸重复基元AAT/ATT是优势重复基元,分别占SSRs总数的33.96%和5.86%。在设计的10对引物中,5对具有多态性,在8个假眼小绿叶蝉个体中共发现16个等位基因。【结论】结果说明假眼小绿叶蝉SSR位点在多态性方面具有极大的可开发性,具有多态性的SSR位点可对假眼小绿叶蝉种群间的分化,种群间的扩散机理和途径及影响因素等问题提供分子视角。  相似文献   

16.
【目的】为了获得星天牛Anoplophora chinensis的SSR位点信息并开发其SSR分子标记技术,进一步为其遗传多样性以及综合治理提供理论依据。【方法】利用MISA软件,对星天牛转录组数据进行简单重复序列(SSR)位点筛选与分析;使用Primer3软件设计引物,采用PCR扩增以及电泳检测,筛选SSR引物,开发星天牛SSR分子标记技术。【结果】在9 325条unigene序列中共挖掘到2 360个SSR位点,出现频率为25.31%,涉及SSR位点序列1 758条,发生频率为18.85%。星天牛转录组中SSR的主要重复类型为单碱基重复,其次是三碱基重复,分别占总数的79.03%、12.54%。在核苷酸重复类型中,A/T基元种类数目最多,所占比例高达99.30%。SSR长度为10-11 bp的占比最高,为56.10%;重复次数为10次的数量最多,SSR位点数为1 188(50.34%)。重复次数和长度的分析结果对SSR位点的多态性获得了初步验证。在随机挑选序列设计的60对引物中,53对扩增产物达到预期大小,候选引物可用率高达88%,可在今后的研究中利用。【结论】本文对星天牛SSR位点的信息分析以及引物的设计与验证将有助于星天牛基因挖掘、种群遗传结构、遗传多样性、进化关系和综合治理的研究。  相似文献   

17.
本研究以荒漠地区极为抗旱、耐热的超旱生固沙植物梭梭为材料,利用Solexa测序技术对高温和适温下野生梭梭的枝条进转录组测序和数据de novo组装。将得到的unigene进行功能注释、分类及代谢通路分析。结果表明,获得长度大于200 bp差异表达基因162 504条,将得到的unigene与Nr和Swiss-Prot数据库比对后发现,分别有38 529条和23 198条unigene与其它物种的基因具有同源性。利用COG数据库可将有关的13 012条梭梭unigene分成25类,KEGG数据库分析发现共有22 249个unigene参与298种代谢通路。研究表明梭梭逆境胁迫反应是一个多基因参与、多个生物过程协同调控的过程,基因表达量的变化可能是调控的主要方式,为揭示梭梭耐旱机理以及梭梭耐旱性相关关键基因奠定了基础。  相似文献   

18.
旨在对中间锦鸡儿转录组数据库EST信息进行SSR系统性识别和初步验证,为进一步SSR分子标记开发提供依据。对Hi Seq2000测序技术获得的中间锦鸡儿转录组Unigenes进行SSR位点搜索,共获得45 706个SSR位点,出现频率为10.38%,平均4.30kb出现一个SSR位点。SSR重复类型以单核苷酸重复序列基元为主,所占比例为56.47%;二核苷酸、三核苷酸重复序列基元的数量所占比例分别是20.56%和21.04%;其他数量的基元所占比例仅为1.9%。多核苷酸重复类型中最多的为2核苷酸重复AG/CT;其次为3核苷酸重复AAG/CTT。针对EST-SSR位点随机挑选了150对引物,通过琼脂糖凝胶电泳进行PCR验证,其中有79对能获得扩增条带,21对引物扩增出单一条带,比例为14.0%。  相似文献   

19.
杨曦 《生物技术通报》2012,(11):139-143
分析鲫鱼EST资源的SSR信息,为开发EST-SSR标记奠定基础.从GenBank中获得鲫鱼EST序列,然后用Sequencher 4.8软件进行序列拼接得到Uni-EST序列,再通过SciRoKo 3.4软件扫描Uni-EST序列中的SSR,最后得出EST-SSR的分布特征、频率和重复基元类型等特征.通过搜索共获得9 230条鲫鱼EST原始序列,通过使用计算机软件进行预处理共得到全长为3.81×106 bp的无冗余Uni-EST 7 092条.在这些序列中共搜索出597个SSR位点,分布在545条Uni-EST序列中,发生频率为8.13%,EST-SSR的平均长度为(19.34±6.23) bp,平均每Mb含156.55个SSR位点.单核苷酸重复在鲫鱼EST-SSR中占主导地位,发生频率为39.53%,其次为二核苷酸重复,发生频率为36.68%以及三核苷酸重复的15.41%.在所有非单核苷酸重复基元中,AC基元出现频率最高,其次为AG.设计出引物404对.最后得出结论鲫鱼EST中SSR出现的频率较高,并且类型较为丰富,为进行遗传多样性分析和重要经济性状筛选等方面的研究提供了基础和指导.  相似文献   

20.
布渣叶,岭南特色"药食两用"植物,广泛分布于广东、广西和海南等省区。为评价布渣叶的基因型多态性,加强种质资源保护与开发,本研究基于布渣叶转录组数据,筛选和分析了其SSR位点,并进行了相应的引物设计。研究首先采用RNA-Seq技术分析了布渣叶花、果、芽、茎和叶样品,de novo组装了布渣叶转录组。然后,采用MISA软件在布渣叶转录组数据中搜索SSR位点,分析其组成特征。最后,通过Primer 3设计并筛选相应的引物。结果,RNA-Seq高通量测序所得到的clean reads经Trinity组装后得到48 094个unigene,在4 868(10.12%)条unigene共检出5 841个SSR位点。其中,二核苷酸和三核苷酸串联重复单元的含量达到80%以上。AG/CT和GA/TC占二核苷酸串联重复单元总体的48.43%;三核苷酸串联重复单元中,GAA/TTC、AGA/TCT和AAG/CTT占到39.02%。总体而言,此次检索得到的串联重复单元大多长度短且重复次数高,SSR长度主要在12~20 bp间,具有可用性强,高多态率的特点,为布渣叶的遗传图谱构建与遗传多样性研究等提供了参考依据。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号