首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
以怒江红山茶叶片为材料,采用Illumina Hiseq 2000平台测序,共获得140 996条无冗余的序列,进行SSR位点搜索后,得到32 696个SSR位点,出现频率为23.2%。所搜索的SSR以二核苷酸重复类型最多,三核苷酸和单核苷酸次之,四、五、六核苷酸重复类型较少(<1%)。单核苷酸重复类型中以A/T基元较丰富(10.92%);二核苷酸中AG/CT基元出现频率最大,达到49.72%,AT/AT基元和AC/GT基元所占比例相差不多,而CG/CG基元所占比例最少,为0.07%;三核苷酸重复类型中AAG/CTT最多,ACC/GGT、ATC/ATG和AGG/CCT基元次之,CCG/GGC、ACT/AGT和ACG/CGT基元较低,都小于1%;四、五、六核苷酸类型中各重复基元均较少。在怒江红山茶转录组中,微卫星的数量随着对应的重复类型、重复次数的增加而降低,也随重复区段碱基长度的增加而降低。  相似文献   

2.
利用MISA(MicroSatellite)软件对山地虎耳草转录组拼接序列进行微卫星位点信息分析,为后期SSR标记的开发和物种遗传多样性检测提供候选序列。结果发现,在拼接得到的63 763条Unigene序列中含有4 622个SSR,发生频率为7.25%,有110种重复基元,平均每10.00 kB出现一个SSR位点。山地虎耳草转录组序列的SSR主要集中在三核苷酸重复(55.50%),其次为二核苷酸重复(30.23%)。二核苷酸重复和三核苷酸重复中的优势重复基元分别为AG/TC和AAG/TTC。二核苷酸重复基元的重复次数类型最多,跨度最大,具有更高的多态性,三核苷酸次之,而四、五、六核苷酸重复类型很少。山地虎耳草转录组SSR以5~9次重复为主,且SSR数量随着重复次数的增加逐渐减少,基序长度主要集中于12~30 bp,多态性均在中等以上。  相似文献   

3.
巧家五针松是世界极度濒危植物,对其SSR引物的开发有助于其遗传学研究以及物种的保护。本研究通过Illumina高通量测序技术获得巧家五针松全基因组序列,并以MISA软件查找得到2 651个微卫星序列,其中单核苷酸重复最多,可能预示了其悠久的进化历史。不同重复类型中,A/T含量显著高于G/C;在不同长度重复单元中,二核苷酸重复微卫星长度变异程度最高;各重复类型微卫星长度与微卫星出现的频率成反比。获得的微卫星序列能够满足巧家五针松的种群遗传学研究,而且反映了该物种的偏好性及对应的潜在功能,并且对该物种的保护提供了资料。  相似文献   

4.
甜瓜EST序列中微卫星的分布特征   总被引:2,自引:0,他引:2  
GenBank中35547条甜瓜EST经去冗余处理后,得到总长度为250.3Mb的无冗余EST34438条。这些序列中有2813个微卫星简单重复序列(Simple sequence repeat,SSR),分布于2107条EST中,出现频率为8.16%,平均分布距离为8.90kb。三核苷酸重复是主导重复类型,占SSR总数的47.14%;其次是二核苷酸和单核苷酸重复,分别占SSR总数的20.72%和16.99%。AAG/TTC是优势重复基元,占微卫星总数的29.26%,AG/CT和A/T分别占14.61%和16.25%。在所有的SSR中,重复次数为4~10次的占70.32%,长度为12~20bp的占51.12%。并对这些SSR的多态性潜能进行了评价。  相似文献   

5.
利用MISA软件对密花香薷转录组42 362条Unigene进行SSR位点搜索,并对其SSR序列结构及分布特征进行了分析。结果表明:(1)密花香薷转录组Unigene序列中共检测到17 564个SSR重复序列,分布于11 903条Unigene上,出现频率为28.10%,平均每3 200 bp出现一个SSR位点。(2)单、二、三核苷酸重复类型为密花香薷转录组SSR位点的主导基序类型,占总SSR位点的97.27%,3种主导基序类型中,单核苷酸所形成基元类型数量最多,共检测到169个基元类型(51.22%),单核苷酸(A/T)n基元类型占明显优势,二核苷酸重复类型(AG/CT)n基元类型占优,分别占总SSR位点的50.60%和12.17%。(3)单核苷酸SSR位点所包含重复次数最多(49),重复次数介于10~66,同一基序类型不同重复次数所形成的SSR位点数量差异较大,随重复次数的增加,SSR位点数呈下降趋势。(4)密花香薷转录组二至六核苷酸基序SSR序列长度集中在12~30 bp区间,共包含有8 190个SSR位点,占所统计SSR位点的95.60%,1 589 (≥20 bp)个SSR序列具有极高的多态性,占所统计SSR位点的18.54%。综合出现频率、分布密度、基元重复次数和长度变异等多个研究结果发现,密花香薷转录组检索到的SSR序列表现出较高的多态性潜能,具有较大的开发价值。该研究为后续密花香薷SSR分子标记引物开发奠定了理论基础。  相似文献   

6.
陆地棉EST长度多态性与其SSR分布特征相关性分析   总被引:2,自引:1,他引:1  
目的:分析陆地棉EST长度多态性与其SSR分布特征的相关性。方法:从NCBI公共数据库下载陆地棉EST序列,应用SSRIT搜索SSR,分析20 000条无冗余的EST序列。结果:在剔除低质量和冗余的序列后,得到全长为7 363.878kb的无冗余EST序列7 322条,其中含有SSR位点的EST序列数520条,占被分析EST比例的2.60%。长度在400bp以下的EST序列含SSR的比例为1.46%;长度在400bp以上的EST序列含SSR的比例为8.94%。在1~6bp的重复基元中,二核苷酸重复基元的SSR重复频率最高,占总数的63.46%,其次是三核苷酸,占总数的34.04%。二核苷酸类型(AG)n、(AT)n和三核苷酸类型(AAG)n、(ACC)n、(ACT)n、(AAT)n是SSR的主要重复基元。结论:棉花EST-SSR可用于棉花分子标记,为有针对性设计陆地棉EST-SSR引物奠定基础。  相似文献   

7.
通过对桉树属(Eucalyptus)的10000条EST序列进行分析,在其中的1499条序列上共发现1775个微卫星重复序列。含有微卫星的EST序列约占序列总数的15%。此外,还发现桉树EST序列所含微卫星长度的变异速率与重复单元长度呈负相关;微卫星的丰度与重复单元长度也呈负相关(三碱基重复微卫星除外)。在桉树EST序列中,重复单元长度为三碱基的微卫星最为丰富。三碱基重复单元微卫星的过度富集可能是由于遗传密码选择所致。在微卫星的丰度及长度变异方面,桉树EST序列与杨树(Populus trichocarpa)基因组注释的转录序列随重复单元长度的变化呈现出相同的规律,但桉树EST序列中微卫星频率及三碱基重复微卫星的含量显著偏低,推测含微卫星的基因表达丰度极有可能低于不含微卫星的基因。通过对发现的所有微卫星位点进行引物设计,并对设计的引物进行PCR检测,结果表明所设计的引物具有极高的扩增成功率。  相似文献   

8.
简单重复序列亦称微卫星,被成功应用于许多真核生物、原核生物和病毒的基因组和进化研究,但是噬菌体中的微卫星目前很少被研究。因此对60条尾病毒目基因组中的微卫星和和复合型微卫星(由两个或两个以上直接相邻的微卫星组成)做综合性分析,在这60个基因组中总共观察到11 874个微卫星和449个复合型微卫星。相关性分析表明微卫星个数与基因组大小成正线性相关(ρ=0.899, P<0.01)。参考序列中的微卫星个数少于对应的随机序列中微卫星个数,这种反常现象主要是因为参考序列含有较少的单核苷酸和二核苷酸重复。A/T和AT/TA重复是单核苷酸和二核苷酸重复中最主要的类型,因此单核苷酸重复中的GC含量明显低于相应的序列中的GC含量;相比之下,微卫星中的二核苷酸和三核苷酸重复的GC含量与对应的参考序列的GC含量无明显区别。尾病毒目基因组中的这些结果与其它生物体基因组存在一定的差别。有助于了解尾病毒目中微卫星的分布、进化和生物学功能。  相似文献   

9.
旨在对中间锦鸡儿转录组数据库EST信息进行SSR系统性识别和初步验证,为进一步SSR分子标记开发提供依据。对Hi Seq2000测序技术获得的中间锦鸡儿转录组Unigenes进行SSR位点搜索,共获得45 706个SSR位点,出现频率为10.38%,平均4.30kb出现一个SSR位点。SSR重复类型以单核苷酸重复序列基元为主,所占比例为56.47%;二核苷酸、三核苷酸重复序列基元的数量所占比例分别是20.56%和21.04%;其他数量的基元所占比例仅为1.9%。多核苷酸重复类型中最多的为2核苷酸重复AG/CT;其次为3核苷酸重复AAG/CTT。针对EST-SSR位点随机挑选了150对引物,通过琼脂糖凝胶电泳进行PCR验证,其中有79对能获得扩增条带,21对引物扩增出单一条带,比例为14.0%。  相似文献   

10.
桉树EST序列中微卫星含量及相关特征   总被引:6,自引:0,他引:6  
通过对桉树属(Eucalyptus)的10 000条EST序列进行分析, 在其中的1 499条序列上共发现1 775个微卫星重复序列。含有微卫星的EST序列约占序列总数的15%。此外, 还发现桉树EST序列所含微卫星长度的变异速率与重复单元长度呈负相关; 微卫星的丰度与重复单元长度也呈负相关(三碱基重复微卫星除外)。在桉树EST序列中, 重复单元长度为三碱基的微卫星最为丰富。三碱基重复单元微卫星的过度富集可能是由于遗传密码选择所致。在微卫星的丰度及长度变异方面, 桉树EST序列与杨树(Populus trichocarpa)基因组注释的转录序列随重复单元长度的变化呈现出相同的规律, 但桉树EST序列中微卫星频率及三碱基重复微卫星的含量显著偏低, 推测含微卫星的基因表达丰度极有可能低于不含微卫星的基因。通过对发现的所有微卫星位点进行引物设计, 并对设计的引物进行PCR检测, 结果表明所设计的引物具有极高的扩增成功率。  相似文献   

11.
表达序列标签(EST)是发掘Ⅰ型微卫星标记的重要资源。研究运用生物信息学方法,从草鱼头肾组织3027条EST序列中搜索到322个微卫星位点,占整个EST数据库的10.6%。其中,二核苷酸重复位点151个(46.9%),三核苷酸重复位点137个(42.5%),四、五、六核苷酸重复位点较少;在二核苷酸重复位点中,AC/GT重复位点最为丰富,占二核苷酸重复位点总数的50.3%,AG/CT重复次之,占二核苷酸重复位点总数的40.4%,AT和GC重复较少。10个微卫星位点的多态性检测结果显示,4个位点在草鱼测试群体中呈多态性,多态性位点的平均多态信息含量(PIC)和平均遗传杂合度(H)分别为0.5236和0.5441,其中,2个多态性位点的PIC值大于0.5,呈现高度多态性特征。Ⅰ型微卫星标记将为草鱼遗传连锁图谱构建和QTL分析提供有效的基因分子标记。    相似文献   

12.
石刁柏EST序列中微卫星分布特征分析   总被引:1,自引:0,他引:1  
目的:开发新型石刁柏EST - SSR分子标记和开展相关的分子生物学研究.方法:利用EST - trimmer、Repeat Masker、SSRIT等生物信息学分析工具对石刁柏EST数据库中的EST序列进行去除poly A/T尾,载体、重复序列和低质量序列处理,并对EST序列中SSR分布特征进行了分析.结果:在NCBI数据库中下载的8 565条石刁柏EST序列中,重复次数超过5次的SSR共有610个,其中分布于601~ 800bp的EST - SSR标记最多,共464个,占SSR总数的77.33%;主要SSR重复基元类型是二核苷酸,共426个,占SSR总数的69.84%,其次是三核苷酸占SSR总数的29.18%.四核苷酸和五核苷酸的SSR仅各3个.结论:石刁柏EST中存在丰富的SSR信息,其中二核苷酸的AG/TC、GA/CT以及三核苷酸的CTT/GAA是SSR主要的重复单元.  相似文献   

13.
从NCBI的EST数据库中获得的木麻黄EST序列共有34 752条,进行拼接后得到全长7 278.578 kb的非冗余序列(Unigene)12 062条,并从中检索得到分布于353条Unigene的367个SSR位点,SSR检出率为2.93%,平均分布距离为19.83 kb,包括39种重复基序类型。其中,以二核苷酸和三核苷酸为主要类型,在总SSRs中所占比例分别为57.77%和34.60%;而二核苷酸重复基序中,AG/CT所占比例最高,为93.87%;在三核苷酸重复基序中AAG/CTT所占比例最高,为44.09%。对检索出的EST-SSR位点设计得到97对引物,其中32对为可有效扩增引物。Blastx分析发现77.3%的含SSR位点的EST序列与非冗余蛋白序列数据库中功能序列具有同源性,而功能已知的序列中葡萄来源的序列占有最大比例(10.4%)。GO功能分类发现,含有SSR位点的EST序列中有47.3%至少具有1个GO注释,归入细胞组分的序列最多,而其中细胞质和细胞核的功能项所占比例较大。  相似文献   

14.
蝴蝶兰EST-SSRs分析   总被引:4,自引:0,他引:4  
对蝴蝶兰属EST序列进行了SSR分析。蝴蝶兰属EST总长为4.5Mb,含有609个SSR。SSR出现频率7.65%,平均距离7.39kb,平均长度为22.17bp。单碱基、二碱基和三碱基重复是主要重复类型,分别占EST-SSR总数的21.67%、40.39%和33.50%。A、AG和CCG分别是单碱基、二碱基和三碱基重复中主导重复基元,分别占96.21%、58.54%和32.25%。设计引物及检测的结果表明,蝴蝶兰EST-SSR标记对兰科其他属植物具有一定的通用性。  相似文献   

15.
为挖掘番薯(Ipomoea)属EST-SSR资源,从NCBI数据库下载23406条甘薯(Ipomoea batatas (L.) Lam.)EST和62282条牵牛(Ipomoea nil (L.) Roth)EST,利用生物信息学软件预处理、去冗余、拼接处理后得到12812条无冗余的甘薯EST(6.70 Mb)和28422条牵牛唯一序列(17.19 Mb)。对这些序列进行SSR搜索,在甘薯上获得328个SSR位点,发生频率为2.56%;牵牛上筛选到962个SSR位点,出现频率为3.38%。甘薯和牵牛EST-SSR具有多个共同特征:在SSR位点中,主要是二核苷酸重复类型,其次是三核苷酸重复;在二核苷酸重复中,出现最多的重复基序为AG/CT,其次是AT/AT;在三核苷酸重复中,主要基序是AAG/CCT;SSR位点的长度主要集中在20~22 bp。结果表明,这些搜索出的EST-SSR重复基序类型丰富、多态性潜能高,具有较高的开发和利用价值。  相似文献   

16.
旨在为大规模开发诸氏鲻虾虎鱼微卫星标记,采用高通量测序技术,对诸氏鲻虾虎鱼肝脏转录组进行了测序。结果共获得47 979条Unigenes,利用微卫星查找程序在47 979条Unigenes中共获得6 225个微卫星位点(12.97%),平均每7.02 kb就出现1个微卫星位点。6 225个微卫星位点由226种重复基序组成,主要分布在三、四和五碱基重复类型中。在数量上,单碱基重复类型微卫星位点最多,占42.49%,二碱基和三碱基重复类型所占比例相似,分别为25.22%和26.27%,四、五、六重复类型较少,合计占6.03%。单碱基重复序列中最多的类型为A/T,二碱基重复序列中以AG/CT重复单元为主,三碱基重复序列中以AGC/TCG为优势类型。挑选部分二、三和四单元重复类型微卫星序列,共设计76对引物,可稳定扩增出目的条带的有55对,其中32对具有多态性。结果表明,利用诸氏鲻虾虎鱼转录组数据可快速大量开发微卫星标记。  相似文献   

17.
银杏EST序列中微卫星的分布特征   总被引:5,自引:0,他引:5  
本文利用从NCBI下载的21 590条银杏EST序列,分析了银杏(表达序列标签微卫星)EST-SSR在银杏EST序列的分布和比较了在不同长度EST序列中的SSR特性.在剔除冗余和低质量序列后,得到总长为5 708.385 kb的无冗余EST序列7 961条,发现了405个EST序列(5.09%)含有475个SSR,长度400-1000 bp的EST序列含SSR位点数为445个,占SSR总数的93.68%.二核苷酸和三核苷酸基元类型是银杏EST-SSR的主要类型,分别占SSR总数的73.89%和24.00%,最常见的SSR基元是:(AT)_n、(AG)_n、(AC)_n、(AAG)_n和(AAT)_n.通过对银杏EST序列中SSR位点信息的发掘分析,为有针对性地设计EST-SSR引物,开发银杏EST-SSR分子标记奠定基础.  相似文献   

18.
本研究比较分析了大熊猫和北极熊全基因组序列中的1~6碱基重复的完美型微卫星序列的分布特征,通过微卫星序列搜索和统计软件MSDB分析分别得到855 018和936 238个微卫星序列,其长度总和分别是14 919 240 bp和18 434 348 bp;分别占基因组大小的0.64%和0.79%,大熊猫和北极熊基因组总丰度分别是371.8个/Mb和405.6个/Mb,二者基因组中微卫星都是单碱基重复的最多,其次是二碱基、四碱基、三碱基和五碱基,六碱基重复类型的数量最少。大熊猫和北极熊含量最丰富的重复拷贝类别主要有A、AC、AG、AAAT、AAAG、AT和C等。本研究为后续开发和筛选大量高质量的熊科物种微卫星标记提供了数据支持。  相似文献   

19.
亚麻EST-SSR信息分析与标记开发   总被引:3,自引:0,他引:3  
与基因组SSR相比,以EST为基础的EST-SSR分子标记具有自身的优点。本研究从11240条亚麻(Linum sitatissmum L.)EST序列中检索出877条含有SSR的序列,其出现频率为7.8%。其中以三核苷酸重复出现的频率最高,占总SSR序列的60.1%;其次是二核苷酸重复,占21.9%;四、五和六核苷酸重复占18%。根据这些含SSR的EST序列共设计了73对SSR引物,在8份亚麻材料间通过PCR扩增检测,有63对引物扩增出清晰条带,引物可用率86.3%;有17对引物在8份亚麻材料间显现出多态性,占可扩增引物的26.3%。  相似文献   

20.
南疆沙蜥Phrynocephalus forsythii是我国特有的一种小型爬行动物,分布于塔里木盆地。利用Roche 454 GS FLX高通量测序对该物种基因组测序,获得了55 909条高质量序列。利用Krait搜索并初步统计和分析基因组微卫星序列,共得到1~6个碱基重复类型的完美型微卫星12 109个。不同类型微卫星中,四碱基重复类型数目最多,有4 037个,约占总数的33.34%,其次是二碱基,约占总数的28.09%,再是三碱基、单碱基、五碱基和六碱基,分别约占总数的18.72%、13.91%、4.48%和1.46%。单碱基微卫星中C最多,二碱基微卫星中AC最多,三碱基、四碱基、五碱基和六碱基中最多的分别是AAC、AAAT、AAAAT和AACCCT。AC、AAAT、C、AG、A、AAC、AAT、AAAC、ACC和ACG是数量最多的10种重复拷贝类别。挑选部分三、四碱基重复类型的微卫星序列设计了100对可用于后续对南疆沙蜥微卫星标记开发的候选引物。本研究开启了对南疆沙蜥基因组微卫星特征的了解,为利用微卫星标记研究南疆沙蜥种群遗传结构奠定了基础。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号