首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
德国小蠊全基因组中微卫星分布规律   总被引:3,自引:0,他引:3  
【目的】分析德国小蠊Blattella germanica全基因组中微卫星的数量和分布规律,并对外显子中含有微卫星的基因进行功能注释。【方法】使用微卫星搜索软件查找德国小蠊基因组中微卫星的数量、重复次数以及所有微卫星的位置信息,编写Python脚本对微卫星进行定位,并通过Blast2Go和KASS程序对外显子中含有微卫星的基因进行功能注释。【结果】共找到1~6碱基重复类型的微卫星序列604 386个,总长度15 301 255 bp,约占全基因组序列(约2.04 Gb)的0.75%,分布频率为1/3.37 kb,微卫星序列的长度主要在12~60个碱基长度范围内。不同类型的微卫星中,三碱基(226 876)重复类型微卫星数量最多,占微卫星总数的37.54%;四碱基(150 355)重复类型次之,占微卫星总数的24.88%;其余依次是单碱基(141 167)、二碱基(60 877)、五碱基(21 570)和六碱基(3 541)重复类型,分别占微卫星总数的23.36%,10.07%,3.57%和0.59%。出现最多的重复拷贝类别有:ATT,AAT,A,T,AAAT,ATTT和AT,共411 789个微卫星,占微卫星总数的68.13%,这7种类别的微卫星数量均大于30 000个。共有2 372个微卫星在外显子上,它们分别位于1 481个基因上。GO功能注释结果表明,其中434条归类于细胞组分(cellular component),402条归类于分子功能(molecular function),660条归类于生物学过程(biological process)。KEGG通路分析结果表明,与新陈代谢相关的基因最多(380个),其次是与机体系统相关的(276个),与遗传信息进程相关的基因最少(92个)。【结论】本研究为进一步系统深入分析德国小蠊微卫星功能及微卫星分子标记筛选打下了基础。  相似文献   

2.
邵伟伟  乔芬  蔡玮  林植华  韦力 《兽类学报》2023,43(2):182-192
脊椎动物基因组含有丰富的微卫星信息。本研究对翼手目动物中的大蹄蝠全基因组及其基因的微卫星分布特征进行分析,并对含有微卫星编码序列的基因进行注释分析。结果表明,大蹄蝠全基因组大小为2.24 Gb,共含有497 883个微卫星,其中,数量和比例最多的是单碱基和二碱基重复类型,分别有173 953个(34.94%)和222 591个(44.71%),相对丰度分别为77.78 loci/Mb和99.52 loci/Mb。微卫星数量从单碱基重复到六碱基重复单元最多的类型分别为(A)n、(AC)n、(TAT)n、(TTTA)n、(AACAA)n和(TATCTA)n,比例分别为95.14%、55.25%、38.41%、22.17%、48.68%和20.30%。不同基因区和基因间区的数量及丰度不同,其中基因间区的微卫星数量及其丰度最大,分别为322 666个和2 541.57 loci/Mb,编码区的微卫星数量及其丰度最小,分别为1 461个和461.98 loci/Mb。基因间区和全基因组的微卫星的分布特征相似。编码区最多的微卫星类型为三碱基重复单元,外显子最多的微卫星类型为单碱基、二碱基和三碱基重...  相似文献   

3.
本研究利用MSDB v2.4软件以及生物信息学方法获取了家蚕全基因组的完整型SSRs序列,并对其分布规律进行比较分析。家蚕全基因组中SSRs总数量为141 311个,相对丰度为209.01 No/Mb,总长度为2.41 Mb,全基因组SSRs六种碱基重复类型的数量和密度分布模式为:单碱基四碱基三碱基二碱基五碱基六碱基,说明全基因以单碱基为主要碱基类型,六种碱基类型中五碱基SSRs G-C含量最高。对全基因组3'非翻译区(3'UTR)、5'非翻译区(5'UTR)、编码区(CDs)、内含子区(Introns)和基因间隔区(Intergenics)等不同区域SSRs分析表明,Introns区SSRs数量最高,为125 178个,最小的是5'UTR,为278个,其数量大小顺序为IntronsIntergenics3'UTRCDs5'UTR。5个不同区域的SSRs的碱基的总计数差异较大,编码区总计数最大的是三碱基,而其他4个区域最多的是单碱基。分别对5个区域SSRs中六种重复拷贝类别进行统计分析,碱基总计数(或频率)最多的分别是A;AC、AG、AT;AAT、CCG;AAAT、AAAC;AAATC、AAACT和TAAGTT、GAATTT、AATTAA,Introns和Intergenics区的重复类型总计数显著高于3'UTR、CDs和5'UTR。各重复类型拷贝数分布范围为4~100,主要集中在4~30之间。这为进一步系统分析家蚕SSRs分子标记筛选和遗传分析打下基础。  相似文献   

4.
林麝Moschus berezovskii是中国重要的资源动物,也是国家Ⅰ级重点保护野生动物。本研究使用生物信息学方法,分析林麝全基因组中完美型微卫星的分布特征。在林麝2.53 Gb的基因组序列中,共搜索到665 524个完美型微卫星,总长度为11 517 784 bp,占基因组序列总长度的0.42%,总丰度为244个/Mb。林麝基因组中,单碱基微卫星序列数量最多,为221 058个,约占总微卫星数的33.22%,丰度为81.05个/Mb,然后依次为二碱基、五碱基、三碱基、四碱基、六碱基重复类型微卫星。林麝基因组中数目最多的10种微卫星类别依次为:A、AACTG、AGC、AC、AT、AG、AAAT、AAC、AAT和AAAC,占所有基因组微卫星的93.2%,表现出明显的A、T偏好。林麝基因组微卫星序列分布研究表明,其在外显子(2 530个)上的分布数量远低于内含子(200 906个)和基因间隔区(454 596个),与前人关于微卫星在非编码区的分布多于编码区的结论一致。本研究为深入研究林麝基因组特征及筛选更多优良微卫星标记提供了基础数据。  相似文献   

5.
分析了绿尾虹雉Lophophorus lhuysii全基因组中微卫星的数量和分布规律,并对外显子中含有微卫星的基因进行了注释分析。结果显示,在绿尾虹雉1. 01 Gb的全基因组中,1~6个碱基重复类型的完美型微卫星序列共292 430个,总长度5 465 549 bp,相对丰度为290. 47个/Mb,占全基因组的0. 54%,序列长度主要为10~43 bp。不同类型的微卫星中,单碱基重复类型数量最多,长度为3 535 260 bp,占71. 75%,其次是四碱基(611 568 bp,9. 99%)、二碱基(376 944 bp,7. 07%)、三碱基(335 742 bp,6. 38%)、五碱基(500 615 bp,3. 93%)和六碱基(105 420 bp,0. 88%)重复类型。在绿尾虹雉全基因组中,数目最多的10种优势微卫星分别是:A、C、AAAC、AT、AAAT、AC、AAT、AAC、AG、AAAAC,共计占90. 20%,表现出明显A偏倚。分布于外显子的微卫星有2 816个,内含子的有101 791个,基因间区的有187 823个。外显子的微卫星分布于1 314个编码基因中。GO注释分析发现,这些编码基因主要与细胞组分有关,富集前10的条目主要与代谢、转录和合成过程有关。KEGG富集最显著的通路是黏着连接通路。位于外显子的微卫星移码突变可能会造成基因突变,进而可能会影响绿尾虹雉对环境信号的处理。本研究为绿尾虹雉的微卫星筛选和进一步的遗传多样性、功能研究提供了数据基础,从分子角度为绿尾虹雉的保护提供了基础信息。  相似文献   

6.
本研究分析比较了红尾蚺Boa constrictor和原矛头蝮Protobothrops mucrosquamatus基因组微卫星的分布特征,通过MISA分别鉴定出398 860个和422 364个微卫星,其长度分别为8 550 741 bp和12 243 226 bp,分别占基因组序列总长度的0.59%和0.73%,在各自基因组中的丰度分别为275.46个/Mbp和252.33个/Mbp。红尾蚺基因组中单碱基重复类型微卫星最多,其次是四碱基、二碱基、三碱基、五碱基和六碱基,最丰富的5种微卫星类型是A、AC、AAAT、AG、AAT;原矛头蝮基因组中单碱基重复类型微卫星最多,其次是三碱基、四碱基、二碱基、五碱基和六碱基,最丰富的5种微卫星类型是A、AAT、AC、C、AAAT。红尾蚺和原矛头蝮微卫星在基因组不同区域丰度不同,基因间区丰度最高,其次是内含子和外显子,编码区微卫星丰度最低,表明编码区微卫星受到的选择压力最大。红尾蚺和原矛头蝮在基因中微卫星丰度分布的位置特征相似,即微卫星在基因上下游500 bp丰度最高,在内含子次之,在外显子最低。红尾蚺和原矛头蝮基因编码区所有6种重复类型微卫星中,三碱基重复类型占绝对优势。红尾蚺和原矛头蝮基因组中含有微卫星的编码序列分别有1 480条和1 397条,被GO注释的分别有736条和733条。它们的GO功能归类结果类似,但是与其他物种相比存在种系差异。本研究结果为后续开发这2种蛇的高质量微卫星标记提供了方便,也为进一步探索这些微卫星在它们基因组中的生物学功能提供了有意义的基础数据。  相似文献   

7.
蚊子全基因组中微卫星的丰度及其分布   总被引:6,自引:0,他引:6  
微卫星是近年大力开发的一种遗传标记,为推进按蚊遗传学相关研究,对按蚊全基因组中由 1~6 个碱基重复单元组成的简单序列重复 ( 微卫星 ) 进行了分析 . 进而对其微卫星的丰度和分布进行了比较分析,也比较了染色体各个区域 ( 外显子、内含子和基因间隔区 ) 之间的分布差异 . 微卫星在按蚊基因组中的比例约占 2.14% ,其中 X 染色体拥有微卫星的密度最大 . 对按蚊基因组中微卫星丰度而言, A 碱基和 C 碱基重复在基因组中丰度相似, AC 单元的丰度是 AG 单元的两倍多,然而 AT 和 CG 单元非常稀少;对于三四碱基而言, AGC, AAAC 和 AAAT 单元最为丰富, ACG, ACT, AGG, CCG, ATGC, CCCG, ACTG, AACT, ACGT, AGAT, CCGG, ACCT 和 AGCT 单元等均很稀少,而一些五碱基重复,在某条甚至某几条染色体中均未分布 . 除两碱基重复单元在 2L 的外显子区域丰度较高外,其他重复单元均在内含子和基因间隔区丰富 . 进一步分析显示,微卫星在每条染色体两臂的丰度和分布存在着很多的相似性 .  相似文献   

8.
中华按蚊全基因组微卫星的鉴定、特征及分布规律   总被引:1,自引:0,他引:1  
王小婷  张玉娟  何秀  梅婷  陈斌 《昆虫学报》2016,(10):1058-1068
【目的】中华按蚊Anopheles sinensis是我国及东南亚重要的传疟媒介。本研究在全基因组上鉴定和分析中华按蚊微卫星并注释微卫星相关基因的功能,为遗传分子标记的筛选提供依据,也为昆虫微卫星比较基因组学进一步研究提供基础。【方法】用MISA程序鉴定中华按蚊基因组微卫星;用Excel 2010统计微卫星长度,结合微卫星序列信息编写Perl脚本计算微卫星碱基含量;结合微卫星位置信息编写Perl脚本定位微卫星出现的基因区域,并对基因区的微卫星进行GO功能注释;运用WEGO比较中华按蚊和冈比亚按蚊An.gambiae含微卫星相关基因功能注释。【结果】共鉴定出105 981个微卫星,出现的密度是365.5个/Mb。其中100 391个(94.7%)微卫星是完整型微卫星,其余5 590个(5.3%)是复合型微卫星。单碱基微卫星最为丰富,共58 837个,占总微卫星数量的55.5%,其余依次是二碱基(30 345个,占28.6%)、三碱基(15 104个,占14.3%)、四碱基(1 530个,占1.4%)、五碱基(121个,占0.1%)和六碱基(44个,少于0.1%)微卫星。(A)n为最主要的微卫星,其次是(AC)n,(AG)n,(C)n,(AGC)n,(ATC)n,(ACG)n和(ACC)n,数量都在2 000个以上。中华按蚊基因组微卫星长度以10~20 bp为主(87.1%)。这些微卫星的AT含量(63%)明显高于GC含量(37%),仅三碱基微卫星的GC含量(53%)略高于AT含量(47%)。90 632个微卫星(85%)分布在基因间区,15 349个(15%)微卫星分布在基因区。在基因区,2 782个(3%)微卫星分布在外显子区,12 567个(12%)分布在内含子区。GO注释比较中华按蚊和冈比亚按蚊含微卫星的基因,发现这两个物种各小类基因所占总基因数的百分比基本一致,但电子传递类(electron carrier)基因在中华按蚊所占百分比(0.9%)明显高于冈比亚按蚊(0.1%)。【结论】这是蚊虫中首个在全基因组上系统的微卫星研究工作,为进一步通过微卫星作为分子标记开展中华按蚊种群遗传学、遗传变异、功能基因的遗传定位和调控机制研究奠定了基础,也为昆虫微卫星的多样性和进化研究积累了科学素材。  相似文献   

9.
小鼠基因组中的微卫星重复序列的数量、分布和密度   总被引:1,自引:0,他引:1  
作者分析了老鼠基因组中各染色体及其内含子、外显子和基因间区上各种类型的微卫星(1-6个碱基的重复序列)的数量及其密度。SSR约占老鼠基因组的2.85%,其中46.2%存在于基因间区,4.75%存在于外显子,49.05%在内含子区域,即非编码区富含微卫星。微卫星的数量与染色体或基因区域的大小有关,但密度与染色体或基因区域的大小的关系并不十分密切。第4染色体的外显子区域中6种类型的SSR含量都比其它区域少。A,T,AC,AG,AT,AAC,AAG,AGG,AAAC,AAAG,AAAT,AACC,AAAAC,AAAAG,AAAAT,AAACC,AAAGG,AAGAG,AAAAAC,AAAAAG,AAAAAT,AAAGAG,ACACAT,ACAGAG,ACAGGC,ACATAT是老鼠基因组中主要的SSR类型,而一些5碱基重复单元的SSR在老鼠基因组的某一条甚至某几条染色体都不存在  相似文献   

10.
南疆沙蜥Phrynocephalus forsythii是我国特有的一种小型爬行动物,分布于塔里木盆地。利用Roche 454 GS FLX高通量测序对该物种基因组测序,获得了55 909条高质量序列。利用Krait搜索并初步统计和分析基因组微卫星序列,共得到1~6个碱基重复类型的完美型微卫星12 109个。不同类型微卫星中,四碱基重复类型数目最多,有4 037个,约占总数的33.34%,其次是二碱基,约占总数的28.09%,再是三碱基、单碱基、五碱基和六碱基,分别约占总数的18.72%、13.91%、4.48%和1.46%。单碱基微卫星中C最多,二碱基微卫星中AC最多,三碱基、四碱基、五碱基和六碱基中最多的分别是AAC、AAAT、AAAAT和AACCCT。AC、AAAT、C、AG、A、AAC、AAT、AAAC、ACC和ACG是数量最多的10种重复拷贝类别。挑选部分三、四碱基重复类型的微卫星序列设计了100对可用于后续对南疆沙蜥微卫星标记开发的候选引物。本研究开启了对南疆沙蜥基因组微卫星特征的了解,为利用微卫星标记研究南疆沙蜥种群遗传结构奠定了基础。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号