首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 187 毫秒
1.
大鼠(Rattus norvegicus)是重要的生物模型动物,已被广泛应用于医学和药学研究。利用生物信息学方法对大鼠基因组外显子、基因间隔区以及内含子微卫星进行了搜索与分析,并对外显子微卫星所在的基因进行了定位,以及通过Blast2Go和KAAS程序进行功能分类注释。分析表明:(1)不同区域微卫星数量上,基因间隔区(1 104 149)内含子(806 024)外显子(4 665),外显子不同区域微卫星数量表现为CDS3'UTR5'UTR;(2)外显子中出现最多的重复拷贝类别是A,其次是AAG、AGC,三碱基和四碱基微卫星在外显子微卫星中最多,占56.7%;基因间隔区微卫星和内含子均以二碱基数量最多,两者出现最多重复拷贝类别均是AC,其次均是A、AG;(3)外显子区、基因间隔区和内含子区不同重复类型重复次数均以最小重复次数,微卫星数量最多;(4)外显子微卫星序列2 330条,位于1 203个基因上,GO注释表明涉及细胞成分(cellular component)占46.9%、生物过程(biological process)占39.3%和分子功能(molecular function)占13.8%;(5)KEGG通路分析表明,与人类疾病相关的基因最多(431),其次是参与机体系统相关的基因(387),和细胞过程相关基因最少(158)。本研究将为进一步分析大鼠微卫星功能及微卫星分子标记提供理论依据。  相似文献   

2.
本研究分析比较了红尾蚺Boa constrictor和原矛头蝮Protobothrops mucrosquamatus基因组微卫星的分布特征,通过MISA分别鉴定出398 860个和422 364个微卫星,其长度分别为8 550 741 bp和12 243 226 bp,分别占基因组序列总长度的0.59%和0.73%,在各自基因组中的丰度分别为275.46个/Mbp和252.33个/Mbp。红尾蚺基因组中单碱基重复类型微卫星最多,其次是四碱基、二碱基、三碱基、五碱基和六碱基,最丰富的5种微卫星类型是A、AC、AAAT、AG、AAT;原矛头蝮基因组中单碱基重复类型微卫星最多,其次是三碱基、四碱基、二碱基、五碱基和六碱基,最丰富的5种微卫星类型是A、AAT、AC、C、AAAT。红尾蚺和原矛头蝮微卫星在基因组不同区域丰度不同,基因间区丰度最高,其次是内含子和外显子,编码区微卫星丰度最低,表明编码区微卫星受到的选择压力最大。红尾蚺和原矛头蝮在基因中微卫星丰度分布的位置特征相似,即微卫星在基因上下游500 bp丰度最高,在内含子次之,在外显子最低。红尾蚺和原矛头蝮基因编码区所有6种重复类型微卫星中,三碱基重复类型占绝对优势。红尾蚺和原矛头蝮基因组中含有微卫星的编码序列分别有1 480条和1 397条,被GO注释的分别有736条和733条。它们的GO功能归类结果类似,但是与其他物种相比存在种系差异。本研究结果为后续开发这2种蛇的高质量微卫星标记提供了方便,也为进一步探索这些微卫星在它们基因组中的生物学功能提供了有意义的基础数据。  相似文献   

3.
邵伟伟  乔芬  蔡玮  林植华  韦力 《兽类学报》2023,43(2):182-192
脊椎动物基因组含有丰富的微卫星信息。本研究对翼手目动物中的大蹄蝠全基因组及其基因的微卫星分布特征进行分析,并对含有微卫星编码序列的基因进行注释分析。结果表明,大蹄蝠全基因组大小为2.24 Gb,共含有497 883个微卫星,其中,数量和比例最多的是单碱基和二碱基重复类型,分别有173 953个(34.94%)和222 591个(44.71%),相对丰度分别为77.78 loci/Mb和99.52 loci/Mb。微卫星数量从单碱基重复到六碱基重复单元最多的类型分别为(A)n、(AC)n、(TAT)n、(TTTA)n、(AACAA)n和(TATCTA)n,比例分别为95.14%、55.25%、38.41%、22.17%、48.68%和20.30%。不同基因区和基因间区的数量及丰度不同,其中基因间区的微卫星数量及其丰度最大,分别为322 666个和2 541.57 loci/Mb,编码区的微卫星数量及其丰度最小,分别为1 461个和461.98 loci/Mb。基因间区和全基因组的微卫星的分布特征相似。编码区最多的微卫星类型为三碱基重复单元,外显子最多的微卫星类型为单碱基、二碱基和三碱基重...  相似文献   

4.
分析了绿尾虹雉Lophophorus lhuysii全基因组中微卫星的数量和分布规律,并对外显子中含有微卫星的基因进行了注释分析。结果显示,在绿尾虹雉1. 01 Gb的全基因组中,1~6个碱基重复类型的完美型微卫星序列共292 430个,总长度5 465 549 bp,相对丰度为290. 47个/Mb,占全基因组的0. 54%,序列长度主要为10~43 bp。不同类型的微卫星中,单碱基重复类型数量最多,长度为3 535 260 bp,占71. 75%,其次是四碱基(611 568 bp,9. 99%)、二碱基(376 944 bp,7. 07%)、三碱基(335 742 bp,6. 38%)、五碱基(500 615 bp,3. 93%)和六碱基(105 420 bp,0. 88%)重复类型。在绿尾虹雉全基因组中,数目最多的10种优势微卫星分别是:A、C、AAAC、AT、AAAT、AC、AAT、AAC、AG、AAAAC,共计占90. 20%,表现出明显A偏倚。分布于外显子的微卫星有2 816个,内含子的有101 791个,基因间区的有187 823个。外显子的微卫星分布于1 314个编码基因中。GO注释分析发现,这些编码基因主要与细胞组分有关,富集前10的条目主要与代谢、转录和合成过程有关。KEGG富集最显著的通路是黏着连接通路。位于外显子的微卫星移码突变可能会造成基因突变,进而可能会影响绿尾虹雉对环境信号的处理。本研究为绿尾虹雉的微卫星筛选和进一步的遗传多样性、功能研究提供了数据基础,从分子角度为绿尾虹雉的保护提供了基础信息。  相似文献   

5.
南疆沙蜥Phrynocephalus forsythii是我国特有的一种小型爬行动物,分布于塔里木盆地。利用Roche 454 GS FLX高通量测序对该物种基因组测序,获得了55 909条高质量序列。利用Krait搜索并初步统计和分析基因组微卫星序列,共得到1~6个碱基重复类型的完美型微卫星12 109个。不同类型微卫星中,四碱基重复类型数目最多,有4 037个,约占总数的33.34%,其次是二碱基,约占总数的28.09%,再是三碱基、单碱基、五碱基和六碱基,分别约占总数的18.72%、13.91%、4.48%和1.46%。单碱基微卫星中C最多,二碱基微卫星中AC最多,三碱基、四碱基、五碱基和六碱基中最多的分别是AAC、AAAT、AAAAT和AACCCT。AC、AAAT、C、AG、A、AAC、AAT、AAAC、ACC和ACG是数量最多的10种重复拷贝类别。挑选部分三、四碱基重复类型的微卫星序列设计了100对可用于后续对南疆沙蜥微卫星标记开发的候选引物。本研究开启了对南疆沙蜥基因组微卫星特征的了解,为利用微卫星标记研究南疆沙蜥种群遗传结构奠定了基础。  相似文献   

6.
为了有效地保护四川山鹧鸪Arborophila rufipectus这一中国特有珍稀濒危鸟类,本研究采用454 GS FLX对该物种基因组测序,首次利用微卫星搜索软件搜索并初步统计和分析基因组微卫星序列,共搜索到l~6个碱基重复类型的完美型微卫星335 263个。不同类型微卫星中,单碱基重复类型数目最多,为197 913个,约占总数的59.03%,其次是四碱基、三碱基、六碱基、二碱基和五碱基,分别约占微卫星总数的13.59%、8.39%、7.55%、6.49%和4.95%。单碱基微卫星中A重复类型数量最多,两碱基中AC最多,三碱基中AAC,四碱基中AAAC最多,五碱基中AAACA最多,六碱基中AGGGTT最多。A、AGGGTT、AAAC、AC、AAAT、AAC、C、AG、AAAG、AAACA、AAT、AGG、AT、AGC、AAGG、CCG是在所搜索到的四川山鹧鸪微卫星中数量最多的16种重复拷贝类型。本研究深化了对四川山鹧鸪基因组的认识和了解,并为以后开发和筛选大量高质量微卫星标记提供数据支持,也为利用微卫星标记研究更加有效地保护和管理四川山鹧鸪这一珍稀濒危动物奠定了基础。  相似文献   

7.
中华按蚊全基因组微卫星的鉴定、特征及分布规律   总被引:1,自引:0,他引:1  
王小婷  张玉娟  何秀  梅婷  陈斌 《昆虫学报》2016,(10):1058-1068
【目的】中华按蚊Anopheles sinensis是我国及东南亚重要的传疟媒介。本研究在全基因组上鉴定和分析中华按蚊微卫星并注释微卫星相关基因的功能,为遗传分子标记的筛选提供依据,也为昆虫微卫星比较基因组学进一步研究提供基础。【方法】用MISA程序鉴定中华按蚊基因组微卫星;用Excel 2010统计微卫星长度,结合微卫星序列信息编写Perl脚本计算微卫星碱基含量;结合微卫星位置信息编写Perl脚本定位微卫星出现的基因区域,并对基因区的微卫星进行GO功能注释;运用WEGO比较中华按蚊和冈比亚按蚊An.gambiae含微卫星相关基因功能注释。【结果】共鉴定出105 981个微卫星,出现的密度是365.5个/Mb。其中100 391个(94.7%)微卫星是完整型微卫星,其余5 590个(5.3%)是复合型微卫星。单碱基微卫星最为丰富,共58 837个,占总微卫星数量的55.5%,其余依次是二碱基(30 345个,占28.6%)、三碱基(15 104个,占14.3%)、四碱基(1 530个,占1.4%)、五碱基(121个,占0.1%)和六碱基(44个,少于0.1%)微卫星。(A)n为最主要的微卫星,其次是(AC)n,(AG)n,(C)n,(AGC)n,(ATC)n,(ACG)n和(ACC)n,数量都在2 000个以上。中华按蚊基因组微卫星长度以10~20 bp为主(87.1%)。这些微卫星的AT含量(63%)明显高于GC含量(37%),仅三碱基微卫星的GC含量(53%)略高于AT含量(47%)。90 632个微卫星(85%)分布在基因间区,15 349个(15%)微卫星分布在基因区。在基因区,2 782个(3%)微卫星分布在外显子区,12 567个(12%)分布在内含子区。GO注释比较中华按蚊和冈比亚按蚊含微卫星的基因,发现这两个物种各小类基因所占总基因数的百分比基本一致,但电子传递类(electron carrier)基因在中华按蚊所占百分比(0.9%)明显高于冈比亚按蚊(0.1%)。【结论】这是蚊虫中首个在全基因组上系统的微卫星研究工作,为进一步通过微卫星作为分子标记开展中华按蚊种群遗传学、遗传变异、功能基因的遗传定位和调控机制研究奠定了基础,也为昆虫微卫星的多样性和进化研究积累了科学素材。  相似文献   

8.
红原鸡全基因组中微卫星分布规律研究   总被引:1,自引:0,他引:1  
本文对红原鸡Gallus gallus全基因组中微卫星数量及分布规律进行了分析,查找到l~6个碱基重复类型的微卫星序列共282728个,约占全基因组序列(1.1Gb)的0.49%,分布频率为1/3.89kb,微卫星序列的长度主要在12~70个碱基长度范围内。第1、2、3条染色体上微卫星分布频率较高,而32号染色体上无微卫星分布。不同类型微卫星中,单碱基重复类型数目最多,为184192个,占总数的65.1%;其次是四、二、三、五、六碱基重复单元序列,分别占到总数的12.8%、9.7%、7.2%、4.6%、0.8%。T、A、AT、GTTT、AAAC、G、C、ATTT、AC、GT、AAAT、ATT、AAC、AAT、GTT、AG、CT、CTTT、AAAG、GTTTT、AAACA、AAGG、CCTT是红原鸡基因组中最主要的微卫星重复类型。本研究为红原鸡微卫星标记的分离筛选、遗传多样性的研究以及不同物种微卫星的比较分析奠定了基础。  相似文献   

9.
林麝Moschus berezovskii是中国重要的资源动物,也是国家Ⅰ级重点保护野生动物。本研究使用生物信息学方法,分析林麝全基因组中完美型微卫星的分布特征。在林麝2.53 Gb的基因组序列中,共搜索到665 524个完美型微卫星,总长度为11 517 784 bp,占基因组序列总长度的0.42%,总丰度为244个/Mb。林麝基因组中,单碱基微卫星序列数量最多,为221 058个,约占总微卫星数的33.22%,丰度为81.05个/Mb,然后依次为二碱基、五碱基、三碱基、四碱基、六碱基重复类型微卫星。林麝基因组中数目最多的10种微卫星类别依次为:A、AACTG、AGC、AC、AT、AG、AAAT、AAC、AAT和AAAC,占所有基因组微卫星的93.2%,表现出明显的A、T偏好。林麝基因组微卫星序列分布研究表明,其在外显子(2 530个)上的分布数量远低于内含子(200 906个)和基因间隔区(454 596个),与前人关于微卫星在非编码区的分布多于编码区的结论一致。本研究为深入研究林麝基因组特征及筛选更多优良微卫星标记提供了基础数据。  相似文献   

10.
本研究利用已公布的二斑叶螨Tetranychus urticae和肩突硬蜱Ixodes scapularis的全基因组测序结果,对其基因组中的微卫星序列进行了系统分析和比较。结果表明:在二斑叶螨基因组中共找到微卫星7934个,出现频率为1/11.45kb,占全基因组碱基总数的0.16%,其中三碱基重复微卫星最多,占总数的72.83%;在肩突硬蜱基因组中共找到550629个微卫星,出现频率为1/3.21kb,占全基因组碱基总数的0.57%,其中单碱基重复微卫星最多,占总数的73.74%。另外,肩突硬蜱基因组中微卫星的重复次数普遍高于二斑叶螨基因组中微卫星的重复次数,二斑叶螨基因组中微卫星的GC含量(34.10%)明显高于肩突硬蜱(24.35%)。微卫星家族方面,二斑叶螨基因组倾向拥有更多的唯一序列(P<0.0001)。A、T、AG、TC、TG、GAT、ATTT、AATA是两个物种共有的常见核心重复序列。  相似文献   

11.
We mapped and analyzed the microsatellites throughout 284295605 base pairs of the unambiguously assembled sequence scaffolds along 19 chromosomes of the haploid poplar genome. Totally, we found 150985 SSRs with repeat unit lengths between 2 and 5 bp. The established microsatellite physical map demonstrated that SSRs were distributed relatively evenly across the genome of Populus. On average, These SSRs occurred every 1883 bp within the poplar genome and the SSR densities in intergenic regions, introns, exons and UTRs were 85.4%, 10.7%, 2.7% and 1.2%, respectively. We took di-, tri-, tetra-and pentamers as the four classes of repeat units and found that the density of each class of SSRs decreased with the repeat unit lengths except for the tetranucleotide repeats. It was noteworthy that the length diversification of microsatellite sequences was negatively correlated with their repeat unit length and the SSRs with shorter repeat units gained repeats faster than the SSRs with longer repeat units. We also found that the GC content of poplar sequence significantly correlated with densities of SSRs with uneven repeat unit lengths (tri-and penta-), but had no significant correlation with densities of SSRs with even repeat unit lengths (di-and tetra-). In poplar genome, there were evidences that the occurrence of different microsatellites was under selection and the GC content in SSR sequences was found to significantly relate to the functional importance of microsatellites.  相似文献   

12.
Environmental Sciences Division, Oak Ridge National Laboratory, TN, USA We mapped and analyzed the microsatellites throughout 284295605 base pairs of the unambiguously assembled sequence scaffolds along 19 chromosomes of the haploid poplar genome. Totally, we found 150985 SSRs with repeat unit lengths between 2 and 5 bp. The established microsatellite physical map demonstrated tr at SSRs were distributed relatively evenly across the genome of Populus. On average, These SSRs occurred every 1883 bp within the poplar genome and the SSR densities in intergenic regions, introns, exons and UTRs were 85.4%, 10.7%, 2.7% and 1.2%, respectively. We took di-, tri-, tetra-and pentamers as the four classes of repeat units and found that the density of each class of SSRs decreased with the repeat unit lengths except for the tetranucleotide repeats. It was noteworthy that the length diversification of microsatellite sequences was negatively correlated with their repeat unit length and the SSRs with shorter repeat units gained repeats faster than the SSRs with longer repeat units. We also found that the GC content of poplar sequence significantly correlated with densities of SSRs with uneven repeat unit lengths (tri-and penta-), but had no significant correlation with densities of SSRs with even repeat unit lengths (di-and tetra-). In poplar genome, there were evidences that the occurrence of different microsatellites was under selection and the GC content in SSR sequences was found to significantly relate to the functional importance of microsatellites.  相似文献   

13.
Mining functional microsatellites in legume unigenes   总被引:1,自引:0,他引:1  
Highly polymorphic and transferable microsatellites (SSRs) are important for comparative genomics, genome analysis and phylogenetic studies. Development of novel species-specific microsatellite markers remains a costly and labor-intensive project. Therefore, interest has been shifted from genomic to genic markers owing to their high inter-species transferability as they are developed from conserved coding regions of the genome. This study concentrates on comparative analysis of genic microsatellites in nine important legume (Arachis hypogaea, Cajanus cajan, Cicer arietinum, Glycine max, Lotus japonicus, Medicago truncatula, Phaseolus vulgaris, Pisum sativum and Vigna unguiculata) and two model plant species (Oryza sativa and Arabidopsis thaliana). Screening of a total of 228090 putative unique sequences spanning 219610522 bp using a microsatellite search tool, MISA, identified 12.18% of the unigenes containing 36248 microsatellite motifs excluding mononucleotide repeats. Frequency of legume unigene-derived SSRs was one SSR in every 6.0 kb of analyzed sequences. The trinucleotide repeats were predominant in all the unigenes with the exception of C. cajan, which showed prevalence of dinucleotide repeats over trinucleotide repeats. Dinucleotide repeats along with trinucleotides counted for more than 90% of the total microsatellites. Among dinucleotide and trinucleotide repeats, AG and AAG motifs, respectively, were the most frequent. Microsatellite positive chickpea unigenes were assigned Gene Ontology (GO) terms to identify the possible role of unigenes in various molecular and biological functions. These unigene based microsatellite markers will prove valuable for recording allelic variance across germplasm collections, gene tagging and searching for putative candidate genes.  相似文献   

14.
草地贪夜蛾雄性成虫和5龄幼虫的转录组比较分析   总被引:1,自引:0,他引:1  
【目的】草地贪夜蛾Spodoptera frugiperda是一种新近入侵我国的重要害虫。本研究旨在对草地贪夜蛾雄性成虫和5龄幼虫两个不同发育阶段的转录组进行比较分析。【方法】利用高通量测序技术对草地贪夜蛾雄性成虫和5龄幼虫进行转录组测序和数据组装,并对转录组数据进行功能注释和比较分析。【结果】经de novo组装共获得209 002条转录本,平均长度为687.55 bp,N50为982 bp。共有46 198条(57.43%) unigene在至少一个数据库中获得功能注释,其中1 713条(2.13%) unigene在所有数据库中均能获得注释。在GO数据库中获得205 269条unigene的注释,主要包括68个功能分类;在KEGG数据库中共有3 408条unigene得到注释,涉及277个代谢通路。共鉴定到424个嗅觉相关的基因,并且在雄性成虫和5龄幼虫之间的表达存在差异。通过比较转录组分析,在雄性成虫中鉴定到9 162个上调和6 399个下调差异表达基因(DEGs);功能富集分析发现在上调DEGs中涉及信息素以及信号转导的代谢通路显著富集,而下调DEGs中涉及解毒相关的通路显著富集。【结论】这些转录组数据为探究草地贪夜蛾的生长发育、嗅觉相关功能基因以及候选分子靶标提供资源信息。  相似文献   

15.
【目的】中华大仰蝽Notonecta chinensis为中国和日本冲绳分布的重要水生天敌昆虫,可用于蚊虫的生物防治。本研究旨在建立中华大仰蝽转录组数据库,挖掘其基因信息。【方法】采用高通量测序平台Illumina NextSeq500对中华大仰蝽进行转录组测序、de novo组装及生物信息学分析;利用MISA软件基于转录组unigenes数据进行SSR新分子标记筛选。毛细管电泳检测SSR多态性。【结果】总计获得34782282条clean reads(NCBI SRA数据库登录号:SRR13259254),组装成37801条unigenes,N50为913 bp。将unigenes与已知数据库比对进行基因功能注释,分别有36474,32470,27781,35079和5638条序列注释到nr,Swiss-Prot,GO,eggNOG和KEGG数据库。通过GO数据库注释,unigenes的功能可分为生物学过程、细胞组分和分子功能三大类,其中参与细胞、细胞部分及结合功能的unigenes比例较大。eggNOG数据库注释结果显示,37801条unigenes归到25个基因家族,注释到未知功能的最多。KEGG代谢通路富集分析显示,5638条unigenes注释到245个代谢通路,注释到核糖体的数目最多。此外,用MISA软件在转录组测序数据中的37801条unigenes中搜索到3124个SSR位点(占总unigenes的8.26%),发生频率为7.07%。通过PCR筛选出16个SSR位点。7个中华大仰蝽地理种群3个位点NcCF/NcCR,NcKF/NcKR和NcLF/NcLR的多态信息含量(PIC)分别为0.870,0.902和0.857,具高度多态性。【结论】本研究成功获得了中华大仰蝽转录组数据,为其基因功能分析提供了分子理论基础;SSR新标记的开发为中华大仰蝽遗传多样性分析、隐存种鉴定及基因图谱构建提供了更丰富的候选分子标记。  相似文献   

16.
[目的]中华大仰蝽Notonecta chinensis为中国和日本冲绳分布的重要水生天敌昆虫,可用于蚊虫的生物防治.本研究旨在建立中华大仰蝽转录组数据库,挖掘其基因信息.[方法]采用高通量测序平台Illumina NextSeq500对中华大仰蝽进行转录组测序、de novo组装及生物信息学分析;利用MISA软件基于...  相似文献   

17.
Euphorbiaceae represents flowering plants family of tropical and sub-tropical region rich in secondary metabolites of economic importance. To understand and assess the genetic makeup among the members, this study was undertaken to characterize and compare SSR markers from publicly available ESTs and GSSs of nine selected species of the family. Mining of SSRs was performed by MISA, primer designing by Primer3, while functional annotation, gene ontology (GO) and enrichment analysis were performed by Blast2GO. A total 12,878 number of SSRs were detected from 101,701 number of EST sequences. SSR density ranged from 1 SSR/3.22 kb to 1 SSR/15.65 kb. A total of 1873 primer pairs were designed for the annotated SSR-Contigs. About 77.07% SSR–ESTs could be assigned a significant match to the protein database. 3037 unique SSR–FDM were assigned and IPR003657 (WRKY Domain) was found to be the most dominant FDM among the members. 1810 unique GO terms obtained were further subjected to enrichment analysis to obtain 513 statistically significant GO terms mapped to the SSR containing ESTs. Most frequent enriched GO terms were, GO:0003824 for molecular function, GO:0006350 for biological process and GO:0005886 for cellular component, justifying the richness of defensive secondary metabolites and phytomedicine within the family. The results from this study provides tangible insight to genetic make-up and distribution of SSRs. Functional annotation corresponded many genes of unknown functions which may be considered as novel genes or genes responsible for stress specific secondary metabolites. Further studies are required to understand stress specific genes accountable for leveraging the synthesis of secondary metabolites.  相似文献   

18.
【目的】本研究旨在利用已获得的PacBio单分子实时(single molecule real-time, SMRT)测序数据对蜜蜂球囊菌Ascosphaera apis菌丝(AaM)和孢子(AaS)中的转录因子(TF)、融合基因和RNA编辑事件进行鉴定和分析,以期丰富蜜蜂球囊菌的相关信息,并为进一步探究它们的功能提供理论依据。【方法】利用BLASTx工具将AaM和AaS的全长转录本序列比对到Nr, Swiss-Prot和KEGG数据库以获得一致性最高的蛋白序列,再利用hmmscan软件将上述蛋白序列比对到Plant TFdb数据库以获得TF的分类及注释信息。采用TOFU软件中的fusion_finder.py程序进行融合基因的预测,进而分析融合基因的序列和位置信息。使用SAMtools预测AaM和AaS中的RNA编辑事件,再利用ANNOVAR软件对RNA编辑事件进行注释,进而采用相关生物信息学软件对RNA编辑位点基因进行GO功能和KEGG通路注释。【结果】在AaS中共鉴定到17个TF家族的213个TF,其中C2H2家族包含的TF成员最多。在AaM和AaS中分别鉴定到921和510个融合基因,二者共有的融合基因为510个,特有的融合基因分别为411和0个。在AaM和AaS中分别鉴定到547和191次RNA编辑事件,其中AaM中同义单核苷酸突变的数量最多,AaS中非同义单核苷酸突变的数量最多。此外,在AaM中鉴定到12种碱基替换类型,其中发生C->T的RNA编辑事件数量最多,达到158次;在AaS中鉴定到9种碱基替换类型,其中发生C->T和G->T的RNA编辑事件数量最多,均有42次。AaM和AaS中RNA编辑位点基因分别涉及19和24个GO功能条目;此外还能注释到11和20条KEGG通路。【结论】蜜蜂球囊菌的菌丝和孢子中含有丰富的TF、融合基因和RNA编辑位点;转录因子C2H2家族与蜜蜂球囊菌菌丝和孢子的生长发育和细胞活动具有潜在关联;RNA编辑事件的碱基替换类型在蜜蜂球囊菌和其他物种中具有物种特异性;RNA编辑可能在蜜蜂球囊菌菌丝和孢子的生长和代谢中发挥作用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号