首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 171 毫秒
1.
【目的】蜜蜂球囊菌(Ascosphaera apis)是一种专性侵染蜜蜂幼虫的致死性真菌病原。本研究旨在利用PacBio单分子实时(singlemoleculereal-time,SMRT)测序技术对蜜蜂球囊菌孢子(AaS)中基因的可变剪切(alternative splicing,AS)和可变多聚腺苷酸化(alternative polyadenylation,APA)以及长链非编码RNA (long non-coding RNA,lncRNA)进行鉴定和分析,进而揭示蜜蜂球囊菌孢子中转录组的复杂性。【方法】采用Suppa软件对蜜蜂球囊菌孢子中基因的AS事件进行鉴定。通过RT-PCR对不同类型的AS事件进行验证。采用TAPIS pipeline对蜜蜂球囊菌孢子基因的APA位点进行鉴定。利用MEME软件分析孢子全长转录本的poly(A)剪接位点上游50bp的序列特征并鉴定motif。联用CPC和CNCI软件和比对Swiss-prot数据库的方法预测lncRNA,取三者的交集作为高可信度的lncRNA集合。进一步比较lncRNA和mRNA的转录本长度,外显子数量与长度,内含子长度,GC含...  相似文献   

2.
【目的】蜜蜂球囊菌(Ascosphaera apis,简称球囊菌)是一种专性侵染蜜蜂幼虫的真菌病原,导致的白垩病是严重影响养蜂生产的顽疾,每年给养蜂业造成较大损失。本研究旨在基于已获得的第三代长读段测序数据对球囊菌菌丝(Aam)和孢子(Aas)中基因的可变剪切(alternative splicing,AS)和可变多聚腺苷酸化(alternative polyadenylation,APA)进行深入分析。【方法】利用Astalavista软件鉴定Aam和Aas中基因的AS事件类型。利用IGV浏览器对部分剪切异构体(isoform)的结构进行可视化。通过TAPIS pipeline对Aam和Aas中基因的APA位点进行鉴定。通过MEME软件对Aam和Aas中全长转录本的APA位点上游50bp的序列特征进行分析并对motif进行鉴定。【结果】在Aam中共鉴定到286次AS事件,包括162次RI(Retained intron),87次A3(Alternative 3'splice-site)、32次A5(Alternative 5'splice-site)和5次SE (Skipping exon);在Aas中共鉴定到559次AS事件,包括305次RI、155次A3、85次A5、13次SE和1次MEE (Mutually exclusive exon)。进一步分析发现,现有参考基因组上的多数注释基因结构并不完整;部分注释基因在菌丝和孢子中转录形成的isoform在数量和结构方面均存在差异;部分isoform在参考基因组中没有对应的注释基因。Aam中共鉴定到2748个基因含有1个及以上的APA位点,其中含有1个APA位点的基因数量最多(726,26.42%);Aas中共鉴定到2768个基因含有1个及以上的APA位点,其中含有5个以上APA位点的基因数量最多(1180,42.63%)。部分基因在菌丝和孢子中含有不同的APA位点数。序列特征分析结果显示,球囊菌全长转录本的3'UTR的上下游表现出明显的碱基倾向性,U和A分别富集在3'UTR的上游和下游。此外,在球囊菌全长转录本的APA位点上游鉴定到4个motif,分别是UCUCCU、UCUUCU、CCCACC和CCCCCU。【结论】本研究通过对球囊菌菌丝和孢子中基因的AS和APA进行深入分析,揭示了球囊菌转录组的复杂性,为完善现有的基因组和转录组注释提供了宝贵信息,也为探究AS和APA在球囊菌的基因表达调控中的作用提供了关键基础。  相似文献   

3.
【目的】利用纳米孔(nanopore)测序技术鉴定中华蜜蜂Apis cerana cerana工蜂幼虫肠道中细胞色素P450(cytochrome P450, CYP450)基因及其全长转录本,为后续功能研究提供参考信息和基础。【方法】通过Nanopore PromethION平台对中华蜜蜂工蜂4-6日龄幼虫肠道进行转录组测序。利用Guppy软件对原始读段(raw reads)进行质控以得到有效读段(clean reads)。通过识别两端引物鉴定全长转录本序列。使用BLAST工具将上述全长转录本的序列比对到Nr和GO数据库以鉴定CYP450基因及其全长转录本。采用Astalavista软件鉴定基因的可变剪接(alternative splicing, AS)事件。通过RT PCR验证不同类型AS事件的可靠性。【结果】在中华蜜蜂工蜂4-6日龄幼虫肠道中分别测得7 338 627, 7 003 419和7 434 233条原始读段,经质控得到的有效读段数分别为7 289 494, 6 959 880和7 387 756条。鉴定到的非冗余全长转录本总数为48 200条。共鉴定到47个CYP450基因和265条CYP450基因全长转录本。共鉴定到CYP450基因的90次AS事件,包括36次外显子跳跃事件、20次可变5′端剪接位点事件、17次内含子保留事件、9次可变3′端剪接位点事件及8次外显子互斥事件。RT PCR结果证实随机选取的3种AS事件类型真实可靠。【结论】鉴定了中华蜜蜂的CYP450基因及其全长转录本,补充了东方蜜蜂参考基因组的相关注释,并揭示中华蜜蜂CYP450基因可通过多种AS类型产生丰富的剪接体。  相似文献   

4.
【目的】利用前期获得的高质量纳米孔长读段测序数据对意大利蜜蜂Apis mellifera ligustica的丝氨酸/苏氨酸蛋白激酶基因和全长转录本进行鉴定和分析,为深入开展功能研究提供参考信息和基础。【方法】基于前期获得的高质量意大利蜜蜂纳米孔长读段测序数据,通过Blast工具将意大利蜜蜂全长转录本比对Nr数据库筛选出丝氨酸/苏氨酸蛋白激酶基因和全长转录本;利用gffcompare软件将筛选出的丝氨酸/苏氨酸蛋白激酶全长转录本与西方蜜蜂A.mellifera参考基因组(Amel_HAv3.1)上注释的转录本进行比较,以鉴定未注释的新基因和新转录本;使用Astalavista软件鉴定丝氨酸/苏氨酸蛋白激酶基因的可变剪接(alternative splicing, AS)事件类型,采用IGV浏览器对剪接体的结构进行可视化,通过RT-PCR验证随机选取的6次AS事件的真实性。【结果】共鉴定到意大利蜜蜂丝氨酸/苏氨酸蛋白激酶71个基因和335条全长转录本,发掘出未注释的1个新基因和97条新转录本;共对14个已注释基因进行了结构优化,分别延伸了6个基因的5′端和8个基因的3′端。共鉴定到意大利...  相似文献   

5.
完整基因结构的预测是当前生命科学研究的一个重要基础课题,其中一个关键环节是剪接位点和各种可变剪接事件的精确识别.基于转录组测序(RNA-seq)数据,识别剪接位点和可变剪接事件是近几年随着新一代测序技术发展起来的新技术策略和方法.本工作基于黑腹果蝇睾丸RNA-seq数据,使用TopHat软件成功识别出39718个果蝇剪接位点,其中有10584个新剪接位点.同时,基于剪接位点的不同组合,针对各类型可变剪接特征开发出计算识别算法,成功识别了8477个可变剪接事件(其中新识别的可变剪接事件3922个),包括可变供体位点、可变受体位点、内含子保留和外显子缺失4种类型.RT-PCR实验验证了2个果蝇基因上新识别的可变剪接事件,发现了全新的剪接异构体.进一步表明,RNA-seq数据可有效应用于识别剪接位点和可变剪接事件,为深入揭示剪接机制及可变剪接生物学功能提供新思路和新手段.  相似文献   

6.
可变剪接是产生蛋白质组多样性和调节基因表达的重要机制,相关研究在高等真核生物中开展较多,而在单细胞真核生物中则较少,尤其是单细胞原生动物纤毛虫中,仅有少量报道。本文基于单细胞模式原生动物嗜热四膜虫种大量转录组数据,对其可变剪接基因进行了鉴定及分析。在嗜热四膜虫中共鉴定到2 894个可变剪接位点,涉及到2 698个可变剪接基因,可分为四类。考虑到转录本拼接的准确性,选择了其中464个与基因组预测模型完全一致的可变剪接基因进行深入分析,其中生长(growth)时期、饥饿(starvation)时期、接合生殖(conjugation)时期特异性的可变剪接基因分别为49个、79个和135个。对可变剪接基因的功能进行分析表明其涉及的功能广泛且显著富集于蛋白激酶过程,提示可变剪接基因在嗜热四膜虫蛋白磷酸化和信号传导中具有重要作用。  相似文献   

7.
可变剪接源于多外显子基因生成多个转录本的调控过程。随着高通量测序,尤其是RNA-seq的研究进展,剪接序列和剪接位点可以通过挖掘海量的测序数据进行预测。可变剪接现象拓宽了人们对基因结构和蛋白质亚型的知识。然而现有的短序列比对软件受到随机性比对的影响,产生很多假阳性剪接位点,干扰下游数据分析。本研究发现,可变剪接位点周边序列的结构特征可被深度学习模型提取,并利用深度卷积神经网络识别剪接位点。本研究的模型具有识别率高、计算速度快,模型泛化能力强、鲁棒性高等优势。  相似文献   

8.
【目的】东方蜜蜂微孢子虫Nosema ceranae是一种专性侵染成年蜜蜂中肠上皮细胞的单细胞真菌病原,广泛感染世界各地的蜂群。本研究拟利用已获得的东方蜜蜂微孢子虫纯净孢子的高质量转录组数据进行单核苷酸多态性(Single nucleotide polymorphism,SNP)和插入缺失(Insertion-Deletion,InDel)位点的鉴定和分析,旨在丰富东方蜜蜂微孢子虫的SNP和InDel信息,并为新型分子标记的开发提供基础。【方法】使用GATK软件识别东方蜜蜂微孢子虫的SNP和InDel位点。采用SnpEff软件预测变异位点发生的基因组区域及变异产生的影响。通过相关生物信息学软件分别将SNP和InDel位点所在基因分别比对GO和KEGG数据库,获得相应的功能和通路注释。【结果】共鉴定到28195个SNP位点,其中发生转换和颠换的SNP位点分别有21403和6792个;上述SNP位点的突变类型有12种,其中最丰富的突变类型为C/T;分布在CDS区的SNP位点最多,其次是基因间区、上游区、下游区和内含子区;最丰富的密码子突变类型是同义突变;SNP位点所在基因可注释到代谢进程、细胞组分和催化活性等43个GO条目以及代谢途径、核糖体和等次生代谢产物的生物合成等85条KEGG通路。共鉴定到2831个InDel位点,其中分布在基因间区InDel位点最多,分布在CDS区的InDel位点最少;最丰富的密码子突变类型是移码突变;InDel位点所在基因可注释到细胞进程、细胞和结合等38个GO条目以及代谢途径、次生代谢产物的生物合成及核糖体等73条KEGG通路。【结论】东方蜜蜂微孢子虫中存在大量的SNP和InDel位点,SNP位点的突变类型主要为转换,与其他物种类似;SNP与InDel位点的基因组功能元件分布规律和突变类型具有明显差异;SNP和InDel位点所在基因与东方蜜蜂微孢子虫适应宿主细胞内环境及病原增殖过程具有潜在关系。  相似文献   

9.
环形RNA是一种广泛存在于真核细胞的内源性RNA,由前体RNA反向剪接而成,不具有5’末端帽子和3’末端poly(A)尾巴,呈封闭环状结构。环形RNA通过miRNA海绵结合等方式参与基因表达调控等许多重要的生物学过程。环形RNA可以通过可变剪接产生不同的环形RNA转录本,因此获取环形RNA转录本内部全长序列信息以及对环形RNA内部可变剪接产物进行精确定量是揭示环形RNA调控功能的前提。生物信息学工具能够高效便捷的处理高通量测序数据,被普遍用来鉴别和分析环形RNA。本文介绍了环形RNA的产生机制以及功能特性,对环形RNA检测、全长序列组装以及定量相关计算工具进行综述。  相似文献   

10.
[目的]蜜蜂球囊菌Ascosphaera apis是一种专性侵染蜜蜂幼虫而导致白垩病的致死性真菌病原.基于前期已获得的高质量纳米孔(Nanopore)长读段测序数据,对蜜蜂球囊菌菌丝(AaM)和孢子(AaS)中的毒力因子相关全长转录本进行鉴定和分析,为毒力因子相关剪接异构体的功能研究提供参考信息和基础.[方法]利用BLAST工具,将AaM和AaS中的所有全长转录本比对Nr数据库,以鉴定蜜蜂球囊菌的毒力因子(几丁质酶、脂肪酶、水解酶和蛋白酶)相关的全长转录本.使用minimap2软件,将AaM和AaS中的全长转录本序列与蜜蜂球囊菌参考基因组注释的已知转录本序列进行比对,将比对到参考基因组的全长转录本进行归一化处理,再通过每百万计数法(Counts per million,CPM)计算毒力因子相关全长转录本的表达量.利用百迈克云平台的相关工具绘制转录本的表达量聚类热图.通过IGV浏览器对部分毒力因子相关全长转录本结构进行可视化.[结果]在AaM鉴定到毒力因子相关的367个基因及407个全长转录本,包括12条几丁质酶相关全长转录本,48条脂肪酶相关全长转录本,289条水解酶相关全长转录本,58条蛋白酶相关全长转录本.在AaS鉴定到毒力因子相关367个基因及400个全长转录本,包括14条几丁质酶相关全长转录本,63条脂肪酶相关全长转录本,267条水解酶相关全长转录本,56条蛋白酶相关全长转录本.另外,AaM和AaS特有的毒力因子(几丁质酶、脂肪酶)相关全长转录本分别有0条和17条,共有的毒力因子相关全长转录本有60条.进一步分析发现,蜜蜂球囊菌的部分毒力因子基因可通过可变剪接形成多条剪接异构体.[结论]共鉴定到蜜蜂球囊菌毒力因子(几丁质酶、脂肪酶、水解酶和蛋白酶)相关的367个基因和486条全长转录本;相比于蜜蜂球囊菌参考基因组注释的转录本,绝大多数毒力因子基因对应的全长转录本数量更多且结构更为复杂.研究结果丰富了蜜蜂球囊菌毒力因子相关基因和转录本的注释信息,为毒力因子相关剪接异构体的功能研究提供了基础,也为白垩病防控提供了潜在靶点.  相似文献   

11.
12.
13.
14.
15.
Region E3 encodes four major overlapping mRNAs with different splicing patterns. There are two poly(A) sites, an upstream site called E3A and a downstream site called E3B. We have analyzed virus mutants with deletions or insertions in E3 in order to identify sequences that function in the alternative processing of E3 pre-mRNAs, and to understand what determines which poly(A) sites and which splice sites are used. In previous studies we established that the 5' boundary of the E3A poly(A) signal is at an ATTAAA sequence. We now show, using viable virus mutants, that the 3' boundary of the E3A signal is located within 47-62 nucleotides (nt) downstream of the ATTAAA (17-32 nt downstream of the last microheterogenous poly(A) addition site). Our data further suggest that the spacing between the ATTAAA, the cleavage sites, and the essential downstream sequences may be important in E3A 3' end formation. Of particular interest, these mutants suggest a novel mechanism for the control of alternative pre-mRNA processing. Mutants which are almost completely defective in E3A 3' end formation display greatly increased use of a 3' splice site located 4 nt upstream of the ATTAAA. The mRNA that uses this 3' splice site is polyadenylated at the E3B poly(A) site. We suggest, for this particular case, that alternative pre-mRNA processing could be determined by a competition between trans-acting factors that function in E3A 3' end formation or in splicing. These factors could compete for overlapping sequences in pre-mRNA.  相似文献   

16.
In the protein 4.1R gene, alternative first exons splice differentially to alternative 3' splice sites far downstream in exon 2'/2 (E2'/2). We describe a novel intrasplicing mechanism by which exon 1A (E1A) splices exclusively to the distal E2'/2 acceptor via two nested splicing reactions regulated by novel properties of exon 1B (E1B). E1B behaves as an exon in the first step, using its consensus 5' donor to splice to the proximal E2'/2 acceptor. A long region of downstream intron is excised, juxtaposing E1B with E2'/2 to generate a new composite acceptor containing the E1B branchpoint/pyrimidine tract and E2 distal 3' AG-dinucleotide. Next, the upstream E1A splices over E1B to this distal acceptor, excising the remaining intron plus E1B and E2' to form mature E1A/E2 product. We mapped branchpoints for both intrasplicing reactions and demonstrated that mutation of the E1B 5' splice site or branchpoint abrogates intrasplicing. In the 4.1R gene, intrasplicing ultimately determines N-terminal protein structure and function. More generally, intrasplicing represents a new mechanism by which alternative promoters can be coordinated with downstream alternative splicing.  相似文献   

17.
18.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号