共查询到20条相似文献,搜索用时 15 毫秒
1.
可变剪接的生物信息数据分析综述 总被引:1,自引:0,他引:1
前体mRNA的可变剪接是扩大真核生物蛋白质组多样性的重要基因调控机制。可变剪接的错误调节可以引起多种人类疾病。由于高通量技术的发展,生物信息学成为可变剪接研究的主要手段。本文总结了可变剪接在生物信息学领域的研究方法,同时也分析并预测了可变剪接的发展方向。 相似文献
2.
3.
拟南芥不同组织基因表达及可变剪接差异分析 总被引:1,自引:0,他引:1
可变剪接是转录后重要的基因表达调控方式,也是转录组和蛋白质组多样性的重要来源. 近年来随着拟南芥、水稻、玉米等植物转录组测序的完成,研究人员发现植物pre-mRNA可变剪接的发生与组织分化、发育等生物学过程密切相关. 本工作基于GEO数据库的RNA-seq数据,使用高通量测序数据分析常用的Trimmomatic、Salmon、DESeq2、SUPPA2等工具,识别了拟南芥的种子、根、叶、花、花梗、节间、长角果共7种组织的表达基因和可变剪接事件,以及7种组织间的差异表达基因和差异可变剪接事件,并以叶和花为例展示了相应的生物学功能分析. 该工作系统地研究了拟南芥基因表达和可变剪接发生的组织特异性,有助于进一步阐明植物基因组的基因表达调控机制. 相似文献
4.
5.
6.
可变剪接源于多外显子基因生成多个转录本的调控过程。随着高通量测序,尤其是RNA-seq的研究进展,剪接序列和剪接位点可以通过挖掘海量的测序数据进行预测。可变剪接现象拓宽了人们对基因结构和蛋白质亚型的知识。然而现有的短序列比对软件受到随机性比对的影响,产生很多假阳性剪接位点,干扰下游数据分析。本研究发现,可变剪接位点周边序列的结构特征可被深度学习模型提取,并利用深度卷积神经网络识别剪接位点。本研究的模型具有识别率高、计算速度快,模型泛化能力强、鲁棒性高等优势。 相似文献
7.
肠道病毒对肠道微生物群系的种群结构、细菌性状乃至人体健康都有十分重要的影响,但相比肠道细菌,人们对其的研究和了解仍然很缺乏.高通量测序技术以及机器学习、深度学习等方法的快速发展,为从组学途径深入研究肠道病毒提供了契机.本文针对当前肠道病毒组学领域以噬菌体、真核病毒等为对象的高通量数据,总结并分析了近年来数据挖掘和分析的共性方法和技术的发展,梳理了一系列相关的生物信息学方法和技术,其中大多适用于基于宏基因组或宏病毒组两种策略的病毒组学分析.同时,针对目前实际生物学问题和临床问题的复杂性,人工智能方法在生物信息学领域的广泛运用,以及未来三代测序技术可能的广泛使用,讨论了病毒组学数据挖掘与数据分析方法面临的问题和挑战. 相似文献
8.
9.
黑曲霉Aspergillus niger因能够产生大量的木质纤维素降解酶而在木质纤维素资源利用中发挥重要作用。目前,有关黑曲霉基因组中与木质纤维素降解相关的基因是否存在可变剪接的情况尚不清楚。本研究以黑曲霉CBS513.88菌株为研究对象,采用rMATS和ABLas两种方法对黑曲霉在葡萄糖为唯一碳源(G组)和小麦秸秆为唯一碳源(WS组)下的56个木质纤维素降解酶基因的可变剪接事件进行分析,并通过RT-PCR扩增和内含子特异性扩增对3个典型基因的可变剪接体进行了验证。结果表明,ABLas可变剪接分析算法相较于rMATS分析算法更为准确,ABLas分析算法显示G组和WS组共有21个木质纤维素降解酶基因出现了可变剪接,可变剪接类型以内含子保留(IR)为主,占所有可变剪接事件的82.85%。另外,G组和WS组发生可变剪接的木质纤维素降解酶基因也有所不同:G组发生可变剪接的基因为13个,WS组发生可变剪接的基因为14个,两组都发生可变剪接的基因为6个,这表明黑曲霉木质纤维素降解酶基因的可变剪接在不同生长条件下存在差异,另一方面,黑曲霉中众多可变剪接体的存在也为开发新型的木质纤维素降解酶资源提供基础。 相似文献
10.
11.
在真核生物基因表达的过程中, mRNA的可变剪接(alternative splicing, AS)导致同一基因蛋白质亚型多样性的产生,同时也增加了基因表达调控的多样性。高达95%的人类基因可以通过AS来产生具有不同功能的蛋白质。除此之外,约15%的人类遗传疾病和癌症与AS相关。作为一种精密的基因表达调控方式, AS协助完成重要的生物过程,如细胞发育和分化等。近年来,高通量测序的发展推动了AS在分析组织特异性基因表达领域的研究。然而,两者的有机结合应用仍然具有挑战性。该文总结了高通量测序在AS研究中的应用,进一步分析了其中存在的问题,并提出了解决方法,为推动该领域的发展提供了新的策略与思路。 相似文献
12.
可变剪接是产生蛋白质组多样性和调节基因表达的重要机制,相关研究在高等真核生物中开展较多,而在单细胞真核生物中则较少,尤其是单细胞原生动物纤毛虫中,仅有少量报道。本文基于单细胞模式原生动物嗜热四膜虫种大量转录组数据,对其可变剪接基因进行了鉴定及分析。在嗜热四膜虫中共鉴定到2 894个可变剪接位点,涉及到2 698个可变剪接基因,可分为四类。考虑到转录本拼接的准确性,选择了其中464个与基因组预测模型完全一致的可变剪接基因进行深入分析,其中生长(growth)时期、饥饿(starvation)时期、接合生殖(conjugation)时期特异性的可变剪接基因分别为49个、79个和135个。对可变剪接基因的功能进行分析表明其涉及的功能广泛且显著富集于蛋白激酶过程,提示可变剪接基因在嗜热四膜虫蛋白磷酸化和信号传导中具有重要作用。 相似文献
13.
高通量实验方法的发展导致大量基因组、转录组、代谢组等组学数据的出现,组学数据的整合为全面了解生物学系统提供了条件.但是,由于当前实验技术手段的限制,高通量组学数据大多存在系统偏差,数据类型和可靠程度也各不相同,这给组学数据的整合带来了困难.本文以转录组、蛋白质组和代谢组为重点,综述了近年来组学数据整合方面的研究进展,包括新的数据整合方法和分析平台.虽然现存的数据统计和网络分析的方法有助于发现不同组学数据之间的关联,但是生物学意义上的深层次的数据整合还有待于生物、数学、计算机等各种领域的全面发展. 相似文献
14.
病毒寄生于宿主细胞中, 需要不断地适应和改变宿主的环境. 它们能够编码多种多功能蛋白质, 这些蛋白能与宿主蛋白发生一系列的相互作用以完成病毒的各种功能. 迄今, 尽管许多病毒的基因组已测序完成, 但由于受到病毒影响而发生相应改变的宿主蛋白组、宿主蛋白翻译后修饰, 以及蛋白酶剪接过程还未被完全阐明. 近年来新兴的高通量技术, 如基于质谱技术的定量或半定量蛋白组方法, 已被广泛应用于病毒宿主相互作用的研究中, 且有望在上述领域取得突破性进展. 本综述主要探讨蛋白质组学研究中的病毒颗粒蛋白质组学, 病毒结构蛋白质组学和病毒影响的宿主蛋白质组学等病毒蛋白质组学中的前沿领域. 相似文献
15.
16.
完整基因结构的预测是当前生命科学研究的一个重要基础课题,其中一个关键环节是剪接位点和各种可变剪接事件的精确识别.基于转录组测序(RNA-seq)数据,识别剪接位点和可变剪接事件是近几年随着新一代测序技术发展起来的新技术策略和方法.本工作基于黑腹果蝇睾丸RNA-seq数据,使用TopHat软件成功识别出39718个果蝇剪接位点,其中有10584个新剪接位点.同时,基于剪接位点的不同组合,针对各类型可变剪接特征开发出计算识别算法,成功识别了8477个可变剪接事件(其中新识别的可变剪接事件3922个),包括可变供体位点、可变受体位点、内含子保留和外显子缺失4种类型.RT-PCR实验验证了2个果蝇基因上新识别的可变剪接事件,发现了全新的剪接异构体.进一步表明,RNA-seq数据可有效应用于识别剪接位点和可变剪接事件,为深入揭示剪接机制及可变剪接生物学功能提供新思路和新手段. 相似文献
17.
肝细胞癌(hepatocellular carcinoma,HCC)是最常见和致命的肝脏恶性肿瘤。这种疾病的治疗一直受到其异质性的阻碍,极大限制了其个性化治疗的进展。因此,将高度异质的HCC分成具有相似特征的分子亚类对其临床治疗有着重要意义。随着高通量技术的不断发展,多种组学数据的关联研究可以加深了解HCC发生背后的生物学机制,也为HCC分层研究打开了新的思路。本文对当前HCC多组学分层策略及其相关研究进行了综述,并总结了当前HCC亚型的多组学特征。 相似文献
18.
真核基因可变剪接研究现状与展望 总被引:2,自引:0,他引:2
mRNA前体(pre-mRNA)的可变剪接是控制基因表达和产生蛋白质多样性的重要机制,是功能基因组时代的研究重点之一。生物信息学在识别可变剪接基因及其结构、分析可变剪接的功能和调控方式等方面具有重要作用。除了耗时的实验研究,识别可变剪接基因及其结构主要通过EST、mRNA等转录数据与基因组序列进行比对,获得同一基因的不同结构方式。分析蛋白质产物可对可变剪接的功能进行预测;潜在调控元件的统计分析则可为可变剪接调控机制的研究提供必要的数据。转录数据的时空信息以及比较基因组学对理解可变剪接信息的精确调控将提供重要资料。可变剪接及其调控机制的深入研究将为基因组和蛋白质组之间的对接提供重要的桥梁。 相似文献
19.
可变剪接(alternative splicing)发生在前体m RNA向成熟m RNA的转换过程中,是转录后表达调控和产生蛋白质多样性的重要机制。可变剪接在真核生物中普遍存在,神经系统发育作为一个极其复杂且严密的过程,可变剪接对它的影响更明显。近年来,一些参与神经发育的可变剪接事件已经得到一定程度的验证,可以得知它的发生影响了突触生长、突触传递和神经干细胞的形成等生物学功能。同时,当可变剪接的模式发生改变时往往也会造成神经系统的功能异常。因此,本文就可变剪接的机制进行了简短的介绍,探索其在神经发育及神经疾病中的作用,并简单总结了相关数据库。 相似文献
20.
代谢物组学作为后基因时代的一种全新的组学技术。其主要以现代系统生物学为理论基础,以生物体液为研究对象,以现代谱学分析理论和生物样品制备方法为技术支撑,集中生物体内低分子量化学组分进行全息分析和海量数据挖掘,最终明晰机体生物学变化的本质。代谢物组学在功能基因组学、病理生理学、药理毒理学等方面都有着广泛的应用前景。本文以代谢物组学概念化的提出为切入点,着眼于代谢物组学的宽口径应用领域,重点概述代谢物组学在医药领域的成功实践,并对代谢物组学的未来发展做初步构想代谢物组学在功能基因组学、病理生理学、药理毒理学等方面都有着广泛的应用前景。 相似文献