首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
随着高通量RNA测序(RNA-Seq)技术的发展和测序成本迅速下降,RNA-Seq技术已经成为生物学研究的重要工具,为生物学家全面地了解和研究转录组提供了机遇。高通量测序具有读长短、存在一定比例的测序错误、数据量大等特点,因此RNA-Seq数据分析与基因组分析和传统的EST数据分析有所不同。本文通过介绍不同的测序平台、原始数据产生和低质量数据过滤的计算流程,对短序列比对、转录组拼接、功能注释、以及差异表达分析进行了研究和分析,最后对RNA-Seq在昆虫学研究中的应用进行了综述,并对RNA-Seq技术进行了总结和展望。  相似文献   

2.
刘慧  邹枨  林凤 《生物工程学报》2013,29(5):551-567
被称为"垃圾基因"的假基因是真核生物基因组中的重要组成部分。近年来对假基因的功能研究表明其并非是基因组中的沉默成员。如一些假基因参与RNA转录,一些假基因转录本能够形成小干扰RNA(siRNA),通过小RNA干扰作用调节功能基因。另外,还有研究发现,一些假基因能够通过microRNA调节肿瘤抑制因子。然而,对假基因功能的深入挖掘需要建立在对其更精准、更全面的鉴定基础之上。随着各物种全基因组测序的完成及序列比对算法的完善,全面而又精确地鉴定假基因已经成为可能。下文就近年来假基因相关鉴定方法、调节功能以及在进化上的意义进行了阐述,并对未来假基因研究方向进行了展望。  相似文献   

3.
原核生物蛋白质基因组学研究进展   总被引:1,自引:0,他引:1       下载免费PDF全文
随着基因组测序技术的不断发展,大量微生物基因组序列可以在短时间内得以准确鉴定。为了进一步探究基因组的结构与功能,基于序列特征与同源特征的基因组注释算法广泛应用于新测序物种。然而受基因组测序质量以及算法本身准确性偏低等问题的影响,现有的基因组注释存在着相当比例的假基因以及注释错误,尤其是蛋白质N端的注释错误。为了弥补基因组注释的不足,以基因芯片或RNA-seq为核心的转录组测序技术和以串联质谱为核心的蛋白质组测序技术可以高通量地对基因的转录和翻译产物进行精确测定,进而实现预测基因结构的实验验证。然而,原核生物细胞中存在的大量非编码RNA给转录组测序技术引入了污染数据,限制了其对基因组注释的应用。相对而言,以串联质谱技术为核心的蛋白质组学测序可以在短时间内鉴定到生物体内大量的蛋白质,实现注释基因的验证甚至校准。已成为基因组注释和重注释的重要依据,并因而衍生了"蛋白质基因组学"的新研究方向。文中首先介绍传统的基于序列预测和同源比对的基因组注释算法,指出其中存在的不足。在此基础上,结合转录组学与蛋白质组学的技术特点,分析蛋白质组学对于原核生物基因组注释的优势,总结现阶段大规模蛋白质基因组学研究的进展情况。最后从信息学角度指出当前蛋白质组数据进行基因组重注释存在的问题与相应的解决方案,进而探讨未来蛋白质基因组学的发展方向。  相似文献   

4.
真核基因可变剪接研究现状与展望   总被引:2,自引:0,他引:2  
mRNA前体(pre-mRNA)的可变剪接是控制基因表达和产生蛋白质多样性的重要机制,是功能基因组时代的研究重点之一。生物信息学在识别可变剪接基因及其结构、分析可变剪接的功能和调控方式等方面具有重要作用。除了耗时的实验研究,识别可变剪接基因及其结构主要通过EST、mRNA等转录数据与基因组序列进行比对,获得同一基因的不同结构方式。分析蛋白质产物可对可变剪接的功能进行预测;潜在调控元件的统计分析则可为可变剪接调控机制的研究提供必要的数据。转录数据的时空信息以及比较基因组学对理解可变剪接信息的精确调控将提供重要资料。可变剪接及其调控机制的深入研究将为基因组和蛋白质组之间的对接提供重要的桥梁。  相似文献   

5.
舒芳  边银丙  周雁 《菌物学报》2020,39(6):1029-1037
以毛木耳Auricularia cornea杂交子APM2-16的亲本单核体APP7和M2S16为研究材料,经同源序列比对,从单核体APP7的基因组中获得了A交配型位点序列,并定位了mip基因的位置。根据APM2-16的转录组和单核体APP7基因组的相关信息设计引物,通过PCR扩增和克隆测序的方式获得单核体APP7和M2S16中的HD基因序列,通过生物信息学分析发现两者在核苷酸序列上没有同源性,都编码同源结构域转录因子。通过对毛木耳交配型位点的研究有助于进一步开展该物种的遗传学基础研究,为菌种遗传改良奠定基础。  相似文献   

6.
转录组研究新技术:RNA-Seq及其应用   总被引:24,自引:0,他引:24  
Qi YX  Liu YB  Rong WH 《遗传》2011,33(11):1191-1202
转录组是特定组织或细胞在某一发育阶段或功能状态下转录出来的所有RNA的集合。转录组研究能够从整体水平研究基因功能以及基因结构,揭示特定生物学过程以及疾病发生过程中的分子机理。RNA-Seq作为一种新的高效、快捷的转录组研究手段正在改变着人们对转录组的认识。RNA-Seq利用高通量测序技术对组织或细胞中所有RNA反转录而成的cDNA文库进行测序,通过统计相关读段(reads)数计算出不同RNA的表达量,发现新的转录本;如果有基因组参考序列,可以把转录本映射回基因组,确定转录本位置、剪切情况等更为全面的遗传信息,已广泛应用于生物学研究、医学研究、临床研究和药物研发等。文章主要介绍了RNA-Seq原理、技术特点及其应用,并就RNA-Seq技术面临的挑战和未来发展前景进行了讨论,为今后该技术的研究与应用提供参考。  相似文献   

7.
家蚕浓核病毒 Bm DNV-3(中国株)VD1基因组结构与转录分析   总被引:3,自引:1,他引:2  
为了进一步认识家蚕浓核病毒BmDNV-3(中国株)VD1基因组的结构和功能,VD1被分离、纯化、克隆到pUC119载体上,完成了基因组全序列的测定。序列分析显示VD1基因组全长为6543个核苷酸,末端拥有224个核苷酸反向重复序列(ITRs)。VD1基因组正链含有3个大的开放阅读框(ORF1-3),负链含有1个大的开放阅读框(ORF4)。比较BmDNV-3的VD1和BmDNV-2(Yamanashiisolate)的VD1基因组全序列,两者同源性为98.4%,并且有107个碱基的替代和1个碱基插入,氨基酸突变集中在VD1ORF3和VD1ORF4。Northern杂交结果显示VD1的左边正链上有1.1kb和1.5kb两个转录本,右边的负链上有一个3.3kb转录本。3′和5′-RACE结果显示1.1kb转录本开始于nt290,结束于nt1437;1.5kb转录本开始于nt1423,结束于nt2931;3.3kb转录本开始于nt6287,结束于nt2922。正链上1.5kb转录本和负链上3.3kb转录本拥有10个核苷酸的3′端的共同序列。研究结果显示该病毒基因转录与已报道的其它浓核病毒存在较大的差异性。  相似文献   

8.
周丽霞  曹红星 《广西植物》2020,40(7):977-987
该研究从NCBI网站下载油棕全基因组序列信息,从The Arabidopsis Information Resource(TAIR)数据库中下载得到拟南芥WRKY转录因子序列,并在油棕基因组数据库中进行BLAST同源序列比对分析,通过NCBI在线工具CDD和PFAM数据库进行蛋白结构与分析,剔除无WRKY结构域的系列,利用生物信息学方法对油棕WRKY转录因子进行分析及功能预测。结果表明:(1)从油棕基因组数据库中发掘WRKY转录因子95个,该WRKY转录因子蛋白质所编码氨基酸大小为116~1 303 bp,95个均为亲水性蛋白,总体为不稳定蛋白(EgWRKY25和EgWRKY56除外),60个蛋白以α-螺旋为主要二级结构元件,35个以无规卷曲为主要二级结构元件。(2)保守结构域系统进化树结果表明,油棕WRKY转录因子家族蛋白主要分为三大类,即I、Ⅱ和Ⅲ类,其中I类分为I C、I N亚类,Ⅱ类分为Ⅱa、Ⅱb、Ⅱc和Ⅱd亚类。(3)内含子和外显子结构显示,EgWRKY基因结构进化高度保守。以上结果为油棕WRKY转录因子的挖掘、功能分析及分子生物学研究奠定了基础,同时为分子育种和遗传改良提供了参考。  相似文献   

9.
DNA和蛋白质序列数据分析工具(第三版)作者:薛庆中等在众多生物基因组测序项目完成之际,我们面临的最大挑战是如何对DNA和蛋白质数掘进行科学的分析和注释。《DNA和蛋白质序列数据分析工具(第三版)》分三个层次解读基因数据库和网络工具:基因组学层面重点介绍序列比对工  相似文献   

10.
【目的】优化柞蚕Antheraea pernyi基因组注释,更好地扩展其在比较基因组学及品种改良研究中的应用。【方法】对柞蚕进行全长转录组测序分析;经全长转录本与参考基因组比对,鉴定新基因及新转录本,并对这些新基因和新转录本进行功能注释及长链非编码RNAs (lncRNAs)预测。利用大量的蛋白质编码转录本和lncRNAs对柞蚕基因组中基因结构进行修订。最后创建矫正后的柞蚕基因组基因注释。【结果】新发现1 997个蛋白编码基因和3 399个lncRNA基因,分别由2 402个和3 574个全长转录本数据支持。发现柞蚕基因组含25 021个基因,其中19 825个基因是蛋白编码基因,包括7个保幼激素酸甲基转移酶基因。【结论】本研究促进了对柞蚕基因组基因注释信息的认识,为柞蚕及相关物种功能基因组及比较基因组学研究提供了很有用的数据资源。  相似文献   

11.
Taxonomic assignment of sequence reads is a challenging task in metagenomic data analysis, for which the present methods mainly use either composition- or homology-based approaches. Though the homology-based methods are more sensitive and accurate, they suffer primarily due to the time needed to generate the Blast alignments. We developed the MetaBin program and web server for better homology-based taxonomic assignments using an ORF-based approach. By implementing Blat as the faster alignment method in place of Blastx, the analysis time has been reduced by severalfold. It is benchmarked using both simulated and real metagenomic datasets, and can be used for both single and paired-end sequence reads of varying lengths (≥45 bp). To our knowledge, MetaBin is the only available program that can be used for the taxonomic binning of short reads (<100 bp) with high accuracy and high sensitivity using a homology-based approach. The MetaBin web server can be used to carry out the taxonomic analysis, by either submitting reads or Blastx output. It provides several options including construction of taxonomic trees, creation of a composition chart, functional analysis using COGs, and comparative analysis of multiple metagenomic datasets. MetaBin web server and a standalone version for high-throughput analysis are available freely at http://metabin.riken.jp/.  相似文献   

12.
一个基于Blast程序的多重序列对齐程序——Mblast   总被引:3,自引:0,他引:3  
核酸序列和蛋白质序列的相似性分析日益成为生物信息学研究的核心内容.NCBI的Blast程序是进行此类分析的最有力工具.虽然它提供了初步的将多条序列进行综合对齐的分析方案,但是实际效果却很不理想.在对Blast程序的输出结果进行仔细分析的基础上,基于“求同存异”的思想,我们编制了一个多重序列对齐程序Mblast.该程序与目前流行的序列多重对齐程序相比,更容易检出序列的同源区.  相似文献   

13.
We provide a new automated statistical method for DNA barcoding based on a Bayesian phylogenetic analysis. The method is based on automated database sequence retrieval, alignment, and phylogenetic analysis using a custom-built program for Bayesian phylogenetic analysis. We show on real data that the method outperforms Blast searches as a measure of confidence and can help eliminate 80% of all false assignment based on best Blast hit. However, the most important advance of the method is that it provides statistically meaningful measures of confidence. We apply the method to a re-analysis of previously published ancient DNA data and show that, with high statistical confidence, most of the published sequences are in fact of Neanderthal origin. However, there are several cases of chimeric sequences that are comprised of a combination of both Neanderthal and modern human DNA.  相似文献   

14.
15.
SeqHunter:序列搜索与分析的生物信息学软件包   总被引:1,自引:0,他引:1  
叶文武  王源超  窦道龙 《生物信息学》2010,8(4):364-367,377
利用Microsoft Visual Basic 6.0脚本,开发了一个在Windows平台下使用的生物信息学软件包SeqHunter;该软件包以简便的图形界面操作方式,可以实现本地化Blast,序列提取、比对与分析,序列数据库建立和管理等多种常用功能,为基因功能分析与大规模基因组数据挖掘提供了一个实用工具。  相似文献   

16.
17.
18.
以火炬松热胁迫cDNA文库的EST序列为材料,对EST序列进行聚类、拼接等处理后,再进行Blast同源比对以及基因GO注释分析。研究结果如下:从Forest TreeDB数据库中下载了火炬松热胁迫cDNA文库的所有EST序列,共4 283条。EST序列经CAP3拼接后,获得2 062个UniGene,其中934个Contig,1 128个Singletons。对UniGene进行同源检索,按照GO的分子功能、生物过程和细胞组分三个不同分类角度分类,被赋予功能的基因数累计达4 661个,但365个(17.7%)的序列与核酸和蛋白数据库无序列同源性,即17.7%为新发现的基因。经对所有具有功能的基因研究发现,受外界胁迫表达的抗逆相关基因含量较高。上述研究结果对于研究火炬松热胁迫基因表达特征与抗逆分子机制具有一定的借鉴价值,以及开发火炬松新分子标记与开展分子辅助育种具有一定的指导意义。  相似文献   

19.
20.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号