首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 187 毫秒
1.
以美洲大蠊Periplaneta americana为原料生产的康复新液等药品临床疗效显著,得到了广泛应用。本文以四川好医生攀西药业有限责任公司饲养的药用美洲大蠊为材料,首次采用Illumina Hi Seq 2000和Pac Bio SMRT测序平台开展了全基因组测序,并进行基因组组装、注释和分析。原始测序数据经过滤后得到1.4 Tb的二代测序数据和33.81 Gb的三代测序数据。组装结果表明,美洲大蠊基因组大小为3.26 Gb,这在已报道的昆虫基因组中仅次于东亚飞蝗Locusta migratoria。基因组重复序列含量为62.38%,杂合度为0.635%,表明其为复杂基因组。组装的Contig N50和scaffold N50长度分别为28.2 kb、315 kb,单拷贝基因完整性为88.1%,小片段文库测序数据平均比对率为99.8%,测序和组装质量满足后续分析要求。采用De novo预测、同源预测和基于转录本预测3种方法共注释到14 568个基因,其中92.4%的基因获得了功能注释。本研究首次完成了美洲大蠊的全基因组测序,也是大蠊属Periplaneta昆虫的第一个基因组,为美洲大蠊遗传进化分析和药用基因资源挖掘打下了重要基础。  相似文献   

2.
随着高通量DNA测序技术的飞速发展,越来越多的物种完成了基因组测序.定位编码基因、确定编码基因结构是基因组注释的基本任务,然而以往的基因组注释方法主要依赖于DNA及RNA序列信息.为了更加精确地解读完成测序的基因组,我们需要整合多种类型的组学数据进行基因组注释.近年来,基于串联质谱技术的蛋白质组学已经发展成熟,实现了对蛋白质组的高覆盖,使得利用串联质谱数据进行基因组注释成为可能.串联质谱数据一方面可以对已注释的基因进行表达验证,另一方面还可以校正原注释基因,进而发现新基因,实现对基因组序列的重新注释.这正是当前进展较快的蛋白质基因组学的研究内容.利用该方法系统地注释已完成测序的基因组已成为解读基因组的一个重要补充.本文综述了蛋白质基因组学的主要研究内容和研究方法,并展望了该研究方向未来的发展.  相似文献   

3.
昆虫基因组及其大小   总被引:5,自引:0,他引:5  
薛建  程家安  张传溪 《昆虫学报》2009,52(8):901-906
昆虫基因组大小是由于基因组各种重复序列在扩增、缺失和分化过程中所致的数量差异造成的。这些差异使得昆虫不同类群间、种间和同种的不同种群间表现出基因组大小的不同。目前有59种昆虫已经列入基因组测序计划, 其中6种昆虫(黑腹果蝇Drosophila melanogaster、冈比亚按蚊Anopheles gambiae、家蚕Bombyx mori、意大利蜜蜂Apis mellifera、埃及伊蚊Aedes aegypti和赤拟谷盗Tribolium castaneum)的全基因组序列已经报道。有725种昆虫的基因组大小得到了估计, 大小在0.09~16.93 pg (88~16 558 Mb)之间。本文还介绍了昆虫基因组大小的估计方法, 讨论了昆虫基因组大小的变化及其意义。  相似文献   

4.
原核生物蛋白质基因组学研究进展   总被引:1,自引:0,他引:1  
随着基因组测序技术的不断发展,大量微生物基因组序列可以在短时间内得以准确鉴定。为了进一步探究基因组的结构与功能,基于序列特征与同源特征的基因组注释算法广泛应用于新测序物种。然而受基因组测序质量以及算法本身准确性偏低等问题的影响,现有的基因组注释存在着相当比例的假基因以及注释错误,尤其是蛋白质N端的注释错误。为了弥补基因组注释的不足,以基因芯片或RNA-seq为核心的转录组测序技术和以串联质谱为核心的蛋白质组测序技术可以高通量地对基因的转录和翻译产物进行精确测定,进而实现预测基因结构的实验验证。然而,原核生物细胞中存在的大量非编码RNA给转录组测序技术引入了污染数据,限制了其对基因组注释的应用。相对而言,以串联质谱技术为核心的蛋白质组学测序可以在短时间内鉴定到生物体内大量的蛋白质,实现注释基因的验证甚至校准。已成为基因组注释和重注释的重要依据,并因而衍生了"蛋白质基因组学"的新研究方向。文中首先介绍传统的基于序列预测和同源比对的基因组注释算法,指出其中存在的不足。在此基础上,结合转录组学与蛋白质组学的技术特点,分析蛋白质组学对于原核生物基因组注释的优势,总结现阶段大规模蛋白质基因组学研究的进展情况。最后从信息学角度指出当前蛋白质组数据进行基因组重注释存在的问题与相应的解决方案,进而探讨未来蛋白质基因组学的发展方向。  相似文献   

5.
《遗传》2020,(7)
随着测序技术的不断发展,产生了海量的基因组测序数据,极大地丰富了公共遗传数据资源。同时为了应对大量基因组数据的产生,基因组比较和注释算法、工具不断更新,使得联合多种注释工具得到更准确的蛋白编码基因的注释信息成为可能。目前公共数据库的原核生物基因组测序和装配有些是10多年前的,存在大量预测的功能未知的编码基因。为了提升美国国家生物信息中心(National Center for Biotechnology Information,NCBI)数据库中基因组的注释质量,本研究联合使用多种原核基因识别算法/软件和基因表达数据重注释1587个细菌和古细菌基因组。首先,利用Z曲线的33个变量从177个基因组原注释中识别获得3092个被过度注释为蛋白编码基因的序列;其次,通过同源比对为939个基因组中的4447个功能未知的蛋白编码基因注释上具体功能;最后,通过联合采用ZCURVE 3.0和Glimmer 3.02以及Prodigal这3种高精度的、广泛使用且基于算法不同而互补的基因识别软件来寻找漏注释基因。最终,从9个基因组中找到了2003个被漏注释的蛋白编码基因,这些基因属于多个蛋白质直系同源簇(clusters of orthologous groups of proteins, COG)。本研究使用新的工具并结合多组学数据重新注释早期测序的细菌和古细菌基因组,不仅为新测序菌株提供注释方法参考,而且这些重注释后得到的细菌基因序列也会对后续基础研究有所帮助。  相似文献   

6.
基因组是物种遗传信息的集合,其大小是研究基因组进化、结构及功能的重要参数之一。本文介绍了测定基因组大小的方法,简述了基因组大小的进化假说及分子机制,综述了近年来昆虫基因组大小的研究进展,尤其是昆虫基因组大小变化的相关影响因子。总体而言,昆虫基因组大小变化是一个复杂的过程,与转座子的活性有密切的关系,是基因组序列丢失和获得两种过程平衡的结果。基因组大小的变化仍在不断地进化中,其对生物造成的影响是剧烈的,因此对昆虫的表型特征产生了重要的影响,但影响的程度和关系在不同的类群有明显的差异,表现出一定的随机性,目前尚未总结出明显的规律。昆虫是生物多样性最为丰富的动物类群,是研究基因组大小进化的最佳材料,随着越来越多的昆虫基因组被测序公开,对昆虫基因组数据进行深入分析,有利于破解基因组大小进化的"C值之谜",可为生物基因组大小的研究提供重要参考。  相似文献   

7.
线粒体基因组广泛应用于昆虫系统发育、分子进化、种群遗传学及谱系地理学等众多研究领域.半翅目是昆虫纲外翅部中最大的一个目,具有重要的经济意义.目前,已对100种半翅目昆虫进行了线粒体基因组测序,其中81种在中国完成测序.本文综述了半翅目昆虫线粒体基因学研究的已有成果,比较分析了半翅目昆虫线粒体基因组的基本特征,包括基因组大小、基因含量、基因重排、碱基组成、密码子使用、蛋白质编码基因的进化模式、RNA基因及非编码区,并系统总结了线粒体基因组数据在半翅目昆虫系统进化研究中的应用现状.最后,针对线粒体基因组的获得、注释和应用过程中存在的问题进行了讨论,并提出了今后半翅目昆虫线粒体基因组学的研究重点.  相似文献   

8.
随着DNA测序技术的不断更新和生物信息学的快速发展,昆虫基因组学的研究与日俱增,提高了人们对种群遗传学和进化生态学的理解和认识,促进了对重要农业害虫的适应性和致害机理的研究,为安全、有效、可持续地开展害虫综合治理提供了新思路和新手段。近两年来,全球发布的昆虫基因组数量每年可达30个。在遗传学、生态学和进化论等生命科学基本原理和方法的指导下,基因组学的研究为揭示害虫遗传变异的内在机制、生态适应性策略和种群变动规律提供了重要的数据和信息资源,同时催生了一系列害虫治理新技术和新方法的研发与应用。为了进一步促进和加强基因组时代的害虫治理研究,拓展该领域研究的广度与深度,本文就昆虫基因组的研究,昆虫与植物协同进化模式及其互作机理,昆虫免疫和抗药性分子机制,以及害虫防治新技术等方面进行了综述,旨在为了解基因组时代害虫治理的研究进展及前景提供参考,对进一步改进害虫生态控制的策略和措施也具有指导意义。  相似文献   

9.
林麟  杜如冰  吴群  徐岩 《微生物学通报》2022,49(8):3279-3292
【背景】耐酸乳杆菌(Lactobacillus acetotolerans)是白酒发酵过程中的优势乳酸菌,对白酒发酵具有重要作用。L. acetotolerans G10是分离自芝麻香型白酒发酵酒醅的一株能够利用多种碳源的菌株。【目的】基于全基因组测序,解析菌株G10多碳源利用机制。【方法】通过三代测序平台Oxford Nanopore完成菌株G10全基因组测序,分别利用Circlator和Prodigal对测序数据进行组装和基因预测;通过细菌基因组分析工具(bacterial pan genome analysis tool,BPGA)进行泛基因组分析。【结果】G10能够利用22种糖类及糖类衍生物,其全基因组大小为1 627 828 bp,含有1 878个编码基因;基于Koyto Encyclopedia of Genes and Genomes (KEGG)数据库注释获得292个碳源代谢相关基因,基于Carbohydrate-Active Enzymes (CAZy)数据库注释获得44个CAZy家族的编码基因。与其他发酵食品来源的耐酸乳杆菌相比,G10基因组最小,但其总基因数量以及...  相似文献   

10.
【目的】优化柞蚕Antheraea pernyi基因组注释,更好地扩展其在比较基因组学及品种改良研究中的应用。【方法】对柞蚕进行全长转录组测序分析;经全长转录本与参考基因组比对,鉴定新基因及新转录本,并对这些新基因和新转录本进行功能注释及长链非编码RNAs (lncRNAs)预测。利用大量的蛋白质编码转录本和lncRNAs对柞蚕基因组中基因结构进行修订。最后创建矫正后的柞蚕基因组基因注释。【结果】新发现1 997个蛋白编码基因和3 399个lncRNA基因,分别由2 402个和3 574个全长转录本数据支持。发现柞蚕基因组含25 021个基因,其中19 825个基因是蛋白编码基因,包括7个保幼激素酸甲基转移酶基因。【结论】本研究促进了对柞蚕基因组基因注释信息的认识,为柞蚕及相关物种功能基因组及比较基因组学研究提供了很有用的数据资源。  相似文献   

11.
叶恭银  方琦 《昆虫知识》2011,48(6):1531-1538
昆虫种类繁多,它与生态系统中的生物多样性,以及人类的日常生活和生产密切相关。自2000年黑腹果蝇Drosophila melanogaster全基因组测序完成以来,至今已先后开展了88种昆虫全基因组测序工作,这标志着昆虫学研究进入了基因组时代。本文综述了近年来昆虫基因组测序进展,以及基于基因组的昆虫学研究方法及应用等两方面的研究成果。同时,着重介绍了昆虫全基因组测序进程,昆虫基因组在个体生物学、多物种间及种群,及系统生物学研究中的应用等方面的内容。最后,还探讨了基因组时代昆虫学研究所面临的挑战。  相似文献   

12.
The medfly Ceratitis capitata and the olive fruit fly Bactrocera oleae belong to the Tephritidae family of Diptera, a family whose members cause severe damages in agriculture worldwide. For such insect pests, the utmost concern is their population control. The sterile insect technique (SIT) has been used in the Tephritidae family with varying degrees of success. Its efficient use usually depends on the development of genetic sexing strains and the release of only male flies. However, such advances are based on modern genetic, molecular and genomic tools. The medfly is clearly the prototype of the family, since such tools have advanced considerably, which has resulted in effective SIT efforts around the world. A whole‐genome sequencing project of this insect is already underway. In contrast, similar tools in the olive fly lag behind, even though the insect is considered a promising candidate for a next SIT target. An accurate estimate of genome size provides a preliminary view of genome complexity and indicates possible difficulties in genome assembly in whole‐genome projects. Taking advantage of a quantitative real‐time PCR approach, we determined the genome size of these two species C. capitata and B. oleae as 591 Mb (CI range: 577–605 Mb) and 322 Mb (CI range: 310–334 Mb) respectively.  相似文献   

13.
针叶树是裸子植物中最大也是分布最广的一支。作为多年生木本植物,针叶树不仅为工业提供建筑、造纸等重要原料和其它可再生能源,而且在北半球的生态平衡中也起着重要作用。因其独特的分类地位、重要的经济价值和生态价值,针叶树序列资源挖掘备受重视。然而其庞大且复杂的基因组阻碍了这一进程,截至2013年4月,尚无获得全基因组序列的针叶树种。随着第2代测序技术的出现及生物信息学的快速发展,针叶树序列资源挖掘也从转录组过渡到全基因组测序,后者己在松属(Pinus)、云杉属(Picea)和黄杉属(Pseudotsuga)部分树种中开展。该文首次归纳了针叶树基因组特征.回顾了针叶树序列资源挖掘进程,并重点介绍了火炬松(Pinustaeda)、欧洲云杉(Piceaabies)和白云杉(Piceaglauca)的全基因组测序项目。  相似文献   

14.
Anopheles gambiae is the mosquito vector responsible for transmitting Plasmodium falciparum, a malaria parasite of humans. With the emergence of genome projects for a variety of prokaryotic and eukaryotic microorganisms, there has been a long-standing interest in sequencing the genomes of the malaria parasite and its insect vector. This tour de force effort has now been completed and reported. The alignment of putative orthologs in An. gambiae with those of Drosophila melanogaster highlights several similarities and differences. These findings could have implications in: (1) identifying new targets for insecticide development; (2) strengthening our understanding of the developmental biology of mosquitoes; and (3) possibly controlling pathogen transmission. A brief overview of these interesting findings and the implications for further studies will be discussed here.  相似文献   

15.
复杂基因组测序技术研究进展   总被引:1,自引:0,他引:1  
复杂基因组指的是无法使用常规测序和组装手段直接解析的一类基因组,通常指包含高比例重复序列、高杂合度、极端GC含量、存在难消除异源DNA污染的基因组。为了解决复杂基因组的测序和组装问题,需要分别从基因组测序实验方法、测序技术平台、组装算法与策略3个方面进行深入研究。本文详细介绍了复杂基因组测序组装相关的现有技术与方法,并结合复杂基因组经典实例介绍了复杂基因组测序的技术解决途径和发展历程,可为制订合适的复杂基因组测序策略提供参考。  相似文献   

16.
With the expansion of next‐generation sequencing technology and advanced bioinformatics, there has been a rapid growth of genome sequencing projects. However, while this technology enables the rapid and cost‐effective assembly of draft genomes, the quality of these assemblies usually falls short of gold standard genome assemblies produced using the more traditional BAC by BAC and Sanger sequencing approaches. Assembly validation is often performed by the physical anchoring of genetically mapped markers, but this is prone to errors and the resolution is usually low, especially towards centromeric regions where recombination is limited. New approaches are required to validate reference genome assemblies. The ability to isolate individual chromosomes combined with next‐generation sequencing permits the validation of genome assemblies at the chromosome level. We demonstrate this approach by the assessment of the recently published chickpea kabuli and desi genomes. While previous genetic analysis suggests that these genomes should be very similar, a comparison of their chromosome sizes and published assemblies highlights significant differences. Our chromosomal genomics analysis highlights short defined regions that appear to have been misassembled in the kabuli genome and identifies large‐scale misassembly in the draft desi genome. The integration of chromosomal genomics tools within genome sequencing projects has the potential to significantly improve the construction and validation of genome assemblies. The approach could be applied both for new genome assemblies as well as published assemblies, and complements currently applied genome assembly strategies.  相似文献   

17.
18.
近几年来五种单细胞生物的基因组计划得以完成。本文介绍了从五种生物的全基因组序列获得的一些成果,包括全基因组鸟枪法测序、基因组分析和新比较基因组等三个方面,并对生物基因组计划的研究方法作一些探讨。  相似文献   

19.
Origins of the Human Genome Project   总被引:2,自引:0,他引:2  
The Human Genome Project has become a reality. Building on a debate that dates back to 1985, several genome projects are now in full stride around the world, and more are likely to form in the next several years. Italy began its genome program in 1987, and the United Kingdom and U.S.S.R. in 1988. The European communities mounted several genome projects on yeast, bacteria, Drosophila, and Arabidospis thaliana (a rapidly growing plant with a small genome) in 1988, and in 1990 commenced a new 2-year program on the human genome. In the United States, we have completed the first year of operation of the National Center for Human Genome Research at the National Institutes of Health (NIH), now the largest single funding source for genome research in the world. There have been dedicated budgets focused on genome-scale research at NIH, the U.S. Department of Energy, and the Howard Hughes Medical Institute for several years, and results are beginning to accumulate. There were three annual meetings on genome mapping and sequencing at Cold Spring Harbor, New York, in the spring of 1988, 1989, and 1990; the talks have shifted from a discussion about how to approach problems to presenting results from experiments already performed. We have finally begun to work rather than merely talk. The purpose of genome projects is to assemble data on the structure of DNA in human chromosomes and those of other organisms. A second goal is to develop new technologies to perform mapping and sequencing. There have been impressive technical advances in the past 5 years since the debate about the human genome project began. We are on the verge of beginning pilot projects to test several approaches to sequencing long stretches of DNA, using both automation and manual methods. Ordered sets of yeast artificial chromosome and cosmid clones have been assembled to span more than 2 million base pairs of several human chromosomes, and a region of 10 million base pairs has been assembled for Caenorhabditis elegans by a collaboration between Washington University and the Medical Research Council laboratory in Cambridge, U.K. This project is now turning to sequencing C. elegans DNA as a logical extension of this work. These are but the first fruits of the genome project. There is much more to come.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号