首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
【目的】鉴定洛斯里被毛孢OWVT-1菌株的线粒体基因组,验证公布的USA-87-5菌株线粒体基因组中的错误,对洛斯里被毛孢正确的线粒体基因组序列进行注释并开展不同被毛孢物种间的比较线粒体基因组学分析。【方法】借助DNA高通量测序数据并通过必要的Sanger测序组装OWVT-1的线粒体基因组。通过PCR验证OWVT-1与公布的USA-87-5线粒体基因组序列差异的真实性。利用多种生物信息方法分析和注释洛斯里被毛孢的线粒体基因组。【结果】公布的洛斯里被毛孢USA-87-5菌株的线粒体基因组存在几处序列错误,包括3处长片段的插入缺失和多处短片段的插入缺失。实际上,洛斯里被毛孢USA-87-5与OWVT-1菌株的线粒体基因组序列完全相同。该菌的线粒体基因组全长62949 bp,在7个基因中共插入13个内含子,部分内含子和基因间区显现出序列退化的特征。洛斯里被毛孢、明尼苏达被毛孢、线虫被毛孢的线粒体基因组具有较强的共线性关系。除一些独立的ORF外,核心蛋白编码基因、rRNA基因和tRNA基因的排列顺序非常保守。基因间区的长短是影响3种被毛孢线粒体基因组大小最主要的因素。【结论】公布的洛斯里被毛孢USA-87-5菌株线粒体基因组中存在序列错误。本文新报道了OWVT-1菌株的线粒体基因组,并进行注释和比较线粒体基因组学分析。  相似文献   

2.
用一种植物的总基因组DNA与近缘或远缘物种的染色体杂交,可以研究植物近缘或远缘物种基因组进化关系。以拟高粱总基因组DNA为探针,对栽培高粱、甜高粱基因组进行杂交,结果表明栽培高粱、甜高梁和拟高梁基因组中重复序列存在很大的同源性,基因组进化关系表现出保守性。栽培高粱与拟高粱基因组间重复序列的同源性要比甜高粱与拟高粱间重复序列的同源性高。  相似文献   

3.
用一种植物的总基因组DNA与近缘或远缘物种的染色体杂交,可以研究植物近缘或远缘物种基因组进化关系。以拟高粱总基因组DNA为探针,对栽培高粱、甜高粱基因组进行杂交,结果表明栽培高粱、甜高粱和拟高粱基因组中重复序列存在很大的同源性,基因组进化关系表现出保守性。栽培高粱与拟高粱基因组间重复序列的同源性要比甜高粱与拟高粱间重复序列的同源性高。  相似文献   

4.
草地贪夜蛾基因组注释及分析   总被引:2,自引:0,他引:2       下载免费PDF全文
草地贪夜蛾Spodoptera frugiperda近年来在我国迅速扩散,造成了重大的经济损失,引起社会关注。草地贪夜蛾基因组序列对深入研究其迁飞、入侵和抗药性等特性具有十分重要的作用。目前,已有5个版本的基因组序列被公开报道,但3个版本无基因组注释信息。除以Sf 9细胞系为DNA来源的基因组版本外,其他版本的scaffold N50过小,拼接质量偏低。为此,本研究选取了scaffold N50最大的草地贪夜蛾Sf 9细胞系基因组进行了蛋白编码基因注释。该版本的基因组重复序列占比28.1%。CEGMA评估显示该本版本基因组可覆盖93.6%的核心基因,BUSCO评估显示可覆盖90.8%的核心基因。利用OMIGA注释流程预测到25 699个蛋白质编码基因,详细的基因序列可从InsectBase网站获得(http://www.insect-genome.com/FAW/),其中具有GO注释的基因为15 623个,具有KEGG注释的基因共有9 213个。选取了12个鳞翅目昆虫进行比较基因组学分析,发现草地贪夜蛾与斜纹夜蛾的亲缘关系最近,两者分化时间大约在1 284万年前。对12个鳞翅目昆虫蛋白质编码基因进行同源分析,在草地贪夜蛾中发现了2 490个单拷贝基因、891个鳞翅目特有基因、2 360个物种特异扩增基因和4 180个物种特异基因。GO富集分析显示,2 360个物种特异扩增基因主要参与DNA整合、代谢相关的生物过程;4 180个物种特异基因主要参与酶活性、光感受、糖代谢等,KEGG通路富集发现草地贪夜蛾特异基因主要参与氨基酸代谢、糖代谢和Wnt信号通路。本研究结果丰富了草地贪夜蛾的基因信息,对进一步了解其生物学特性、开发新型绿色防控方法具有指导意义。  相似文献   

5.
黄瓜胞质6-磷酸葡萄糖酸脱氢酶基因克隆及序列分析   总被引:1,自引:0,他引:1  
根据6-磷酸葡萄糖酸脱氢酶(6-phosphogluconate dehydrogenase,6PGDH)基因的保守氨基酸序列设计简并引物,应用RT-PCR技术从黄瓜栽培种品种'北京截头'(Cucumis sativus 'Beijingjietou')叶片中获得了640 bp的特异片段,以该序列在EST数据库进行同源检索筛选,发现甜瓜EST序列AM715537.2与之高度一致,据此设计引物经RT-PCR扩增、分子克隆和序列拼接,获得了黄瓜6-磷酸葡萄糖酸脱氢酶基因全长序列,命名为Cs6PGDH(GenBank登录号FJ610345).序列分析表明,该基因全长1 829 bp,其中开放读码框(ORF)长1 488 bp编码495个氨基酸组成的多肽,编码区内无内含子存在,5'、3'端非翻译区长度各为70 bp和271 bp.Blast同源性分析显示该基因编码的氨基酸序列与拟南芥、大豆、水稻、玉米、菠菜等物种6PGDH 基因有74%以上的一致性.由于与其他物种胞质6PGDH相类似氨基酸N端都缺少长度约为40aa的转运肽,推断Cs6PGDH为黄瓜胞质6-磷酸葡萄糖酸脱氢酶基因.  相似文献   

6.
Arthrobacter aurescens TC1和Pseudomonas sp. ADP是目前莠去津降解菌的模式菌株,筛选出Microbacterium sp.HBT4,旨在挖掘这3株不同种属细菌基因组间生物学信息的异同,并预测重要基因。通过Illumina Hiseq 4000测序平台采用DNA小文库制备和测序技术,进行了泛基因组测序,使用相关软件进行基因组组分分析、基因功能注释、基因间变异检测和比较基因组学分析,将分离得到的微杆菌HBT4与模式菌株进行核苷酸组成、共线性及菌株间变异差异分析。得到该菌株基因组大小约为3.53Mb,预测到菌株HBT4编码基因3 397个、重复序列含量为1.33%、非编码RNA 63个,通用数据库基因功能注释共3 324个,专用数据库基因功能注释共1 149个,通过菌株间差异变异分析发现SNP、Small InDel和水平转移基因,未发现结构变异基因,获得该菌株特有基因中GO注释到的基因在细胞组分、分子功能和生物学进程中的数量和比例,从KEGG代谢通路富集图中发现特有基因编码的二氢硫基赖氨酸残基琥珀酰转移酶位于三羧酸循环中α-酮戊二酸和琥珀酰辅酶A的代谢通路之间。获得3个菌株核心基因组与非必需基因组比例分布、系统进化树和共线性关系,发现三者之间共有基因家族986个、菌株HBT4特有基因家族1 171个。得到的菌株HBT4与两株模式菌株相比,其基因家族之间既有相同之处,又有较大差异。  相似文献   

7.
即使细菌基因组的基因结构较为简单,但在注释过程中也可能出现基因遗漏的现象。当潜在基因在高质量数据库中没有显著同源序列时,基于知识库的基因预测方法就会遇到困难。本文希望通过系统扫描基因组所有可能ORF的蛋白质序列模式来搜索遗漏基因。为验证该方法的可行性,作者系统分析了重要的工业发酵微生物谷氨酸棒杆菌的基因组,发现了25个候选疑似基因。它们具有显著的蛋白质序列模式,但在Swiss-Prot中元显著同源序列,并且在GenBank中仍未注释。深入分析发现,25个候选疑似基因中19个为可能基因,3个为可能假基因,3个为疑似基因序列。这些结果说明本文的分析方法可以有效地用于无显著同源序列基因的搜索。  相似文献   

8.
不同分类群的异源多倍体在二倍化过程中, 正反交序列消除往往表现出不同特征, 暗示了在不同物种中, 核质互作在多倍体进化过程的作用不同。利用13对EcoRI-NN/MseI-NNN选择性引物, 对野黄瓜Cucumis hystrix (2n=24)与栽培黄瓜C. sativus (2n=14)的正反交F1、异源四倍体及二倍体亲本DNA进行AFLP分析。结果表明: 杂交后代基因组的杂合性诱发了F1与异源四倍体广泛的序列消除; 细胞质可能会影响部分亲本序列消除的频率, 但是正反交在序列消除频率上差异不显著, 并且在序列消除时间(均始于F1代)及消除类型上也表现出一致性, 表明核质互作并不是影响序列消除的主要因素; 实验还发现, 正反交不能影响序列的倾向性丢失, 染色体数少的黄瓜条带易发生丢失。  相似文献   

9.
红边龙血树(Dracaena marginata)是一种在全球广泛种植的龙血树属园艺植物,具有较高的观赏价值和药用价值。本研究首次利用高通量测序技术对红边龙血树叶片进行全基因组测序,组装得到完整的叶绿体基因组序列,并进行注释、序列特征比较和系统发育分析。结果表明,红边龙血树叶绿体基因组包含一个典型的四分体结构,长度为154926 bp,是目前已报道的龙血树属中叶绿体基因组最小的物种;共拥有132个基因,包含86个编码蛋白基因、38个转运RNA基因和8个核糖体RNA基因;密码子偏好性分析发现存在偏好使用A/U碱基结尾的现象,整体上密码子偏好性较低;共鉴定出46个简单重复序列位点和54个长重复序列,分别在大单拷贝区与反向重复区有最大检出率;种间边界分析发现边界区域基因存在相对位置差异,扩张收缩情况总体较为相似;与近缘种进行系统发育分析,红边龙血树与细枝龙血树聚为一类,关系最近,符合形态学分类特征。对红边龙血树叶绿体基因组的解析为龙血树属植物的物种鉴定、遗传多样性和叶绿体转基因工程等提供了重要数据基础。  相似文献   

10.
社鼠(Niviventer confucianus)属于啮齿目(Rodentia)、鼠科(Muridae)、白腹鼠属(Niviventer),关于该物种的分子系统学研究极少。为获取社鼠线粒体基因组全序列,提取其基因组总DNA,参照近缘物种线粒体基因组全序列设计34对特异性引物,利用PCR扩增全部片段后进行测序,之后对其基因组组成及结构特点进行了初步分析。结果表明,社鼠线粒体基因组全序列长16 281 bp(GenBank收录号:KJ152220),包含22个tRNA基因、13个蛋白质编码基因、2个rRNA基因和1个非编码控制区;基因组核苷酸组成为34.0%A、28.6%T、24.9%C、12.5%G。将所得序列与社鼠近缘物种(川西白腹鼠、小家鼠、褐家鼠)的线粒体全基因组进行比较,结果显示,四个物种的线粒体基因组虽然在基因组大小、部分tRNA二级结构、部分蛋白质编码基因的起始或终止密码子及控制区长度和碱基组成上有差异,但基因组结构和序列特征方面都具有较高的相似性。四个物种线粒体全基因组间的遗传距离显示,社鼠与川西白腹鼠距离最近,而与小家鼠距离最远。该研究为利用线粒体全基因组信息进行啮齿类分子系统学研究提供了有价值的资料。  相似文献   

11.
带芒草属低分子量谷蛋白基因的克隆及序列分析   总被引:1,自引:0,他引:1  
在普通小麦中获得了大量的低分子量谷蛋白基因序列, 而在小麦近缘属物种中获得的同源基因则比较少, 导致对麦类低分子量谷蛋白基因家族成员间的关系还不清楚。因此, 进行近缘属物种低分子量谷蛋白基因的研究是非常必要的。此研究通过特殊设计的1对引物, 以小麦近缘属带芒草物种的基因组DNA为模板, 经过PCR和克隆, 从中得到了一条核苷酸序列长度为1 035 bp, 推测的氨基酸序列为343个氨基酸残基的低分子量谷蛋白基因, 该基因序列具有小麦低分子量谷蛋白基因的典型特征, 包括21个氨基酸残基的信号肽、13个氨基酸的N-端和由可重复的短肽单元组成的重复区以及1个C末端。序列比对结果揭示了来自带芒草的低分子量谷蛋白基因与小麦同源基因的差异及相互关系。此研究结果对从带芒草属以及其他小麦近缘属物种中分离未知低分子量谷蛋白基因有参考价值和借鉴意义。  相似文献   

12.
拟南芥和琴叶拟南芥中MADS-box基因的比较进化分析   总被引:1,自引:0,他引:1  
MADS-box基因编码一类转录因子。在被子植物中,MADS-box基因对于营养生长和生殖发育都有重要的调控作用,是植物体(特别是花序、花和果实)的正常发育所不可或缺的。为了理解近缘物种在遗传基础上的异同,我们对拟南芥(Arabidopsis thaliana)和琴叶拟南芥(A.lyrata)基因组中MADS-box基因的拷贝数目和进化式样进行了比较分析。通过搜索公共数据库,我们在拟南芥和琴叶拟南芥中分别鉴定出了106和115个基因。系统发育分析的结果表明,这些基因属于I型和II型MADS-box基因。在两个物种分化之后,II型基因的拷贝数目变化不大,I型基因则经历了多次独立的基因丢失和获得事件。通过比较这些基因在染色体上的排列,我们不但鉴定出了存在微共线性的基因组区段,而且发现新基因产生的主要机制是串联重复和散在重复。分子进化的研究进一步表明,I型和II型基因在进化式样上存在着显著差异:II型基因在进化中一般都受到了较强的选择压力,而I型基因大多受到的选择压力较弱。本研究将为深入理解近缘物种在基因和基因组层面上的异同、探讨物种分化和生物多样性形成的机制等问题提供新思路。  相似文献   

13.
叶绿体基因组序列变异和基因组成等特征可有效反映植物类群间的系统发育和进化关系。本研究利用Illumina高通量测序平台对梅花草属(Parnassia)及其近缘属5种植物的叶绿体基因组进行测序和组装,同时基于已发表的近缘种叶绿体基因组信息,对梅花草属叶绿体基因组结构特征、序列遗传变异和蛋白编码基因密码子偏好性比对分析。结果显示:梅花草属叶绿体基因组整体结构较为保守,均为四分体结构;梅花草多个基因出现假基因化,而本属其他物种叶绿体基因组成一致,均编码115个基因;与近缘属物种相比,本属所有物种均丢失rpl16基因的内含子;蛋白质编码基因的非同义/同义替代率比值较低,叶绿体基因可能经历纯化选择作用;密码子偏好性聚类结果与蛋白编码序列重建的系统发育关系结果一致。本研究表明选择压力可能在梅花草属叶绿体基因组蛋白编码基因进化过程中发挥作用,有助于进一步理解梅花草属植物的进化和适应机制。  相似文献   

14.
荷花玉兰是重要的药用、观赏及园林绿化植物.应用454高通量测序技术对荷花玉兰叶绿体全基因组进行测序,解析了其基因组结构,并与近缘物种基因组进行了比较分析.荷花玉兰叶绿体基因组全长为159623bp,两个反向互补重复区(IRs)长26563bp,被分隔的大单拷贝区(LSC)和小单拷贝区(SSC)长度分别为87757和18740bp.成功注释129个叶绿体基因,其中18个基因含有内含子.基因的种类、数目以及GC含量等与其他木兰科物种相类似.生物信息学分析获得218个SSR位点,大多位点富含A-T,具有碱基偏好性.木兰科物种的重复基序类型和丰度相对保守,有利于开发叶绿体基因组载体.木兰亚纲植物叶绿体基因组的大小及IR区边界的变化与ycf1的长度密切相关.采用30个物种叶绿体基因组的66个共有蛋白编码基因构建系统发育树,对木兰属在被子植物中的进化位置进行了探讨.荷花玉兰叶绿体全基因组序列的获得和结构解析对优良品种培育、叶绿体基因组工程、木兰科物种分子标记开发及系统发育关系的研究具有重要价值.  相似文献   

15.
张德礼  李衍达  季梁 《遗传学报》2004,31(4):325-334
采用生物信息学分析与实验确认相结合的技术路线,通过所识别的基因在非冗余数据库比对发现了网上公布的计算机注释人类基因组编码序列存在各种类型的多处错误。该策略既有助于发现更多的人类新基因,又有助于纠正美国国家生物技术信息中心(NCBI)基因组注释项目公布的参考序列(REFSEQs)中所存在的错误。比如他们采用基因预测方法通过自动计算分析从NCBIcontig NT_010808预测到两个模式参考序列LOC124919和LOC147007,本该都是C17orf32,但却都是C17orf32的不同错误形式,分别为第1和2类型错误;再如,他们采用基因预测方法通过自动计算分析从NCBIcontig NT_004511预测到3个模式参考序列LOC14907、LOC200084和LOC91126,实际上都是.ZNF362一种基因,却提交了ZNF362的3种不同错误形式,分别为第4、5和7类型错误。本研究利用计算机识别并结合实验验证能够纠正或避免现有的人类基因组编码序列错误。以前公开发表的文献没有明确指出NCBI人类基因模式参考序列存在错误,因此直当慎重看待计算机注释的可能存在各种类型错误的人类基因组编码序列。人类新基因的正确识别和注释仍是一项长期而繁重的任务。  相似文献   

16.
为理解珍稀濒危兰科植物龙头兰(Pecteilis susannae)和景洪白蝶兰(P.hawkesiana)的叶绿体基因组的基本特征,开发用于物种鉴定、保护遗传学和系统发育分析的分子标记,该研究利用二代测序技术对龙头兰和景洪白蝶兰进行浅层基因组测序,采用生物信息学分析方法进行叶绿体基因组的拼接、组装和注释,并与其他近缘物种进行比较基因组分析和系统发育分析。结果表明:(1)龙头兰和景洪白蝶兰的叶绿体基因组大小分别为154 407 bp和153 891 bp,由一对26 550 bp和26 523 bp的反向重复序列(IR)、84 204 bp和83 756 bp的大单拷贝区(LSC)、17 103 bp和17 089 bp的小单拷贝区(SSC)组成;均注释了111个唯一基因,包括77个蛋白质编码基因、30个tRNA基因和4个rRNA基因。(2)在叶绿体基因组中分别鉴定出94个和92个简单重复序列(SSRs)。(3)二者之间存在706个单核苷酸多态性(SNPs)位点和152个插入缺失(InDels)位点,其中cpInDel 067等可以区分2个物种。(4)观察到1个差异较大的基因(accD...  相似文献   

17.
随着高通量DNA测序技术的飞速发展,越来越多的物种完成了基因组测序.定位编码基因、确定编码基因结构是基因组注释的基本任务,然而以往的基因组注释方法主要依赖于DNA及RNA序列信息.为了更加精确地解读完成测序的基因组,我们需要整合多种类型的组学数据进行基因组注释.近年来,基于串联质谱技术的蛋白质组学已经发展成熟,实现了对蛋白质组的高覆盖,使得利用串联质谱数据进行基因组注释成为可能.串联质谱数据一方面可以对已注释的基因进行表达验证,另一方面还可以校正原注释基因,进而发现新基因,实现对基因组序列的重新注释.这正是当前进展较快的蛋白质基因组学的研究内容.利用该方法系统地注释已完成测序的基因组已成为解读基因组的一个重要补充.本文综述了蛋白质基因组学的主要研究内容和研究方法,并展望了该研究方向未来的发展.  相似文献   

18.
人类新基因C17orf32的电子克隆和编码区序列RT-PCR验证   总被引:19,自引:3,他引:16  
利用生物信息学与实验验证的技术路线,成功地克隆了人类新基因C17orf32的cDNA(GenBank登记号:AY074907和TPA: BK000260),发现C17orf32的完整开放阅读框架(ORF,31~657 bp)cDNA(627 bp)与人类假定基因LOC124919 ORF(25~807 bp)的25~651位只有一个碱基不同.经RT-PCR验证并cDNA测序、人类表达序列标签(EST)数据库的BLAST检索和基因组成规律分析三方面的结果,均支持C17orf32的序列,而不支持LOC124919的编码序列.C17orf32基因组序列全长4.610 kb,含有6个外显子和5个内含子,cDNA序列全长1 679 bp, ORF横跨全部6个外显子.该基因ORF翻译起始处符合Kozak规则,ORF起始码上游同一相位有终止码,ORF后有2个加尾信号和PolyA尾.C17orf32基因的成功克隆表明,NCBI GENOME Annotation Project在2001年12月预测的人类假定蛋白XP-058865编码基因LOC124919的模式参考序列XM-058865中存在偏差,即在C17orf32基因cDNA的406与407位碱基之间错误插入一个碱基G, 从而导致在插入位点后,ORF编码125位氨基酸以后蛋白质序列的改变,出现260个氨基酸的多肽.因此,应慎重看待计算机注释的人类基因组编码序列.建立的技术路线有助于发现更多新的人类功能基因.  相似文献   

19.
【目的】Streptomyces sp. PRh5是从东乡野生稻(Oryza rufipogon Griff.)中分离获得的一株对细菌和真菌都具有较强抗菌活性的内生放线菌。为深入研究PRh5菌株抗菌机制及挖掘次级代谢产物基因资源,有必要解析PRh5菌株的基因组序列信息。【方法】采用高通量测序技术对PRh5菌株进行全基因组测序,然后使用相关软件对测序数据进行基因组组装、基因预测与功能注释、直系同源簇(COG)聚类分析、共线性分析及次级代谢产物合成基因簇预测等。【结果】基因组组装获得290 contigs,整个基因组大小约11.1 Mb,GC含量为71.1%,序列已提交至GenBank数据库,登录号为JABQ00000000。同时,预测得到50个次级代谢产物合成基因簇。【结论】将为Streptomyces sp. PRh5的功能基因组学研究及相关次级代谢产物的生物合成途径与异源表达研究提供基础。  相似文献   

20.
本文构建了相当于大熊猫10倍基因组覆盖度的BAC文库, 并随机挑选了其中9个BAC进行测序和组装, 9个BAC的选择满足更多基因更少重复序列的原则. 这9个BAC的组装将为评估基于新一代Illumina GA测序技术的大熊猫全基因组测序及组装的准确性提供有效资源. 运用同源比对和从头预测的方法, 对9个BAC, 共约878 kb的序列进行了基因和重复序列的注释以及进化分析. 一共预测到12个蛋白编码基因, 其中, 7个基因匹配到同源基因的功能注释. 这7个基因平均大小约41 kb, 编码区平均大小约1.2 kb, 每个基因平均约含6个外显子. 同时预测到7个tRNA基因. 大约27%的序列被注释为重复序列. 同时, 基于邻接法, 构建了包含人、小鼠、狗、猫以及大熊猫5个物种的物种进化树, 结果显示狗的基因与其他4个物种相比距大熊猫最近. 本实验结果提供了大熊猫9个BAC的详细序列及注释信息, 为对大熊猫的研究提供了数据资源.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号