首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 163 毫秒
1.
应用多样性增量结合二次判别分析(Increment of Diversity with Quadratic Discriminant analysis,IDQD)方法,对酵母基因组中的核小体强/弱偏好序列进行了识别.10交叉检验的预测成功率超过了97%,受试者操作特性(receiver operating characteristic,ROC)曲线下面积达到了0.99,预测成功率高于现有SVM算法.最后利用构建好的分类器对酵母基因组中三类包含TATA盒基因的起始密码子ATG上游400nt下游100nt区域进行了分析.结果表明,IDQD算法有能力应用于基因组中核小体序列的识别.  相似文献   

2.
肖建平  丰继华  卢英  单秋甫 《生物信息学》2013,11(2):150-152,160
在利用核小体定位实验数据训练支持向量机(SVM)对任意酵母DNA序列的核小体形成能力进行预测的过程中,发现染色质结构对基因组DNA分子进化过程有着显著影响。我们观察到核小体DNA比连接DNA的平均预测准确率低15%,这种普遍存在的局部预测准确率差异性代表了酵母核小体定位的进化印迹(Evolutionary footprint),它揭示了核小体组织在基因组的整个进化过程中所具有的保守性。  相似文献   

3.
组蛋白H2A的变体H2A.Z在基因的表达过程中发挥着重要的作用。根据H2A.Z和H2A核小体中组蛋白甲基化修饰方式的不同,作者应用多样性增量二次判别方法(increment of diversity with quadratic discriminant,IDQD)成功地对H2A.Z和H2A核小体进行了识别,说明了以组蛋白甲基化信息作为特征参数的IDQD模型对H2A.Z和H2A核小体识别的有效性。通过计算DNA序列的柔性,发现H2A.Z核小体对应的DNA序列的平均柔性比常规H2A核小体对应的DNA序列的平均柔性弱。  相似文献   

4.
核小体定位对真核生物基因表达调控发挥着重要作用。前期基于核小体核心及连接区域的k-mer频次分布偏好性,构建了位置权重矩阵算法,并在酿酒酵母基因组内较好地预测了核小体占据率。利用该理论模型,以1 bp碱基为步长、147 bp碱基为窗口,用该算法计算了酵母1号、3号、14号染色体上核小体形成能力强、中、弱各3条长度为147 bp的DNA序列,将这些片段克隆到重组质粒中,大量扩增回收9条标记biotin分子的目的序列。同时分别表达纯化了组蛋白H2A、H2B、H3和H4,复性后装配形成组蛋白八聚体结构。利用盐透析方法将9条DNA序列在体外组装形成核小体结构,经biotin标记检测后计算了反应过程的吉布斯自由能,对比了9条目的序列形成核小体的亲和力大小。研究发现,9条序列中有5条序列与理论预测完全符合,4条序列与理论预测不完全一致。实验结果与该算法预测的核小体定位结果基本一致,表明该理论模型能够有效预测酿酒酵母基因组核小体占据水平。  相似文献   

5.
作为目前遗传学热点领域表观遗传学的重要研究课题,核小体定位参与多种生物学过程并起着非常关键的作用,因此用理论方法预测核小体定位具有重要的生物学意义。该工作以酵母基因组为研究对象,根据其核心DNA与连接DNA序列的组分特征差异,分别统计其核苷酸k联体出现的频数,计算其多样性增量,并以此为特征值输入支持向量机构建模型。对酵母核小体核心DNA和连接DNA序列进行分类预测,整体准确率和相关系数分别达到93.10%和0.862。此方法在人类和果蝇的核小体核心DNA和连接DNA序列分类预测中也取得了较为理想的效果。将模型用于预测核小体在基因组上的位置取得初步成功。  相似文献   

6.
林昊 《生物信息学》2009,7(4):252-254
由于蛋白质亚细胞位置与其一级序列存在很强的相关性,利用多样性增量来描述蛋白质之间氨基酸组分和二肽组分的相似程度,采用修正的马氏判别式(这里称为IDQD方法)对分枝杆菌蛋白质的亚细胞位置进行了预测。利用Jackknife检验对不同序列相似度下的蛋白质数据集进行了预测研究,结果显示,当数据集的序列相似度小于等于70%时,算法的预测精度稳定在75%左右。在对整体852条蛋白质的预测成功率达到87.7%,这一结果优于已有算法的预测精度,说明IDQD是一种有效的分枝杆菌蛋白质亚细胞预测方法。  相似文献   

7.
根据核小体定位序列和缺失序列的碱基分布特征,应用多样性增量二次判别方法(IDQD)构建模型对这两类序列进行了区分,受试者操作特性曲线下的面积达到了0.958.应用这一模型研究了核小体在人类基因组剪接位点(GT/AG)邻近序列中的分布方式,发现外显子所对应的DNA序列通常倾向参与核小体的形成,并且由它所转录的RNA统计上具有较强的刚性,而剪接位点及其邻近的内含子对应的DNA序列则避免参与核小体的形成,所转录的RNA统计上具有较强的柔性.进一步还发现,DNA序列的核小体定位/缺失和RNA的刚性/柔性具有统计相关性,为从机制上解释为何前体RNA剪接事件与DNA序列中的核小体定位信息有关提供了依据.  相似文献   

8.
基于蛋白质序列组分信息,提出一个离散增量结合二次判别分析法(IDQD)预测蛋白质相互作用的模型,对人类蛋白质相互作用进行预测.自洽检验的识别精度达到75.89%,3-fold交叉检验的敏感性和特异性分别为64.22%和64.68%.结果表明IDQD算法可以用于蛋白质相互作用的预测.  相似文献   

9.
为研究高通量的人类CD4+T细胞的核小体定位模式,使用迭代算法对核小体定位模式进行分类,并利用位置权重矩阵方法分别构建稳定核小体定位序列、动态核小体定位序列和连接区序列模型,通过十倍交叉验证评估模型性能,并与Segal方法与弯曲度方法进行比较,发现位置权重矩阵方法在敏感性、精度和准确性方面都具有一定优越性。同时采用滑窗法在全基因组选取候选序列进行核小体识别,挖掘核小体定位相关基因,并进行基因生物学进程功能富集分析,发现稳定与动态核小体、真实与潜在核小体对应的基因所参与调控的生物学过程各有不同,但也有一些生物学过程为不同类别核小体所共有,例如对细胞内大分子的调控功能。  相似文献   

10.
基于二次判别的果蝇启动子识别   总被引:3,自引:0,他引:3  
通过对果蝇polⅡ启动子和非启动子的序列特征分析,计算了序列每个位点单碱基保守性M1(l)值和六联体保守性M6(l)值。从而分别选取两个区域的六联体频数作为离散源参数,利用离散增量结合二次判别函数(IDQD)对启动子进行了预测。对于从编码区和内含子中选取的非启动子数据集,启动子的预测成功率分别达到93%和89%。比较结果显示IDQD模型能够有效地提高启动子预测成功率。  相似文献   

11.
DNA甲基化作为直接作用于DNA序列的一种表观遗传修饰,能够在不改变DNA分子一级结构的情况下影响基因表达,在生命活动中扮演着重要的角色.在哺乳动物中,DNA甲基化主要发生在C_pG二核苷酸的胞嘧啶上,并且在基因组中呈现不均匀分布.准确预测DNA甲基化位点有助于阐明DNA甲基化对基因表达的调控作用,并为肿瘤的早期诊断及治疗提供新的依据.本文应用离散增量结合二次判别分析的方法,对人类的C_pG二核苷酸甲基化状态进行了识别.5折交叉检验的整体准确率超过了80%,受试者操作特性曲线面积也达到了0.86.与现有方法相比,预测成功率显著提高.这说明离散增量结合二次判别分析方法适用于甲基化位点的预测;基因组序列中甲基化位点具有序列依赖性.  相似文献   

12.
CRISPR(clustered regulatory interspersed short palindromic repeat)序列源于原核生物的一种获得性免疫系统,协同Cas(CRISPR-associated)蛋白家族参与抵抗噬菌体或其它病毒的二次感染,广泛存在于细菌(60%)和古菌(90%)中.病菌和宿主的共同进化导致了CRISPR-Cas系统具有多样性,可分为3大类(Ⅰ-Ⅲ),又分为10亚类.在Ⅱ型CRISPR-Cas系统基础上建立了RNA介导的CRISPR-Cas系统来修饰(删除、添加、激活、抑制)靶细胞中特定的基因序列,现已在人类细胞、小鼠、斑马鱼、酵母、细菌、果蝇、线虫、拟南芥中得以应用.本文主要介绍了Ⅱ型CRISPR-Cas系统的结构特点、作用机理及作为新型基因组定点修饰技术的研究进展,分析该技术优势,并展望CRISPRCas系统的应用前景.  相似文献   

13.
目的建立猴外周血单核细胞SV40DNA的PCR检测方法,对猕猴SV40T抗原基因进行检测。方法使用PCR方法对分别来自野外(云南宁蒗71只、景东60只)及笼养猕猴(64只)的SV40大T抗原基因进行检测,同时对扩增出的阳性结果进行测序。结果在195份样本中,有4只来自野生猴样本扩增出SV40大T抗原基因(3.1%,4/131),1只来自笼养猴样本扩增出SV40大T抗原基因(1.6%,1/64)。测序结果显示:猴血样本扩增片段序列与GenBank中的SV40大T抗原C-末端的基因序列片段有15个核苷酸不同(3.3%差异),与SV40.776标准株的序列基本一致,但SV40—776在nt3020处有一缺口。结论云南野生及笼养猕猴猴群均能检出SV40T抗原基因。因此建立SV40病毒的DNA检测技术,对用于科研及疫苗生产的实验猕猴的病毒学质量控制具有重要意义。  相似文献   

14.
现有92株芜菁花叶病毒(TuMV)的全基因组序列已在GenBank报道,据分析报道其中58株不含重组序列。利用系统聚类法对92株TuMV的全基因组序列和58株TuMV全基因组序列的相对密码子频率RSCU值进行聚类分析。同时利用系统发育分析方法分析了这92株和58株TuMV全基因组序列。结果发现,92株芜菁花叶病毒株的密码子偏性聚类树与其系统进化树的一致度很低;而不含重组序列的58株芜菁花叶病毒株的密码子偏性聚类树与其系统进化树的一致度却非常高,且与寄生宿主类型基本对应。这表明在不存在重组的情况下,TuMV密码子频率的偏性可能是宿主内的一种选择压力,影响TuMV基因组的点突变进化方向,促使TuMV适应宿主内环境。  相似文献   

15.
Bacterial plasmids containing no detectable homology with yeast DNA sequences were inserted into the yeast genome by cotransforming with a plasmid containing a yeast gene. Analysis of the yeast transformants confirmed that recombination events occurred between the prokaryotic sequences shared by the two plasmids and between the yeast sequences common to the cotransforming plasmid and to the genome. Multiple copies of the two plasmids, in both tandem and interspersed arrays, are inserted by this method. Populations of cells grown from individual transformants are heterogenous for the number of integrated sequences. The number of integrated bacterial sequences is greatly reduced after 100 generations of growth in the populations that initially contained large numbers of sequences, while it is stable in those populations that initially contained either a single or a small number of copies.  相似文献   

16.
Lower eukaryotes of the kingdom Fungi include a variety of biotechnologically important yeast species that are in the focus of genome research for more than a decade. Due to the rapid progress in ultra-fast sequencing technologies, the amount of available yeast genome data increases steadily. Thus, an efficient bioinformatics platform is required that covers genome assembly, eukaryotic gene prediction, genome annotation, comparative yeast genomics, and metabolic pathway reconstruction. Here, we present a bioinformatics platform for yeast genomics named RAPYD addressing the key requirements of extensive yeast sequence data analysis. The first step is a comprehensive regional and functional annotation of a yeast genome. A region prediction pipeline was implemented to obtain reliable and high-quality predictions of coding sequences and further genome features. Functions of coding sequences are automatically determined using a configurable prediction pipeline. Based on the resulting functional annotations, a metabolic pathway reconstruction module can be utilized to rapidly generate an overview of organism-specific features and metabolic blueprints. In a final analysis step shared and divergent features of closely related yeast strains can be explored using the comparative genomics module. An in-depth application example of the yeast Meyerozyma guilliermondii illustrates the functionality of RAPYD. A user-friendly web interface is available at https://rapyd.cebitec.uni-bielefeld.de.  相似文献   

17.
玉米△12脂肪酸脱氢酶是催化油酸形成亚油酸的关键酶。将其编码基因FAD2(GenBank登陆号:DQ496227)克隆到酿酒酵母表达载体pYES2.0中,构建成重组质粒pYE/FAD2,转化到酿酒酵母进行诱导表达,同时以pYES2.0转化子为对照。气相色谱(Gc)分析表明,重组转化子亚油酸的含量占酵母总脂肪酸的1.54%,而对照未检测到亚油酸。表明FAD2基因具有编码△12脂肪酸脱氢酶的功能。为探索转译起始密码子周边序列的改变对FAD2基因表达产生的影响,将该基因的起始密码子上游序列进行修改,构建重组表达载体pYE/FAD2—1,转化酿酒酵母进行表达。GC分析表明,pYE/FAD2—1转化子的亚油酸含量占总脂肪酸含量的8.81%,是对照pYE/FAD2转化子的近5倍。  相似文献   

18.
柑橘衰退病毒(Citrus tristeza virus,CTV)属于长线性病毒科(Closteroviridae),是目前已知植物病毒中基因组最大的病毒,其引起的柑橘衰退病对全世界的柑橘产业造成着严重影响。本文以在GenBank登录的32条全长CTV基因组序列为材料,分析简单重复序列(Simple Sequence Repeats,SSRs)在其基因组序列中的分布情况。研究结果显示,在所有的CTV基因组中均有SSRs的分布,SSRs重复次数较少,二型SSRs占主导地位,未在CTV基因组序列中发现五型和六型SSRs。在32条基因组全长序列中仅在5条序列中发现四型SSRs。这是首次以柑橘病毒为材料进行的SSRs分析研究。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号