首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
陈伟  罗辽复 《生物信息学》2009,7(2):159-162
应用多样性增量结合二次判别分析(Increment of Diversity with Quadratic Discriminant analysis, IDQD)方法,对酵母基因组中的核小体强/弱偏好序列进行了识别。10交叉检验的预测成功率超过了97%,受试者操作特性(receiver operating characteristic,ROC)曲线下面积达到了0.99,预测成功率高于现有SVM算法。最后利用构建好的分类器对酵母基因组中三类包含TATA盒基因的起始密码子ATC上游400nt下游100nt区域进行了分析。结果表明,IDQD算法有能力应用于基因组中核小体序列的识别。  相似文献   

2.
组蛋白H2A的变体H2A.Z在基因的表达过程中发挥着重要的作用。根据H2A.Z和H2A核小体中组蛋白甲基化修饰方式的不同,作者应用多样性增量二次判别方法(increment of diversity with quadratic discriminant,IDQD)成功地对H2A.Z和H2A核小体进行了识别,说明了以组蛋白甲基化信息作为特征参数的IDQD模型对H2A.Z和H2A核小体识别的有效性。通过计算DNA序列的柔性,发现H2A.Z核小体对应的DNA序列的平均柔性比常规H2A核小体对应的DNA序列的平均柔性弱。  相似文献   

3.
肖建平  丰继华  卢英  单秋甫 《生物信息学》2013,11(2):150-152,160
在利用核小体定位实验数据训练支持向量机(SVM)对任意酵母DNA序列的核小体形成能力进行预测的过程中,发现染色质结构对基因组DNA分子进化过程有着显著影响。我们观察到核小体DNA比连接DNA的平均预测准确率低15%,这种普遍存在的局部预测准确率差异性代表了酵母核小体定位的进化印迹(Evolutionary footprint),它揭示了核小体组织在基因组的整个进化过程中所具有的保守性。  相似文献   

4.
核小体定位对真核生物基因表达调控发挥着重要作用。前期基于核小体核心及连接区域的k-mer频次分布偏好性,构建了位置权重矩阵算法,并在酿酒酵母基因组内较好地预测了核小体占据率。利用该理论模型,以1 bp碱基为步长、147 bp碱基为窗口,用该算法计算了酵母1号、3号、14号染色体上核小体形成能力强、中、弱各3条长度为147 bp的DNA序列,将这些片段克隆到重组质粒中,大量扩增回收9条标记biotin分子的目的序列。同时分别表达纯化了组蛋白H2A、H2B、H3和H4,复性后装配形成组蛋白八聚体结构。利用盐透析方法将9条DNA序列在体外组装形成核小体结构,经biotin标记检测后计算了反应过程的吉布斯自由能,对比了9条目的序列形成核小体的亲和力大小。研究发现,9条序列中有5条序列与理论预测完全符合,4条序列与理论预测不完全一致。实验结果与该算法预测的核小体定位结果基本一致,表明该理论模型能够有效预测酿酒酵母基因组核小体占据水平。  相似文献   

5.
基于蛋白质序列组分信息,提出一个离散增量结合二次判别分析法(IDQD)预测蛋白质相互作用的模型,对人类蛋白质相互作用进行预测.自洽检验的识别精度达到75.89%,3-fold交叉检验的敏感性和特异性分别为64.22%和64.68%.结果表明IDQD算法可以用于蛋白质相互作用的预测.  相似文献   

6.
作为目前遗传学热点领域表观遗传学的重要研究课题,核小体定位参与多种生物学过程并起着非常关键的作用,因此用理论方法预测核小体定位具有重要的生物学意义。该工作以酵母基因组为研究对象,根据其核心DNA与连接DNA序列的组分特征差异,分别统计其核苷酸k联体出现的频数,计算其多样性增量,并以此为特征值输入支持向量机构建模型。对酵母核小体核心DNA和连接DNA序列进行分类预测,整体准确率和相关系数分别达到93.10%和0.862。此方法在人类和果蝇的核小体核心DNA和连接DNA序列分类预测中也取得了较为理想的效果。将模型用于预测核小体在基因组上的位置取得初步成功。  相似文献   

7.
根据核小体定位序列和缺失序列的碱基分布特征,应用多样性增量二次判别方法(IDQD)构建模型对这两类序列进行了区分,受试者操作特性曲线下的面积达到了0.958.应用这一模型研究了核小体在人类基因组剪接位点(GT/AG)邻近序列中的分布方式,发现外显子所对应的DNA序列通常倾向参与核小体的形成,并且由它所转录的RNA统计上具有较强的刚性,而剪接位点及其邻近的内含子对应的DNA序列则避免参与核小体的形成,所转录的RNA统计上具有较强的柔性.进一步还发现,DNA序列的核小体定位/缺失和RNA的刚性/柔性具有统计相关性,为从机制上解释为何前体RNA剪接事件与DNA序列中的核小体定位信息有关提供了依据.  相似文献   

8.
人类polⅡ启动子的识别   总被引:14,自引:2,他引:12  
依据基因启动子区和非启动子区碱基分布的特征,应用基于多样性增量的二次判别分析 (IDQD),对人类polⅡ启动子进行识别,识别精度达到90%以上的水平,优于其他已发表的 (包括SVM分类器等) 识别算法. 使用IDQD算法也能对转录起始位点 (TSS) 进行较准确的预测,10-fold交叉检验结果的敏感性和特异性分别为86%和91%. 这些结果表明IDQD是一个有效的分类器.  相似文献   

9.
基于二次判别的果蝇启动子识别   总被引:3,自引:0,他引:3  
通过对果蝇polⅡ启动子和非启动子的序列特征分析,计算了序列每个位点单碱基保守性M1(l)值和六联体保守性M6(l)值。从而分别选取两个区域的六联体频数作为离散源参数,利用离散增量结合二次判别函数(IDQD)对启动子进行了预测。对于从编码区和内含子中选取的非启动子数据集,启动子的预测成功率分别达到93%和89%。比较结果显示IDQD模型能够有效地提高启动子预测成功率。  相似文献   

10.
为研究高通量的人类CD4+T细胞的核小体定位模式,使用迭代算法对核小体定位模式进行分类,并利用位置权重矩阵方法分别构建稳定核小体定位序列、动态核小体定位序列和连接区序列模型,通过十倍交叉验证评估模型性能,并与Segal方法与弯曲度方法进行比较,发现位置权重矩阵方法在敏感性、精度和准确性方面都具有一定优越性。同时采用滑窗法在全基因组选取候选序列进行核小体识别,挖掘核小体定位相关基因,并进行基因生物学进程功能富集分析,发现稳定与动态核小体、真实与潜在核小体对应的基因所参与调控的生物学过程各有不同,但也有一些生物学过程为不同类别核小体所共有,例如对细胞内大分子的调控功能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号