首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 406 毫秒
1.
基于已知的酵母转录因子结合位点数据资料,构建转录因子结合位点碱基关联二联体位置权重矩阵,整合碱基关联二联体位置权重矩阵和碱基保守性参量M2i,提出一种新的预测转录因子结合位点的方法(PWMSA).利用self-consistency和cross-validation两种方法对此算法进行检验,均获得了较高的预测成功率,结果表明9种转录因子结合位点的总体预测成功率超过81%,明显高于单碱基位置权重矩阵,同时与已有预测转录因子结合位点的软件进行比较,核苷酸水平上的关联系数和结合位点水平上的关联系数分别达到0.42和0.52,优于现有预测方法.  相似文献   

2.
基于实验验证的22种大肠杆菌K12的转录因子结合位点序列,分析了转录因子结合位点每一位置的碱基保守性,提出了预测转录因子结合位点的位置权重矩阵打分函数算法(PWMSA)。利用self-consistency和cross-validation两种检验方法对此算法进行检验,self-consistency检验总的预测成功率达到87.59%,cross-validation检验成功率达到85.48%。对基因间序列进行搜索,获得了多个可能的转录因子结合位点。  相似文献   

3.
杨科利  许强 《生物技术》2008,18(2):39-42
目的:改进真核生物启动子的理论预测方法。方法:基于启动子序列的信号特征和内容特征,构建6个标准离散源,计算每条序列相对于标准离散源的离散增量;构建信号特征的启动子位置权重矩阵,计算其对应位置的位置权重打分函数,将所得到的两类参数输入支持向量机对果蝇启动子进行预测。结果:利用self-consistency和cross-validation两种方法对此算法进行检验,均获得了较高的预测成功率,结果表明五种转录因子结合位点的预测成功率均超过91%。结论:结果显示结合了支持向量机的离散增量算法能够有效的提高预测成功率,是进行真核生物启动子预测的一种很有效的方法。  相似文献   

4.
目的:预测转录因子结合位点。方法:本文从ABS数据库上下载了人类和啮齿类动物的直系同源的启动子序列,首先使用位置打分函数对这些启动子序列进行打分,找到候选的转录因子结合位点,并进一步利用进化足迹法对这些候选的转录因子结合位点进行筛选,只有结合位点同时出现在人类和啮齿类动物的启动子序列才认为是真正的结合位点。结果:在对人类和啮齿类动物进行转录因子结合位点预测时,与单独使用打分函数的结果相比,进化足迹法与打分函数结合的方法有效的提高了预测结果的性能,大幅度提供所得预测结果的特异性。结论:进化足迹法结合位置打分矩阵的方法能较为准确有效的预测转录因子结合位点。  相似文献   

5.
随着转录调控网络成为后基因组时代研究的最重要的问题之一,研究转录因子结合位点对此有着重要意义,生物信息学在转录因子结合位点的研究中也发挥着越来越关键的作用。方法:本文对目前研究最早最成熟的真核模式生物酿酒酵母基因组转录调控位点生物信息学研究现状进行分析。结果:本文总结了常用的转录因子相关的数据库、转录因子结合位点的表示方法、预测算法,并简要阐述了调控网络的类型和研究现状。结论:本研究结果为深入研究真核生物的转录水平调控模式奠定理论基础。  相似文献   

6.
转录因子结合位点的计算预测是研究基因转录调控的重要环节,但现有算法的预测特异性偏低.在深入分析转录因子结合位点生物特征的基础上,对当前基于保守模体和基于比较基因组学的两类计算预测方法进行了综述,指出了方法各自的优点和不足,并探讨了可能的改进方向.  相似文献   

7.
选择性剪切是调解基因表达的重要机制.识别选择性剪切位点是后基因组时代的一个重要工作.本文从最新的EBI人类基因选择性剪切数据库中,选取5'/3'选择性剪切位点作为正集,选取在剪切位点附近的假剪切位点作为负集,并把所有的选择性剪切位点和假剪切位点随机分成训练集和测试集.本文选用的预测选择性剪切位点的方法是基于位置权重矩阵和离散增量的支持向量机方法.此方法仅基于训练集,以不同位点的单碱基概率和序列片断的三联体频数作为信息参数,利用位置权重矩阵和离散增量算法结合支持向量机,得到了选择性供体位点和受体位点的分类器,并用此分类器对测试集中的选择性供体位点和受体位点进行预测.对独立测试集中的选择性供体位点和选择性受体位点的预测成功率分别为88.74%和90.86%,特异性分别为85.62%和81.19%.本文预测选择性剪切位点的方法成功率高于其它选择性剪切位点预测方法预测成功率,此预测方法进一步提高了对选择性剪切位点的理论预测能力.  相似文献   

8.
用支持向量机预测人类基因5'/3'选择性剪切位点   总被引:1,自引:0,他引:1  
选择性剪切是调解基因表达的重要机制.识别选择性剪切位点是后基因组时代的一个重要工作.本文从最新的EBI人类基因选择性剪切数据库中,选取5'/3'选择性剪切位点作为正集,选取在剪切位点附近的假剪切位点作为负集,并把所有的选择性剪切位点和假剪切位点随机分成训练集和测试集.本文选用的预测选择性剪切位点的方法是基于位置权重矩阵和离散增量的支持向量机方法.此方法仅基于训练集,以不同位点的单碱基概率和序列片断的三联体频数作为信息参数,利用位置权重矩阵和离散增量算法结合支持向量机,得到了选择性供体位点和受体位点的分类器,并用此分类器对测试集中的选择性供体位点和受体位点进行预测.对独立测试集中的选择性供体位点和选择性受体位点的预测成功率分别为88.74%和90.86%,特异性分别为85.62%和81.19%.本文预测选择性剪切位点的方法成功率高于其它选择性剪切位点预测方法预测成功率,此预测方法进一步提高了对选择性剪切位点的理论预测能力.  相似文献   

9.
选择性剪切是调解基因表达的重要机制。识别选择性剪切位点是后基因组时代的一个重要工作。本文从最新的EBI人类基因选择性剪切数据库中,选取5′/3′选择性剪切位点作为正集,选取在剪切位点附近的假剪切位点作为负集,并把所有的选择性剪切位点和假剪切位点随机分成训练集和测试集。本文选用的预测选择性剪切位点的方法是基于位置权重矩阵和离散增量的支持向量机方法。此方法仅基于训练集,以不同位点的单碱基概率和序列片断的三联体频数作为信息参数,利用位置权重矩阵和离散增量算法结合支持向量机,得到了选择性供体位点和受体位点的分类器,并用此分类器对测试集中的选择性供体位点和受体位点进行预测。对独立测试集中的选择性供体位点和选择性受体位点的预测成功率分别为88.74%和90.86%,特异性分别为85.62%和81.19%。本文预测选择性剪切位点的方法成功率高于其它选择性剪切位点预测方法预测成功率,此预测方法进一步提高了对选择性剪切位点的理论预测能力。  相似文献   

10.
转录起始位点的计算定位是基因转录调控研究的重要内容,但现有方法的识别性能较低。文章作者在已有原核启动子识别算法的基础上,提出了一种基于滑动窗口的原核转录起始位点计算定位方法,通过在合理限定的定位范围内对序列进行滑动扫描,来预测转录起始位点的位置。首先根据窗口序列的交迭组分特征和启动子其它特征分别建立二次判别分类器,用其计算对应位置的似然得分,再利用转录起始位点与翻译起始位点的间隔经验分布信息对似然得分进行修正,最后依照似然得分的分布情况由阈值定位算法确定预测位置。对大肠杆菌真实序列数据的测试结果表明,该定位算法可实现对真实转录起始位点位置的有效预测,与已有算法相比,当敏感性指标同为0.85左右时,特异性指标可从0.20提高至0.65,从而使得定位准确率提高了约20个百分点。  相似文献   

11.
12.
13.
14.
15.
16.
17.
In this study, we established a single nucleotide mutation matrix (SNMM) model based on the relative binding affinities of NF-κB p50 homodimer to a wild-type binding site (GGGACTTTCC) and its all single-nucleotide mutants detected with the double-stranded DNA microarray. We evaluated this model by scoring different groups of 10-bp DNA sequences with this model and analyzing the correlations between the scores and the relative binding affinities detected with three wet experiments, including the electrophoresis mobility shift assay (EMSA), the protein-binding microarray (PBM) and the systematic evolution of ligands by exponential enrichment-sequencing (SELEX-Seq). The results revealed that the SNMM scores were strongly correlated with the detected binding affinities. We also scored the DNA sequences with other three models, including the principal coordinate (PC) model, the position weight matrix scoring algorithm (PWMSA) model and the Match model, and analyzed the correlations between the scores and the detected binding affinities. In comparison with these models, the SNMM model achieved reliable results. We finally determined 0.747 as the optimal threshold for predicting the NF-κB DNA-binding sites with the SNMM model. The SNMM model thus provides a new alternative model for scoring the relative binding affinities of NF-κB to the 10-bp DNA sequences and predicting the NF-κB DNA-binding sites.  相似文献   

18.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号