首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 62 毫秒
1.
转录因子结合位点的计算预测是研究基因转录调控的重要环节,但常用的位置特异得分矩阵方法预测特异性偏低.通过深入分析结合位点的生物特征,提出了一种综合利用序列保守模体和局部构象信息的结合位点预测方法,以极大相关得分矩阵作为保守模体的描述模型,并根据二苷参数模型计算位点序列的局部构象,将两类信息得分组合为多维特征向量,在二次判别分析的框架下进行训练和滑动预测.预测过程中还引入了位置信息量以优化似然得分和过滤备选结果.针对大肠杆菌CRP和Fis结合位点数据的留一法测试结果表明,描述模型的改进和多种信息的融合能有效地改善预测方法的性能,大幅度提高特异性.  相似文献   

2.
三维图像的处理和操作需要将一般的断层序列插值成为具有各坐标轴一致的分辨率的体数据,而目前最常用的线性插值方法在层间距较大时会导致图像边缘模糊和出现伪影。Penney根据现有的非刚体匹配方法,提出了利用图像形变场数据的插值算法,大大提高了层间插值的质量。本文对Penney提出的算法进行了两方面的改进,在配准过程中用简单的单射性约束取代了复杂的平滑性约束,用邻域平均算法替代Penney使用的最邻近直线插值方法,并将新算法的实验结果与原算法、线性插值进行了对比,新算法在保持高质量插值的前提下提高了计算速度。该算法可以应用于精度要求比较高的体数据插值重建过程。  相似文献   

3.
非序列联配的序列分析方法,将序列中特定寡聚核苷酸的kmer统计频率作为特征,在序列间按特征进行比较和分析。这种方法综合考虑了所有变异类型对序列整体特征的影响,因而在组学数据分析上有独特的优势。但是,这类方法在复杂多细胞生物基因组系统发育中的适用性仍然有待检验。在本文中,我们使用基于非序列联配方法的CVTree软件,以45种哺乳动物的蛋白质组数据建立了系统发育关系NJ树,并据此探讨了哺乳动物系统发育的若干问题。在广受关注的真兽下纲四个总目的关系问题上,CVTree支持形态学的普遍结论即上兽类(Epitheria)假说。这与基于序列联配方法支持的外非洲胎盘类(Exafro-placentalia )假说不同。在哺乳动物内部目的层次上,CVTree树的结论与分子和形态所普遍接受的系统发育关系基本一致。但是在目的内部,CVTree树会有较多的差异。研究结果初步显示非序列联配方法在使用复杂多细胞生物的组学数据进行系统发育关系分析中的可行性。对非序列联配方法自身的改进及其与传统基于取代的序列联配方法之间的比较仍有待深入研究。  相似文献   

4.
基于氨基酸序列,用打分值、离散增量、自相关函数值和距离值来表示β-发夹模体信息,通过二次判别方法对上述信息进行融合,预测数据库ArchDB40和EVA中的β-发夹模体。文章使用的β-发夹模体包含的loop长为2~10个氨基酸,当序列模式长为17个氨基酸时,对两个数据库中β-发夹5交叉检验预测的总精度分别达到83.1%和80.7%,相关系数达到0.59和0.61,好于前人的预测结果。  相似文献   

5.
人类polⅡ启动子的识别   总被引:12,自引:2,他引:12  
依据基因启动子区和非启动子区碱基分布的特征,应用基于多样性增量的二次判别分析 (IDQD),对人类polⅡ启动子进行识别,识别精度达到90%以上的水平,优于其他已发表的 (包括SVM分类器等) 识别算法. 使用IDQD算法也能对转录起始位点 (TSS) 进行较准确的预测,10-fold交叉检验结果的敏感性和特异性分别为86%和91%. 这些结果表明IDQD是一个有效的分类器.  相似文献   

6.
刘佳  蔡禄  邢永强 《生物信息学》2010,8(4):341-343,346
蛋白质是一切生命活动的物质基础,研究蛋白质的相互作用有助于理解生物过程的分子机制,阐明疾病的分子机理。本文依据蛋白质序列组分特征,应用基于多样性增量的二次判别分析方法,对人类的1 963对蛋白质相互作用进行了预测。自洽检验的各项预测指标均在79%以上,且交叉检验的总精度也大于60%,表明本算法可以用于蛋白质相互作用预测。  相似文献   

7.
植物转录因子最新研究方法   总被引:1,自引:0,他引:1  
转录因子可以调控众多下游基因的表达,在植物的生长发育、代谢及对外界环境的反应中起着重要作用。我们结合近年来植物转录因子的研究进展,归纳分析了高等植物转录因子研究的主要策略和最新的技术方法,并从生物信息学分析、瞬间转化技术的应用、突变体表型分析及调控网络等几个方面进行了全面阐述,为植物转录因子的预测、功能鉴定及靶基因分析等相关研究提供理论和方法的参考。  相似文献   

8.
9.
多样性指标用于基因中剪切位点的识别   总被引:4,自引:0,他引:4  
根据基因剪切位点处的碱基保守性特征,和附近位点的碱基组成和关联特征,应用多样性指标和二次判别分析,对几类模式生物的基因结构进行统一的分析和预测,能够较好地识别外显子和内含子及其边界.计算结果表明,对于4类物种,线虫(C.elegans),拟南芥(A.thaliana), 果蝇(D.melanogaster)和人类(human),核苷酸水平的识别精度为92.5%~97.1%,外显子水平的识别敏感性为83.7%~94.5%,特异性为87.8%~97.1%.预测能力优于GeneSplicer等剪切位点检测软件.  相似文献   

10.
A query learning algorithm based on hidden Markov models (HMMs) isdeveloped to design experiments for string analysis and prediction of MHCclass I binding peptides. Query learning is introduced to aim at reducingthe number of peptide binding data for training of HMMs. A multiple numberof HMMs, which will collectively serve as a committee, are trained withbinding data and used for prediction in real-number values. The universeof peptides is randomly sampled and subjected to judgement by the HMMs.Peptides whose prediction is least consistent among committee HMMs aretested by experiment. By iterating the feedback cycle of computationalanalysis and experiment the most wanted information is effectivelyextracted. After 7 rounds of active learning with 181 peptides in all,predictive performance of the algorithm surpassed the so far bestperforming matrix based prediction. Moreover, by combining the bothmethods binder peptides (log Kd < -6) could be predicted with84% accuracy. Parameter distribution of the HMMs that can be inspectedvisually after training further offers a glimpse of dynamic specificity ofthe MHC molecules.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号