期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

杜耀华倪青山王正志《生命科学研究》2005,9(4):319-326

启动子预测是研究基因转录调控的重要环节,但现有算法的预测正确率偏低．在深入分析启动子生物特征的基础上,提出了一种基于支持向量机的枯草杆菌启动子预测算法,在启动子序列的组成特征、信号特征和结构特征中选取9种典型特征作为预测的依据,对于信号特征,除了利用保守模式的一致序列,还考虑了间隔距离的分布信息．首先通过特征描述模型分别计算每种特征在启动子序列和非启动子序列中的得分,将特征得分组合成9维特征向量,再利用支持向量机在特征向量集上进行训练和判别．对实际数据集进行的刀切法测试验证了算法的有效性．对σ启动予的预测,平均正确率达到了90．7％;对几种其它σ因子启动子的预测,平均正确率也超过了80％．算法不但有广泛的适用性,还有良好的可扩展性,能够方便的容纳新特征,使识别性能不断提高．相似文献

2.

一种有效的重复序列识别算法 总被引：1，自引：0，他引：1

李冬冬王正志倪青山《生物信息学》2005,3(4):163-166,174

重复序列的分析是基因组研究中的一个重要课题,进行这一研究的基础则是从基因组序列中快速有效地找出其中的重复序列。一种投影拼接算法,即利用随机投影获得候选片断集合,利用片断拼接对候选片断进行拼接,以发现基因组中的重复序列。分析了算法的计算复杂度,构造了半仿真测试数据,对算法的测试结果表明了其有效性。相似文献

3.

基于滑动窗口的原核转录起始位点计算定位方法

杜耀华王正志倪青山《生物物理学报》2006,22(5):360-366

转录起始位点的计算定位是基因转录调控研究的重要内容,但现有方法的识别性能较低。文章作者在已有原核启动子识别算法的基础上,提出了一种基于滑动窗口的原核转录起始位点计算定位方法,通过在合理限定的定位范围内对序列进行滑动扫描,来预测转录起始位点的位置。首先根据窗口序列的交迭组分特征和启动子其它特征分别建立二次判别分类器,用其计算对应位置的似然得分,再利用转录起始位点与翻译起始位点的间隔经验分布信息对似然得分进行修正,最后依照似然得分的分布情况由阈值定位算法确定预测位置。对大肠杆菌真实序列数据的测试结果表明,该定位算法可实现对真实转录起始位点位置的有效预测,与已有算法相比,当敏感性指标同为0.85左右时,特异性指标可从0.20提高至0.65,从而使得定位准确率提高了约20个百分点。相似文献

4.

利用序列保守模体和局部构象信息预测转录因子结合位点

杜耀华倪青山王正志《生命科学研究》2006,10(3):215-223

转录因子结合位点的计算预测是研究基因转录调控的重要环节,但常用的位置特异得分矩阵方法预测特异性偏低.通过深入分析结合位点的生物特征,提出了一种综合利用序列保守模体和局部构象信息的结合位点预测方法,以极大相关得分矩阵作为保守模体的描述模型,并根据二苷参数模型计算位点序列的局部构象,将两类信息得分组合为多维特征向量,在二次判别分析的框架下进行训练和滑动预测.预测过程中还引入了位置信息量以优化似然得分和过滤备选结果.针对大肠杆菌CRP和Fis结合位点数据的留一法测试结果表明,描述模型的改进和多种信息的融合能有效地改善预测方法的性能,大幅度提高特异性. 相似文献

5.

一种基于预测搜索的基因芯片优化方法 总被引：1，自引：1，他引：0

倪青山王正志李冬冬《生物信息学》2004,2(3):27-30

掩模板在高密度基因芯片的探针合成过程中起着重要的作用 ,由于其制造工艺复杂、造价较高 ,因此在不改变探针合成结果的条件下 ,需要尽可能的减少基因芯片探针合成过程中所用的掩模板数量。提出了一种新的预测搜索算法 ,对掩模板进行了优化设计 ,对设计结果的测试显示 ,其减少的掩模板数量超过了传统方法的 2 0 % ,表明了该算法的有效性相似文献

6.

基因表达芯片探针选择的一种有效方法 总被引：1，自引：0，他引：1

倪青山王正志李冬冬《生命科学研究》2004,8(4):371-376

为了减少基因表达芯片探针选择的计算量,采用最大共有序列准则大大减少了需要计算的候选探针数量,并通过不断扩大进行计算的探针数目保证探针选择的效果．结果表明该方法是十分有效的,探针选择的结果也是令人满意的．相似文献

7.

基于贝叶斯网络和相互作用可信度的蛋白质功能预测方法

倪青山王正志王广云张纪阳《激光生物学报》2009,18(3):395-400

蛋白质功能注释是后基因组时代研究的核心内容之一,基于蛋白质相互作用网络的蛋白质功能预测方法越来越受到研究者们的关注.提出了一种基于贝叶斯网络和蛋白质相互作用可信度的蛋白质功能预测方法.该方法在功能预测过程中为待注释的蛋白质建立贝叶斯网络预测模型,并充分考虑了蛋白质相互作用的可信度问题.在构建的芽殖酵母数据集上的三重交叉验证测试表明,在功能预测过程中考虑蛋白质可信度能够有效地提高功能预测的性能.与现有一些算法相比,该方法能够给出令人满意的预测效果. 相似文献

8.

基于物理化学性质优化的蛋白质相互作用预测研究

倪青山王正志赵英杰黎刚果《生命科学研究》2009,13(3):204-208

蛋白质相互作用预测是生物信息学研究的重要问题之一,提出了一种基于物理化学性质优化的蛋白质相互作用预测方法,与现有方法的显著不同就是,并未使用已知的氨基酸残基的物理化学性质,而是通过粒子群算法优化得到有益于相互作用预测的物理化学性质数值.对真实的数据集测试表明,优化得到的物理化学性质比现有的物理化学性质更有益于提高蛋白质相互作用的预测性能,与其它方法相比,也具有一定的优势,说明该方法是一种有效的蛋白质相互作用预测方法. 相似文献

9.

一种基于特征筛选的原核生物启动子判别分析方法 总被引：3，自引：3，他引：0

杜耀华王正志倪青山李冬冬《生物物理学报》2006,22(1):39-48

启动子识别是研究基因转录调控的重要环节,但目前方法的识别正确率偏低。在深入分析原核启动子特征的基础上,提出了一种基于特征筛选的原核启动子判别分析方法,首先在启动子序列的组成特征、信号特征和结构特征中选取备选特征,为每个特征建立适当的描述模型,并对主要的保守模式采用复合模式模型;再通过模型计算对备选特征进行逐步筛选,优化特征集,将序列表示为组合特征向量;最终利用二次判别分析实现识别。对大肠杆菌和枯草杆菌实际启动子数据进行的刀切法测试验证了方法的有效性和通用性。对于大肠杆菌非编码区(70启动子,识别的平均正确率达到了85.8%,优于其它几种典型识别方法;对于大肠杆菌编码区内部)70启动子和其它几种原核启动子,平均正确率也都超过了80%。方法框架还具有良好的可扩展性,能够方便地容纳新特征,使识别性能不断提高。相似文献

10.

利用蛋白质相互作用关系改善基因芯片缺失数据估计的精度

倪青山王广云邱浪波强波王正志《生命科学研究》2008,12(2)

针对基因芯片数据缺失问题,利用蛋白质相互作用关系与基因表达的内在联系,提出了一种利用蛋白质相互作用信息提高基因芯片缺失数据估计精度的方法.将蛋白质间的相互作用关系与基因表达数据间的距离相结合来计算基因间的表达相似度,根据这个新的相似性度量标准为含有缺失数据的基因选择更为合适的用于估计缺失值的基因集合.将新的相似性度量标准与传统的KNNimpute、 LLSimpute方法相结合,描述了对应的改进算法PPI-KNNimpute、 PPI-LLSimpute.对真实的数据集测试表明,蛋白质相互作用信息能有效改善基因缺失数据估计的精度. 相似文献