首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
基于已知的人类PolII启动子序列数据,综合选取启动子序列内容和序列信号特征,构建启动子的支持向量机分类器.分别以启动子序列的6-mer频数作为离散源参数构建序列内容特征。同时选取24个位点的3-mer频数作为序列信号特征构建PWM,将所得到的两类参数输入支持向量机对人类启动子进行预测.用10折叠交叉检验和独立数据集来衡量算法的预测能力,相关系数指标达到95%以上,结果显示结合了支持向量机的离散增量算法能够有效的提高预测成功率,是进行真核生物启动子预测的一种很有效的方法.  相似文献   

2.
杨科利  许强 《生物技术》2008,18(2):39-42
目的:改进真核生物启动子的理论预测方法。方法:基于启动子序列的信号特征和内容特征,构建6个标准离散源,计算每条序列相对于标准离散源的离散增量;构建信号特征的启动子位置权重矩阵,计算其对应位置的位置权重打分函数,将所得到的两类参数输入支持向量机对果蝇启动子进行预测。结果:利用self-consistency和cross-validation两种方法对此算法进行检验,均获得了较高的预测成功率,结果表明五种转录因子结合位点的预测成功率均超过91%。结论:结果显示结合了支持向量机的离散增量算法能够有效的提高预测成功率,是进行真核生物启动子预测的一种很有效的方法。  相似文献   

3.
利用支持向量机和马氏判别式预测人类polⅡ启动子   总被引:1,自引:0,他引:1  
林昊  杨科利 《生物信息学》2009,7(2):117-119,127
通过选取人类启动子与非启动子序列中不同的k-mer作为预测算法的基础特征,分别以三个区域(-249~-1;0~+50;-30~+30)的6-mer频数作为离散源参数构建离散增量,同时选取24个位点(-31~-21;-4-+2;+25-+29)的3-mer频数作为位置打分函数的参数,分别利用支持向量机和马氏判别式为判别函数对启动子进行预测。用10折叠交叉检验来衡量两种算法的预测能力,预测结果成功率分别达到87.0%和87.9%。对于独立检验集,敏感性分别为62.7%和76.0%,特异性分别为77.5%和66.8%。  相似文献   

4.
基于支持向量机和贝叶斯方法的蛋白质四级结构分类研究   总被引:6,自引:2,他引:4  
用支持向量机和贝叶斯两种方法对蛋白质四级结构进行分类研究。结果表明,基于支持向量机的分类结果最好,其l0CV检验的总分类精度、正样本正确预测率、Matthes相关系数和假阳性率分别为74.2%、84.6%、0.474、38.9%;基于贝叶斯的分类结果没有支持向量机的分类结果好,但其l0CV检验的假阳性率最低(15.9%).这些结果说明同源寡聚蛋白质一级序列包含四级结构信息,同时特征向量的确表示了埋藏在缔合亚基作用部位接触表面的基本信息。  相似文献   

5.
邹凌云  王正志  黄教民 《遗传学报》2007,34(12):1080-1087
蛋白质必须处于正确的亚细胞位置才能行使其功能。文章利用PSI-BLAST工具搜索蛋白质序列,提取位点特异性谱中的位点特异性得分矩阵作为蛋白质的一类特征,并计算4等分序列的氨基酸含量以及1~7阶二肽含量作为另外两类特征,由这三类特征一共得到蛋白质序列的12个特征向量。通过设计一个简单加权函数对各类特征向量加权处理,作为神经网络预测器的输入,并使用Levenberg-Marquardt算法代替传统的EBP算法来调整网络权值和阈值,大大提高了训练速度。对具有4类亚细胞位置和12类亚细胞位置的两种蛋白质数据集分别进行"留一法"测试和5倍交叉验证测试,总体预测精度分别达到88.4%和83.3%。其中,对4类亚细胞位置数据集的预测效果优于普通BP神经网络、隐马尔可夫模型、模糊K邻近等预测方法,对12类亚细胞位置数据集的预测效果优于支持向量机分类方法。最后还对三类特征采取不同加权比例对预测精度的影响进行了讨论,对选择的八种加权比例的预测结果表明,分别给予三类特征合适的权值系数可以进一步提高预测精度。  相似文献   

6.
一种基于特征筛选的原核生物启动子判别分析方法   总被引:3,自引:3,他引:0  
启动子识别是研究基因转录调控的重要环节,但目前方法的识别正确率偏低。在深入分析原核启动子特征的基础上,提出了一种基于特征筛选的原核启动子判别分析方法,首先在启动子序列的组成特征、信号特征和结构特征中选取备选特征,为每个特征建立适当的描述模型,并对主要的保守模式采用复合模式模型;再通过模型计算对备选特征进行逐步筛选,优化特征集,将序列表示为组合特征向量;最终利用二次判别分析实现识别。对大肠杆菌和枯草杆菌实际启动子数据进行的刀切法测试验证了方法的有效性和通用性。对于大肠杆菌非编码区(70启动子,识别的平均正确率达到了85.8%,优于其它几种典型识别方法;对于大肠杆菌编码区内部)70启动子和其它几种原核启动子,平均正确率也都超过了80%。方法框架还具有良好的可扩展性,能够方便地容纳新特征,使识别性能不断提高。  相似文献   

7.
基于蛋白质序列,提出了一种新的超二级结构模体β-发夹的预测方法。利用离散增量构成的向量来表示序列信息,并将6个离散增量输入支持向量机,在六维向量空间中寻找最优超平面,将β-发夹和非β-发夹进行分类。计算结果表明,利用所设计的算法预测β-发夹,有较高的预测能力。对于训练集,5-交叉检验的预测总精度为81.24%,相关系数为0.57,β-发夹敏感性为83.06%;对于独立的检验集,预测总精度为78.34%,相关系数0.56,β-发夹敏感性为77.24%。将此预测模型应用于CASP6的63个蛋白质进行检验,得到较好结果。  相似文献   

8.
许嘉 《生物信息学》2013,11(4):297-299
抗冻蛋白是一类具有提高生物抗冻能力的蛋白质。抗冻蛋白能够特异性的与冰晶相结合,进而阻止体液内冰核的形成与生长。因此,对抗冻蛋白的生物信息学研究对生物工程发展。提高作物抗冻性有重要的推动作用。本文采用由400条抗冻蛋白序列和400条非抗冻蛋白序列构成数据集,以伪氨基酸组分为特征,利用支持向量机分类算法预测抗冻蛋白,对训练集预测精度达到91.3%,对测试集预测精度达到78.8%。该结果证明伪氨基酸组分能够很好的反映抗冻蛋白特性,并能够用于预测抗冻蛋白。  相似文献   

9.
内源性转录终止子的计算预测是基因转录调控研究的重要内容,但当前方法的预测特异性偏低.在深入分析大肠杆菌内源性终止子中RNA发夹结构和多聚胸腺嘧啶区域等特征信号的基础上,为内源性终止子建立了一个由5个特征变量组成的包含序列组分、局部构象和能量分布信息的特征集,并根据此特征集实现了一种基于支持向量机的内源性终止子计算预测方法.针对大肠杆菌内源性终止子数据集和编码区阴性对照集的六重交叉验证测试证实了预测方法的有效性,对已知数据的预测平均正确率达到了99.4%.在对大肠杆菌全基因组限定范围内的搜索中,该预测方法可以成功地识别出绝大多数已知内源性终止子,与其他几种常用方法相比,预测结果总数大幅度减少,预测的特异性有了明显提高.  相似文献   

10.
基于模糊支持向量机的膜蛋白折叠类型预测   总被引:1,自引:0,他引:1  
现有的基于支持向量机(support vector machine,SVM)来预测膜蛋白折叠类型的方法.利用的蛋白质序列特征并不充分.并且在处理多类蛋白质分类问题时存在不可分区域,针对这两类问题.提取蛋白质序列的氨基酸和二肽组成特征,并计算加权的多阶氨基酸残基指数相关系数特征,将3类特征融和作为分类器的输入特征矢量.并采用模糊SVM(fuzzy SVM,FSVM)算法解决对传统SVM不可分数据的分类.在无冗余的数据集上测试结果显示.改进的特征提取方法在相同分类算法下预测性能优于已有的特征提取方法:FSVM在相同特征提取方法下性能优于传统的SVM.二者相结合的分类策略在独立性数据集测试下的预测精度达到96.6%.优于现有的多种预测方法.能够作为预测膜蛋白和其它蛋白质折叠类型的有效工具.  相似文献   

11.
12.
13.
14.
For a plant selection model with frequency-independent viabilities, fertilities and selfing rates, it is shown that apart from global fixation, for certain parameter combinations a protected polymorphism and facultative fixation (either allele may become fixed according to initial frequencies) may both occur. Facultative fixation requires different selling rates for the dominant and recessive type. Protection of the polymorphism requires resource allocation for male and female function. In this connection the problem of purely genetically caused population extinction is discussed.
For general frequency dependence and regular segregation, the chances for establishment of a completely recessive gene are compared to those of a completely dominant gene. It is proven that the process of establishment of the recessive gene, despite a fitness advantage, may be considerably endangered by drift effects if random mating prevails. The recessive gene may reach the same effectivity in establishment as a dominant gene, only if the recessive homozygote mates exclusively with its own type during the period of establishment.  相似文献   

15.
16.
17.
杆状病毒是一类感染节肢动物的病原微生物,其基因组为双链环状DNA,大小为80~180kb.  相似文献   

18.
Zhang  Qingmeng  Ahmed  Niaz  Gao  George F.  Zhang  Fengmin 《中国病毒学》2020,35(6):868-874
In this article, we systematically review Dr. Wu Lien-Teh's academic achievements and outstanding contributions in the prevention and control of the plague epidemic in northeast China and introduce the development of the earliest public health epidemic prevention system in China in order to commemorate the 140th anniversary of Dr. Wu Lien-Teh's birth. We hope that this article will provide insights into the effective prevention and control of emerging infectious diseases as well as the current worldwide pandemic of COVID-19, facilitating the improvement and development of public health systems in China and around the globe.  相似文献   

19.
20.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号