摘 要: | 启动子是调节基因表达的重要元件,对其的研究对于阐明基因转录调控机制具有重要意义。作者依据RNA聚合酶Ⅱ启动子序列特性选取高效的特征提取方法,构建了基于粒子群优化的支持向量机(particle swarm optimization-support vector machine,PSO-SVM)新方法,用以识别真核生物基因RNA聚合酶Ⅱ启动子。结合5-折交叉检验方法,得到启动子-外显子、启动子-内含子和启动子-基因间序列的分类准确率分别为97.1%、96.7%和98.8%,其马修斯相关系数分别为0.962、0.934和0.976。结果说明,对比其它启动子识别方法,PSO-SVM方法更能有效地识别真核生物基因启动子。
|