应用基于粒子群优化的支持向量机算法识别真核生物基因的RNA聚合酶II启动子序列 |
| |
引用本文: | 张文,骈聪,陈园园,张瑾,李琴,张良云.应用基于粒子群优化的支持向量机算法识别真核生物基因的RNA聚合酶II启动子序列[J].生物物理学报,2015(2):143-153. |
| |
作者姓名: | 张文 骈聪 陈园园 张瑾 李琴 张良云 |
| |
作者单位: | 南京农业大学理学院 |
| |
基金项目: | 国家自然科学基金项目(11401311);江苏省自然科学基金项目(BK20141358)~~ |
| |
摘 要: | 启动子是调节基因表达的重要元件,对其的研究对于阐明基因转录调控机制具有重要意义。作者依据RNA聚合酶Ⅱ启动子序列特性选取高效的特征提取方法,构建了基于粒子群优化的支持向量机(particle swarm optimization-support vector machine,PSO-SVM)新方法,用以识别真核生物基因RNA聚合酶Ⅱ启动子。结合5-折交叉检验方法,得到启动子-外显子、启动子-内含子和启动子-基因间序列的分类准确率分别为97.1%、96.7%和98.8%,其马修斯相关系数分别为0.962、0.934和0.976。结果说明,对比其它启动子识别方法,PSO-SVM方法更能有效地识别真核生物基因启动子。
|
关 键 词: | 位置关联权重矩阵 粒子群优化 支持向量机 随机森林 极限学习机 启动子识别 |
本文献已被 CNKI 等数据库收录! |
|