蛋白质相互作用信息的文本挖掘研究进展 |
| |
引用本文: | 李满生,刘齐军,李栋,刘培磊,朱云平.蛋白质相互作用信息的文本挖掘研究进展[J].中国科学:生命科学,2010,40(9):805-819. |
| |
作者姓名: | 李满生 刘齐军 李栋 刘培磊 朱云平 |
| |
作者单位: | 军事医学科学院放射与辐射医学研究所北京蛋白质组研究中心, 蛋白质组学国家重点实验室, 北京 102206;
国防科学技术大学计算机学院, 长沙 410073 |
| |
基金项目: | 国家重点基础研究发展计划(批准号: 2006CB910803, 2006CB910706和2010CB912700)、国家高技术研究发展计划(批准号: 2006AA02A312)、国家重大科学研究计划(批准号: 2008ZX10002-016和2009ZX09301-002)、国家自然科学基金(批准号: 30800200)和蛋白质组学国家重点实验室课题(批准号: SKLP-Y200811和SKLP-O200811)资助项目 |
| |
摘 要: | 蛋白质相互作用是生命活动中一种极其重要的生物分子关系, 对此领域的研究不仅具有理论意义, 还具有较强的应用价值. 近年来, 随着研究的深入, 各种蛋白质相互作用的生物医学文献激增, 挖掘其中的蛋白质相互作用关系成为人们面临的一大挑战. 当前, 已提出了多种文本挖掘方法, 对分散于生物医学文献中的蛋白质相互作用信息进行结构化或半结构化处理. 对这些工作进行分析, 总结出基于生物文本挖掘蛋白质相互作用信息的一般流程, 从蛋白质命名实体的识别、蛋白质相互作用关系的提取和蛋白质相互作用注释信息的提取3个子任务进行阐述, 同时介绍了生物文本挖掘领域的评测会议和一些挖掘蛋白质相互作用相关信息的工具. 最后, 对该领域存在的一些重要问题进行分析, 并预测了未来可能的发展方向, 以期对该领域相关研究提供一定的参考.
|
关 键 词: | 蛋白质相互作用 文本挖掘 命名实体识别 关系提取 注释信息提取 |
|
| 点击此处可从《中国科学:生命科学》浏览原始摘要信息 |
| 点击此处可从《中国科学:生命科学》下载免费的PDF全文 |
|