多巴胺信号表征奖赏预测误差的理论起源和进展 |
| |
引用本文: | 刘文卿,许淑媛,程强强,吴美霖,魏春玲,孙宗鹏,韩静,任维.多巴胺信号表征奖赏预测误差的理论起源和进展[J].生命科学,2024(2):143-150. |
| |
作者姓名: | 刘文卿 许淑媛 程强强 吴美霖 魏春玲 孙宗鹏 韩静 任维 |
| |
作者单位: | 1. 陕西师范大学现代教学技术教育部重点实验室;2. 陕西师范大学心理学院;3. 陕西师范大学教育学部 |
| |
基金项目: | 现代教学技术教育部重点实验室开放基金项目(GK202205019);;中央高校基本科研业务费专项资金; |
| |
摘 要: | 学会寻求自然奖赏对人和高等动物的生存和繁衍极为重要。脑内多巴胺能神经元活动在处理奖赏信息时发生具有表征意义的增强,产生多巴胺信号。人们相继提出快感、激励显著性、奖赏预测误差等一系列假说,日益精确地揭示了多巴胺信号所表征的意义内涵。这一进展历程对神经科学、心理学和人工智能研究具有深刻启迪,其成果更具有基础性的科学价值。本文简要回顾这些假说的发展历程,介绍奖赏预测误差假说如何继承多学科成果并相对准确地揭示多巴胺信号的重要功能,分析部分最新成果对奖赏预测误差假说的充实和扩展,并初步展望该领域进一步发展的可能方向。
|
关 键 词: | 奖赏 惩罚 奖赏预测误差 多巴胺 强化学习 |
|
|