江苏科技信息 ›› 2017, Vol. 34 ›› Issue (7): 53-54.doi: 10.3969/j.issn.1004-7530.2017.07.028

• 论文 • 上一篇    下一篇

基于粒子滤波的直接策略搜索强化学习算法研究

董春利, 王莉   

  1. 南京交通职业技术学院电子信息工程学院,江苏南京,211188
  • 出版日期:2017-03-05 发布日期:2017-03-05
  • 基金资助:
    南京交通职业技术学院高层次人才科研基金%项目(440105001)

Research on searching reinforcement learning algorithm with direct strategy based on particle filter

Dong Chunli, Wang Li   

  • Online:2017-03-05 Published:2017-03-05

摘要: 直接策略搜索强化学习算法的一个主要问题是只执行局部搜索,趋向于收敛到一些局部次优解,因此不能保证收敛到全局最优.文章提出的是一种直接政策搜索强化学习的全局搜索算法,不会陷入局部最优.实验结果表明了RLPF在策略空间探索的有效性,能够在策略空间直接进行全局搜索.

关键词: 强化学习, 粒子滤波, 局部搜索, 全局搜索