关于人工智能:强化学习算法

41次阅读

共计 299 个字符，预计需要花费 1 分钟才能阅读完成。

在强化学习根底文章中咱们提到动静布局办法。动静布局作为一种 model-based 的办法，应用场景具备十分的局限性。本文将从理论利用角度登程，介绍并比照几种 model-free 的办法。

算法包含：

model-free VS model-based
- 动静布局 DP
- 蒙特卡洛 MC
Value-based 类
- 蒙特卡洛 MC
- 时序差分 TD：SARSA
- 时序差分 TD：Q-Learning
- Deep Q-learning
- Nature DQN
- Double DQN
- Prioritized DQN
- Dueling DQN
Policy Gradient
- reinforce
Policy Gradient + Value-based
- Actor-Critic

正文完

发表至：人工智能

2020-10-25

0

关于人工智能:从复杂路况角度浅析自动驾驶的智能化表现丨曼孚科技

关于人工智能:三分钟走近AI｜网购转人工就一定是人工客服吗

关于人工智能:RPA界面元素智能自适应定位与操控技术

关于人工智能:20-行代码带你快速构建基础文本搜索引擎

关于java-ee:小程序商城Mall打造最佳SpringCloudAlibaba最佳实践

关于javascript:ES7二-pow