题名:
|
强化学习 [ 专著] qiang hua xue xi / 肖智清著 , |
ISBN:
|
978-7-111-72891-7 价格: CNY129.00 |
语种:
|
chi |
载体形态:
|
13,490页 图 24cm |
出版发行:
|
出版地: 北京 出版社: 机械工业出版社 出版日期: 2023 |
内容提要:
|
本书介绍强化学习理论及其Python实现。第1章:从零开始介绍强化学习的背景知识,介绍环境库Gym的使用。第2-15章:基于折扣奖励离散时间Markov决策过程模型,介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理论,进而在理论的基础上讲解算法,并为算法提供配套代码实现。基础理论的讲解突出主干部分,算法讲解全面覆盖主流的强化学习算法,包括经典的非深度强化学习算法和近年流行的强化学习算法。Python实现和算法讲解一一对应,针对深度强化学习算法还给出了基于TensorFlow2和PyTorch1的对照实现。第16章:介绍其他强化学习模型,包括平均奖励模型、连续时间模型、非齐次模型,半Markov模型、部分可观测模型等,以便更好了解强化学习研究的全貌。 |
主题词:
|
程序语言 程序设计 |
中图分类法:
|
TP312PY 版次: 5 |
主要责任者:
|
肖智清 xiao zhi qing 著 |