题名:	Python深度强化学习入门 [ 专著] Python shen du qiang hua xue xi ru men / (日)伊藤多一[等]著 , 王卫兵，杨秋香等译
ISBN:	978-7-111-70072-2 价格： CNY89.00
语种:	chi
载体形态:	11,239页图 24cm
出版发行:	出版地：北京出版社：机械工业出版社出版日期： 2022.4
内容提要:	本书共7章。第1章介绍了机器学习的分类、强化学习的学习机制以及深度强化学习的概念；第2章通过强化学习的基本概念、马尔可夫决策过程和贝尔曼方程、贝尔曼方程的求解方法、无模型控制等介绍了强化学习的基本算法；第3章通过深度学习、卷积神经网络（CNN)、循环神经网络（RNN)介绍了强化学习中深度学习的特征提取方法；第4章通过行动价值函数的网络表示、策略函数的网络表示介绍了深度强化学习的实现；第5章通过策略梯度法的连续控制、学习算法和策略模型等，详细介绍了深度强化学习在连续控制问题中的应用及具体实现；第6章通过巡回推销员问题和魔方问题详细介绍了深度强化学习在组合优化中的应用及具体实现；第7章通过SeqGAN的文本生成和神经网络架构的搜索详细介绍了深度强化学习在时间序列数据生成的应用。在附录中还给出了Colaboratory和Docker等深度强化学习开发环境的构建。
主题词:	软件工具程序设计
中图分类法:	TP311.5 版次： 5
其它题名:	强化学习和深度学习的搜索与控制
主要责任者:	伊藤多一 yi teng duo yi 著
主要责任者:	今津义充 jin jin yi chong 著
主要责任者:	须藤广大 xu teng guang da 著
次要责任者:	王卫兵 wang wei bing 译
次要责任者:	杨秋香 yang qiu xiang 译
责任者附注:	伊藤多一，1995年在名古屋大学理学研究所完成博士课程，并获得博士学位。今津义充，博士学位 (理学)，熟悉统计分析、模型构建以及基于数值分析的基本粒子和核物理研究。自2013年以来，领导了BrainPad公司的定量分析项目，例如需求预测和数学优化等。近年来，一直从事利用深度学习技术的项目分析和应用研究。须藤广大，在奈良科学技术学院主修自然语言处理，获得硕士学位 (信息工程)。后以新毕业生的身份加入BrainPad公司，并以机器学习工程师的身份从事与深度学习相关的项目分析和开发。
索书号:	1