Invalid size!GDI+ 中发生一般性错误。书目详细信息

深度强化学习/(印)莫希特·塞瓦克(Mohit Sewak), 尹大伟，吴敏杰

作者(印)莫希特·塞瓦克(Mohit Sewak),尹大伟，吴敏杰
价格CNY89.00
出版者国防工业出版社
索书号TP181/3014
ISBN978-7-118-13179-6
分类号TP181
页数165页
出版日期20240101
出版地北京

附件:

设置1:塞瓦克

设置2:

设置3:本书主要内容包括：介绍了强化学习的基本概念，如智能体、环境、状态、奖励、动作等；介绍了强化学习的数学和算法原理，如马尔可夫决策过程和贝尔曼方程，并在此基础上讨论了动态规划、值迭代和策略迭代方法；介绍了强化学习的估计与控制问题，并通过实例展示了Q学习的编程；深入探讨了深度学习的概念、架构机制，通过介绍激活函数、损失函数、优化器、卷积层、池化层、全连接层等概念，为后续章节与强化学习算法相结合作铺垫。

附注提要

本书主要内容包括：介绍了强化学习的基本概念，如智能体、环境、状态、奖励、动作等；介绍了强化学习的数学和算法原理，如马尔可夫决策过程和贝尔曼方程，并在此基础上讨论了动态规划、值迭代和策略迭代方法；介绍了强化学习的估计与控制问题，并通过实例展示了Q学习的编程；深入探讨了深度学习的概念、架构机制，通过介绍激活函数、损失函数、优化器、卷积层、池化层、全连接层等概念，为后续章节与强化学习算法相结合作铺垫。

暂无目录

(0)|| (0)

手机二维条形码

二维条形码使用说明

馆藏信息

序号	索书号	码号定位	层架信息	馆藏地点	馆藏状态	借出日期	还回日期	卷册说明
1	TP181/3014	KT0891162	外借部33架B面3列3层	外借开架	入藏
2	TP181/3014	KT0891161		行政中心政务管理局清风书屋	入藏