妙思文献管理集成系统WWW检索

书目信息

表格格式
工作单格式
卡片格式

书名：	基于Python的强化学习
作者：	隆萨著；刘继红，王瑞文译
出版信息：	北京中国电力出版社 2023.01
开本页数：	24cm 265页
丛书名：
单册：
中图分类：	TP312 ， TP312PY
科图分类：
主题词：	程序语言--程序设计
电子资源：
ISBN：	978-7-5198-7037-9

000	01330nam0 22002891 450
001	0122204644
005	20241022204644.0
010		@a978-7-5198-7037-9@dCNY88.00
100		@a20230227d2023 em y0chiy0121 ea
101	1	@achi@ceng
102		@aCN@b110000
105		@aa z 000yy
106		@ar
200	1	@a基于Python的强化学习@Aji yu python de qiang hua xue xi@f(美) 安德里亚·隆萨著@d= Reinforcement learning algorithms with python@fAndrea Lonza@g刘继红, 王瑞文译@zeng
210		@a北京@c中国电力出版社@d2023.01
215		@a265页@c图@d24cm
330		@a本书首先介绍在强化学习环境中工作所需的工具、库和设置, 涵盖了强化学习的构成模块, 深入探讨基于值的方法, 如Q-learning和SARSA算法的应用。读者将学习如何结合使用Q-learning和神经网络来解决复杂问题。此外, 在学习DDPG和TD3确定性算法之前, 读者将学习策略梯度方法, 如TRPO和PPO, 以提高性能和稳定性。本书还介绍模仿学习的原理, 以及Dagger如何教智能体飞行。读者将探索进化策略和黑盒优化技术。
500	10	@aReinforcement learning algorithms with python@mChinese
606	0	@a程序语言@x程序设计
610	0	@aPython
690		@aTP312@v5
690		@aTP312PY@v5
701	1	@a隆萨@Along sa@g(Lonza, Andrea)@4著
702	0	@a刘继红@Aliu ji hong@4译
702	0	@a王瑞文@Awang rui wen@4译
801	0	@aCN@b人天书店@c20230227
905		@aCKNYKJZYXY@b300712553-4@dTP312@e628@f2

基于Python的强化学习/(美) 安德里亚·隆萨著= Reinforcement learning algorithms with python/Andrea Lonza/刘继红, 王瑞文译.-北京：中国电力出版社，2023.01

265页：图；24cm

ISBN 978-7-5198-7037-9：CNY88.00

本书首先介绍在强化学习环境中工作所需的工具、库和设置, 涵盖了强化学习的构成模块, 深入探讨基于值的方法, 如Q-learning和SARSA算法的应用。读者将学习如何结合使用Q-learning和神经网络来解决复杂问题。此外, 在学习DDPG和TD3确定性算法之前, 读者将学习策略梯度方法, 如TRPO和PPO, 以提高性能和稳定性。本书还介绍模仿学习的原理, 以及Dagger如何教智能体飞行。读者将探索进化策略和黑盒优化技术。

●

序号	登录号	条形码	馆藏地/架位号	状态	备注
1	712553	300712553	流通五库四楼/ [索取号:TP312/628]	在馆
2	712554	300712554	流通五库四楼/ [索取号:TP312/628]	在馆