000
|
01330nam0 22002891 450
|
001
|
0122204644
|
005
|
20241022204644.0
|
010
|
|
@a978-7-5198-7037-9@dCNY88.00
|
100
|
|
@a20230227d2023 em y0chiy0121 ea
|
101
|
1
|
@achi@ceng
|
102
|
|
@aCN@b110000
|
105
|
|
@aa z 000yy
|
106
|
|
@ar
|
200
|
1
|
@a基于Python的强化学习@Aji yu python de qiang hua xue xi@f(美) 安德里亚·隆萨著@d= Reinforcement learning algorithms with python@fAndrea Lonza@g刘继红, 王瑞文译@zeng
|
210
|
|
@a北京@c中国电力出版社@d2023.01
|
215
|
|
@a265页@c图@d24cm
|
330
|
|
@a本书首先介绍在强化学习环境中工作所需的工具、库和设置, 涵盖了强化学习的构成模块, 深入探讨基于值的方法, 如Q-learning和SARSA算法的应用。读者将学习如何结合使用Q-learning和神经网络来解决复杂问题。此外, 在学习DDPG和TD3确定性算法之前, 读者将学习策略梯度方法, 如TRPO和PPO, 以提高性能和稳定性。本书还介绍模仿学习的原理, 以及Dagger如何教智能体飞行。读者将探索进化策略和黑盒优化技术。
|
500
|
10
|
@aReinforcement learning algorithms with python@mChinese
|
606
|
0
|
@a程序语言@x程序设计
|
610
|
0
|
@aPython
|
690
|
|
@aTP312@v5
|
690
|
|
@aTP312PY@v5
|
701
|
1
|
@a隆萨@Along sa@g(Lonza, Andrea)@4著
|
702
|
0
|
@a刘继红@Aliu ji hong@4译
|
702
|
0
|
@a王瑞文@Awang rui wen@4译
|
801
|
0
|
@aCN@b人天书店@c20230227
|
905
|
|
@aCKNYKJZYXY@b300712553-4@dTP312@e628@f2
|
|
|
|
|
基于Python的强化学习/(美) 安德里亚·隆萨著= Reinforcement learning algorithms with python/Andrea Lonza/刘继红, 王瑞文译.-北京:中国电力出版社,2023.01 |
265页:图;24cm |
|
|
ISBN 978-7-5198-7037-9:CNY88.00 |
本书首先介绍在强化学习环境中工作所需的工具、库和设置, 涵盖了强化学习的构成模块, 深入探讨基于值的方法, 如Q-learning和SARSA算法的应用。读者将学习如何结合使用Q-learning和神经网络来解决复杂问题。此外, 在学习DDPG和TD3确定性算法之前, 读者将学习策略梯度方法, 如TRPO和PPO, 以提高性能和稳定性。本书还介绍模仿学习的原理, 以及Dagger如何教智能体飞行。读者将探索进化策略和黑盒优化技术。 |
● |
正题名:基于Python的强化学习
索取号:TP312/628
 
预约/预借
序号
|
登录号
|
条形码
|
馆藏地/架位号
|
状态
|
备注
|
1
|
712553
|
300712553
|
流通五库四楼/
[索取号:TP312/628]
|
在馆
|
|
2
|
712554
|
300712554
|
流通五库四楼/
[索取号:TP312/628]
|
在馆
|
|