书目信息

书名: 基于Python的强化学习 
作者: 隆萨 著 ;刘继红 王瑞文
出版信息: 北京   中国电力出版社  2023.01
开本页数: 24cm  265页
丛书名:
单 册:
中图分类: TP312 TP312PY
科图分类:
主题词: 程序语言--程序设计
电子资源:
ISBN: 978-7-5198-7037-9
000 01330nam0 22002891 450
001 0122204644
005 20241022204644.0
010    @a978-7-5198-7037-9@dCNY88.00
100    @a20230227d2023 em y0chiy0121 ea
101 @achi@ceng
102    @aCN@b110000
105    @aa z 000yy
106    @ar
200 @a基于Python的强化学习@Aji yu python de qiang hua xue xi@f(美) 安德里亚·隆萨著@d= Reinforcement learning algorithms with python@fAndrea Lonza@g刘继红, 王瑞文译@zeng
210    @a北京@c中国电力出版社@d2023.01
215    @a265页@c图@d24cm
330    @a本书首先介绍在强化学习环境中工作所需的工具、库和设置, 涵盖了强化学习的构成模块, 深入探讨基于值的方法, 如Q-learning和SARSA算法的应用。读者将学习如何结合使用Q-learning和神经网络来解决复杂问题。此外, 在学习DDPG和TD3确定性算法之前, 读者将学习策略梯度方法, 如TRPO和PPO, 以提高性能和稳定性。本书还介绍模仿学习的原理, 以及Dagger如何教智能体飞行。读者将探索进化策略和黑盒优化技术。
500 10 @aReinforcement learning algorithms with python@mChinese
606 @a程序语言@x程序设计
610 @aPython
690    @aTP312@v5
690    @aTP312PY@v5
701  1 @a隆萨@Along sa@g(Lonza, Andrea)@4著
702  0 @a刘继红@Aliu ji hong@4译
702  0 @a王瑞文@Awang rui wen@4译
801  0 @aCN@b人天书店@c20230227
905    @aCKNYKJZYXY@b300712553-4@dTP312@e628@f2
    
    基于Python的强化学习/(美) 安德里亚·隆萨著= Reinforcement learning algorithms with python/Andrea Lonza/刘继红, 王瑞文译.-北京:中国电力出版社,2023.01
    265页:图;24cm
    
    
    ISBN 978-7-5198-7037-9:CNY88.00
    本书首先介绍在强化学习环境中工作所需的工具、库和设置, 涵盖了强化学习的构成模块, 深入探讨基于值的方法, 如Q-learning和SARSA算法的应用。读者将学习如何结合使用Q-learning和神经网络来解决复杂问题。此外, 在学习DDPG和TD3确定性算法之前, 读者将学习策略梯度方法, 如TRPO和PPO, 以提高性能和稳定性。本书还介绍模仿学习的原理, 以及Dagger如何教智能体飞行。读者将探索进化策略和黑盒优化技术。
相关链接 在五车中查询图书 在当当中查询图书 在豆瓣中查询图书


正题名:基于Python的强化学习     索取号:TP312/628         预约/预借

序号 登录号 条形码 馆藏地/架位号 状态 备注
1 712553   300712553   流通五库四楼/ [索取号:TP312/628] 在馆    
2 712554   300712554   流通五库四楼/ [索取号:TP312/628] 在馆