强化学习：原理与Python实战最新章节全文无弹窗在线阅读-QQ阅读女频仙侠网

书籍简介

本书从原理和实战两个方面介绍了强化学习。原理方面，深入介绍了主流强化学习理论和算法，覆盖资格迹等经典算法和MuZero等深度强化学习算法；实战方面，每章都配套了编程案例，以方便读者学习。全书从逻辑上分为三部分。第1章：从零开始介绍强化学习的背景知识，介绍环境库Gym的使用。第2～15章：基于折扣奖励离散时间Markov决策过程模型，介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理论，进而在理论的基础上讲解算法，并为算法提供配套代码实现。基础理论的讲解突出主干部分，算法讲解全面覆盖主流的强化学习算法，包括经典的非深度强化学习算法和近年流行的强化学习算法。Python实现和算法讲解一一对应，还给出了深度强化学习算法的TensorFlow和PyTorch对照实现。第16章：介绍其他强化学习模型，包括平均奖励模型、连续时间模型、非齐次模型、半Markov模型、部分可观测模型等，以便更好了解强化学习研究的全貌。

品牌：机械工业出版社

上架时间：2023-08-01 00:00:00

出版社：机械工业出版社

本书数字版权由机械工业出版社提供，并由其授权上海阅文信息技术有限公司制作发行

最新章节

肖智清

主页

会员
强化学习：原理与Python实现
全书分为三个部分。第一部分了解强化学习应用，了解强化学习基本知识，搭建强化学习测试环境。该部分包括：强化学习的概况、强化学习简单示例、强化学习算法的常见思想、强化学习的应用、强化学习测试环境的搭建。第二部分介绍强化学习理论与深度强化学习算法。强化学习理论部分：Markov决策过程的数学描述、MonteCarlo方法和时序差分方法的数学理论；深度强化学习算法部分：详细剖析全部具有重要影响力的深度强
肖智清程序设计12.2万字

强化学习：原理与Python实战

最新章节

强化学习：原理与Python实现

人，伦理，机器人：一本孩子写给孩子的书

制造业大模型的构建与实践

如何教人工智能说人话？

巧用ChatGPT快速搞定数据分析

AI短视频文案写作从入门到精通

Keras深度学习与神经网络

硅基物语·AI大爆炸：ChatGPT→AIGC→GPT-X→AGI进化→魔法时代→人类未来

AI原生应用开发：提示工程原理与实战

AI提示工程实战：从零开始利用提示工程学习应用大语言模型