强化学习:原理与Python实战在线阅读
会员

强化学习:原理与Python实战

肖智清
开会员,本书免费读 >

计算机网络人工智能17.2万字

更新时间:2023-10-19 17:44:38 最新章节:封底

立即阅读
加书架
下载
听书

书籍简介

本书从原理和实战两个方面介绍了强化学习。原理方面,深入介绍了主流强化学习理论和算法,覆盖资格迹等经典算法和MuZero等深度强化学习算法;实战方面,每章都配套了编程案例,以方便读者学习。全书从逻辑上分为三部分。第1章:从零开始介绍强化学习的背景知识,介绍环境库Gym的使用。第2~15章:基于折扣奖励离散时间Markov决策过程模型,介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理论,进而在理论的基础上讲解算法,并为算法提供配套代码实现。基础理论的讲解突出主干部分,算法讲解全面覆盖主流的强化学习算法,包括经典的非深度强化学习算法和近年流行的强化学习算法。Python实现和算法讲解一一对应,还给出了深度强化学习算法的TensorFlow和PyTorch对照实现。第16章:介绍其他强化学习模型,包括平均奖励模型、连续时间模型、非齐次模型、半Markov模型、部分可观测模型等,以便更好了解强化学习研究的全貌。
品牌:机械工业出版社
上架时间:2023-08-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

肖智清
主页
  • 会员
    全书分为三个部分。第一部分了解强化学习应用,了解强化学习基本知识,搭建强化学习测试环境。该部分包括:强化学习的概况、强化学习简单示例、强化学习算法的常见思想、强化学习的应用、强化学习测试环境的搭建。第二部分介绍强化学习理论与深度强化学习算法。强化学习理论部分:Markov决策过程的数学描述、MonteCarlo方法和时序差分方法的数学理论;深度强化学习算法部分:详细剖析全部具有重要影响力的深度强
    肖智清程序设计12.2万字

最新上架

  • 会员
    本书围绕“公平、隐私与保障、可靠与安全、包容、负责、透明”六个人工智能需要遵循的原则,诠释当代青少年对负责任的人工智能的认识和思考。
    王岭主编计算机7.1万字
  • 本书分两篇,为读者提供基于制造业视角的大模型理论与应用指南。基础篇深入大模型理论层面,主要介绍大模型的基础知识、构建路径、价值对齐策略,同时涉及多模态与AIGC技术、提示词工程的相关知识。应用篇则聚焦于大模型的实践应用层面,主要讲解垂直制造领域微调、RAG等构建技术,AIAgent的原理与应用,以及大模型压缩与部署策略,并且通过具体案例来展示大模型在工业制造及设备运维等方面的应用,最后对大模型进行
    郭秉义计算机18.3万字
  • 会员
    AI的本质是什么?自然语言和人工语言的区别在哪里?ChatGPT究竟是人工智能发展道路上的里程碑,还是某种误入歧途的“假AI”?我们不许诺美丽空洞的AI前景,而是告诉读者,未来的AI之路到底有多少激流险滩——对于统计学工具与硬件升级的片面崇拜,对于智能科学基本原理的蔑视,是目前AI研究的大危机。在我们看来,万众期待的ChatGPT,只是新时代的“牛顿炼金术”。
    徐英瑾计算机17.8万字
  • 会员
    本书共分为8章,涵盖了从数据分析基础知识、常见的统计学方法到使用ChatGPT进行数据准备、数据清洗、数据特征提取、数据可视化、回归分析与预测建模、分类与聚类分析,以及深度学习和大数据分析等全面的内容。
    朱宁计算机10.7万字
  • 会员
    本书共分为10章。第1章介绍短视频文案与AIGC;第2章为AIGC工具助力文案选题策划;第3章为短视频标题撰写与优化;第4章为短视频脚本与情节设计;第5章为短视频带货文案写作;第6章为评论区互动文案写作;第7章为段子文案写作;第8章为短视频内容标签化;第9章为短视频营销文案写作;第10章为短视频与AI的有机结合。
    邵诗雨编著计算机8.8万字
  • 会员
    本书从人工智能导论入手,阐述人工智能的发展及现状,重点介绍了机器学习和神经网络基础、反向传播原理、卷积神经网络和循环神经网络等内容。本书内容由浅入深,循序渐进,从神经元和感知机入手,逐步讲解深度学习中神经网络基础、反向传播以及更深层次的卷积神经网络、循环神经网络。本书知识体系完整,内容覆盖面广,介绍了深度学习中常用的模型和算法,助力读者多方位掌握深度学习的相关知识。本书可作为高等院校计算机等相关专
    肖睿 程鸣萱编著计算机11万字
  • 会员
    本书以第一人称视角,讲述AI的来龙去脉,表达AI的技术原理。从历史到未来,跨越百年时空;从理论到实践,解读AI大爆炸;从技术到哲学,穿越多个维度;从语言到绘画,落地实战演练。ChatGPT的诞生,引发了奇点降临,点亮了AGI(通用人工智能),并涉及大模型、深度神经网络、Transformer、AIGC、涌现效应等一系列技术前沿。
    量子学派@ChatGPT计算机8.6万字
  • 会员
    本书结合AI原生应用落地的大量实践,系统讲解提示工程的核心原理、相关案例分析和实战应用,涵盖提示工程概述、结构化提示设计、NLP任务提示、内容创作提示、生成可控性提示、提示安全设计、形式语言风格提示、推理提示和智能体提示等内容。本书的初衷不是告诉读者如何套用各种预设的提示模板,而是帮助读者深入理解和应用提示设计技巧,以找到决定大语言模型输出的关键因子,进而将提示工程的理论知识应用到产品设计中。本书
    魏承东计算机18.2万字
  • 会员
    本书介绍提示工程的基本概念和实践,旨在帮助读者了解如何构建高质量的提示内容。内容包括:认识大语言模型、ChatGPT应用体验、ChatGPTAPI、PythonChatGPTAPI库、提示工程、提示类型、基于提示工程应用Python数据分析等。
    兰一杰 于辉计算机14万字