Joy RL:强化学习实践教程在线阅读
会员

Joy RL:强化学习实践教程

江季 王琦 杨毅远
开会员,本书免费读 >

计算机网络人工智能7.8万字

更新时间:2025-05-19 16:15:54 最新章节:第12章

立即阅读
加书架
下载
听书

书籍简介

本书是继《EasyRL:强化学习教程》(俗称“蘑菇书”)之后,为强化学习的读者专门打造的一本深入实践的全新教程。全书大部分内容基于3位作者的实践经验,涵盖马尔可夫决策过程、动态规划、免模型预测、免模型控制、深度学习基础、DQN算法、DQN算法进阶、策略梯度、Actor-Critic算法、DDPG与TD3算法、PPO算法等内容,旨在帮助读者快速入门强化学习的代码实践,并辅以一套开源代码框架“JoyRL”,便于读者适应业界应用研究风格的代码。与“蘑菇书”不同,本书对强化学习核心理论进行提炼,并串联知识点,重视强化学习代码实践的指导而不是对理论的详细讲解。本书适合具有一定编程基础且希望快速进入实践应用阶段的读者阅读。
品牌:人邮图书
上架时间:2025-04-01 00:00:00
出版社:人民邮电出版社
本书数字版权由人邮图书提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

最新上架

  • 会员
    本书以豆包为工具,覆盖生活全场景,解决“不会用AI”“不敢用AI”等认知障碍,是一本零基础、场景化、即学即用的操作指南。本书共14章,包括豆包的注册和设置、辅导学习、日常写作、生活难题解答、新技能学习、用短视频记录生活、经营小买卖、休闲娱乐、拍摄爆款视频、丰富晚年生活、短视频脚本创作、找到赚钱方法等内容,全面解决“教育”“生产”“娱乐”“赚钱”四大刚需。本书通过近100个真实案例,结合操作视频,帮
    杜子建计算机4.5万字
  • 《为机器立心》的主题是迈向通用人工智能的中国路线,让AI不再缺“心”,点亮人工智能的“中国时刻”。在书中,朱松纯教授解答了什么是通用人工智能、如何认清智能的本质、如何为人工智能找到统一理论与认知架构,进而为机器立“心”等重要问题。全书共分为两大部分。第一部分“厘清通用人工智能的3大关键迷思”:ChatGPT等大模型无异于缸中之脑;要寻找“乌鸦智能”而不是“鹦鹉智能”;理(U体系)与心(V体系)并非
    朱松纯计算机11.7万字
  • 会员
    本书通过81个官方案例解析、120个知识点梳理,深入浅出介绍了Sora的技术原理、特色功能、创新之处、优势特点、文案工具、脚本创作、提示词技巧、绘画工具、创意应用、变现方式等,帮助读者一本书全面精通Sora的AI视频生成技术。10大专题内容、108分钟视频,手机扫码可看精华内容,同时赠送了9大超值资源:74组AI绘画提示词、104个效果文件、165页PPT课件、31集《AI摄影》教学视频、40集《
    智发编著计算机6.8万字
  • 会员
    本书以国产自研的强大AI模型DeepSeek为核心,系统呈现了DeepSeek从基础操作到各领域应用的32个实战案例,旨在帮助读者快速掌握DeepSeek的用法。本书总计32章。第1章讲解DeepSeek的注册与使用,包括访问DeepSeek官网、熟悉DeepSeek的使用界面、本地部署DeepSeek、调用DeepSeekAPI等。第2章讲解提示词的使用技巧,深入讲解如何通过充分提供信息、用词
    李艮基 肖灵儿 曹方咏峥计算机8.3万字
  • 会员
    本书是关于如何从零开始构建大模型的指南,由畅销书作家塞巴斯蒂安·拉施卡撰写,通过清晰的文字、图表和实例,逐步指导读者创建自己的大模型。在本书中,读者将学习如何规划和编写大模型的各个组成部分、为大模型训练准备适当的数据集、进行通用语料库的预训练,以及定制特定任务的微调。此外,本书还将探讨如何利用人工反馈确保大模型遵循指令,以及如何将预训练权重加载到大模型中。
    (美)塞巴斯蒂安·拉施卡计算机13.8万字
  • 本书的主题是从通用人工智能的视角来诠释中国的思想。朱松纯教授致力于搭建人文社科与通用人工智能的双向连接,本书是为人文赋“理”,即以人工智能的数理与认知模型诠释中国思想,试图为中国优秀哲学思想构建严格的数理体系,以便中国思想可以在正在到来的智能时代指导社会治理与实践,从而转化成强大的生产力。为此,本书先从智能时代的文明与道路说起,基于文明起源与演化的历程指出演化的关键在于“心”的出现,探索“心”的构
    朱松纯计算机13.7万字
  • 会员
    本书是一本关于AIGC提示工程师的实用指南,讲解了成为优秀AIGC提示工程师所需的技术特长和知识、沟通和协作能力、持续学习和自我提升方法等。本书分为3篇,共13章。第1篇为AIGC提示工程师基础,内容包括AI崛起下的新职业──AIGC提示工程师、设计高效提示的基本原则、常用的提示方法以及提示工程实践中的常见问题等;第2篇为提示进阶技巧,内容包括优化提示的除错过程、解决复杂问题的高级提示技巧、提升提
    周喜平 董丽莎编著计算机12万字
  • 会员
    本书以“从入门到精通”为逻辑主线,从基础操作指南到提示词深度优化,系统拆解DeepSeek的核心能力。书中给出的100个DeepSeek实用技巧,既讲究由浅入深,又讲究实战落地,从0到1教你如何让DeepSeek帮你提高效率:针对办公、创作、营销等高频场景,提炼文档处理、工具应用等实战技巧;聚焦金融、教育、交通等七大行业,解析AI技术落地场景与解决方案;同时介绍了本地部署、智能体开发等应用指南,通
    王吉斌 祝丽丽 吴佳莹等计算机12.7万字
  • 会员
    这是一本写给普通人的个人成长和财富增长指南。两位作者从自身经验出发,讲述如何在AI工具的帮助下,实现“一个人活成一家公司”的梦想。从用AI语音写作完成日更文章,到用AI设计海报、制作课程,再到将AI融入营销和推广,作者以DeepSeek等AI工具为例,总结了如何在各类工作和学习场景中,借助AI来完成认知升级和个人能力的提升。本书适合职场人、学生、自由职业者等各类读者阅读,致力于帮助读者借助AI的力
    鱼堂主 阿猫计算机6.4万字