OpenAI发布强化学习教程,新手友好,代码简约易懂
作者:啊哈哈哈 来源:ai08门户网 时间:2025-05-20 16:45:54
第四之后,有些遥远,暂时不详述了。
第三部分,论文阅读清单
这个论文列表非常详细,分为12个小类别,每个类别下有2-8篇论文。
团队说,列表比全面还全面,足够给一个想做RL研究的人类铺路了。
https://spinningup.openai.com/en/latest/spinningup/keypapers.html
第四部分,为初学者定制的代码
GitHub上面有个叫spinningup的项目,包含了强化学习能用到的各种关键算法:
VPG、TRPO、PPO、DDPG、TD3和SAC等。
团队说,这里的代码都是为初学者定制,很短很好学。比起模块化,Spinning Up以清晰为重,代码都注释过了,可以很清楚得看出每一步都在做什么,并且有背景材料可以辅助理解。
目标就是用最简约的实现,来演示一条理论是如何变成代码的,而抽象层和混淆层(Layers of Abstraction and Obfuscation) 这些东西,都省去了。
https://github.com/openai/spinningup
第五部分,热身练习
这里有两个习题集。
一是关于实现的基础,二是关于算法失效模式。
后面还有附加题,是要从零开始自己写代码实现,相对艰辛。
https://spinningup.openai.com/en/latest/spinningup/exercises.html
Hello World
团队说,要感受强化学习是怎样运作的,最好的方式是跑一跑。
在Spinning Up里面,就很容易,只要用这段代码:
1python -m spinup.run ppo --env CartPole-v1 --exp_name hello_world训练结束的时候,你会看到说明,然后可以按照里面讲的方法来观察数据,也观察训练好的智能体的视频。
另外,Spinning Up里面的实现,和一系列Gym环境都兼容:Classic Control,Box2D,MUJOCO等等。
去吧,皮卡丘
看上去,好像真的没有很难。
OpenAI就是希望其他领域的研究人员,也能很轻易地用强化学习来辅助研究。
所以,试一下吧。
教程入口:
https://spinningup.openai.com/en/latest/index.html
GitHub传送门:
https://github.com/openai/spinningup
“
更多资讯
热门文章
推荐对话
换一换- 人气排行
- 1 OpenAI发布强化学习教程,新手友好,代码简约易懂
- 2 云从大模型现场真机演示!考中考堪比ChatGPT,还秀了一波代码能力,创始人周曦:三种递进方式颠覆传统交互
- 3 GPT-4 API免费用??OpenAI:律师函警告,快删了
- 4 陶哲轩:ChatGPT已加入我的数学工作流
- 5 LeCun:说LLM是随机鹦鹉侮辱鸟了啊,人家三个月就学会视频网聊了
- 6 ChatGPT是有点中文在身上的:鲁迅、脱口秀甚至世界杯…都被玩宕机了
- 7 中医大模型来了!临床诊疗和养生调理一步到位,发布现场训练过程大公开,超1100万条知识图谱数据
- 8 来了,ChatGPT开始在金融圈抢活
- 9 AI偷偷写新闻70多篇,数月后才被人发现
- 10 GPT-4写代码能力提升21%!MIT新方法让LLM学会反思,网友:和人类的思考方式一样