gym是一个研究和开发强化学习相关算法的仿真平台,不需要agents的先验知识,由以下两部分组成。
健身房开源库:试题集。你测试强化学习的时候,测试的问题是环境,比如机器人玩游戏,环境的集合就是游戏的画面。这些环境有一个通用的接口,允许用户设计通用的算法。
openai健身房服务:提供一个站点和api(如经典控制问题:cartpole-v0),允许用户比较自己的测试结果。
商场算法健身房问题用户
微信 分享