Gym提供了一些基础的强化学习环境,并且集成了许多有意思的环境,下面我们来一起看下如何在你的电脑上搭建Gym的开发环境吧。
Gym的Github地址。
Gym 是一个开源 Python 库,通过提供标准 API 在强化学习算法和环境之间进行通信,以及符合该 API 的标准环境集,用于开发和比较强化学习算法。
自发布以来,Gym 的 API 已成为强化学习领域的标准。
Gym的官方文档地址:https://www.gymlibrary.ml/
起初,一直没找到这个文档,看到的是Gym官网上提供的简单的[一页文档](Gym (openai.com))。
一直觉得Gym的文档给的太过简单,内容也很少,想开发自己的环境让人无从下手,后面才发现了上面的文档,和自己这段时间的学习基本吻合,也算是两相印证。
Gym更多的是提供的一个强化学习环境的一个标准,你只要实现Gym的几个关键接口,其余内容都是可以自由发挥的,你可以使用Pygame、pyglet等开发一个游戏用做环境,也可以简单的使用matplotlib来做环境图像的渲染。
后面我会有文章单独介绍Gym的API。
Gym现在支持3.7,3.8,3.9,3.10版本的python,支持在Linux和Mac上安装;也支持Windows上安装Gym,但是并没有官方支持,Gym中的一些环境,如Mujoco,对于Windows的支持不如Linux和Mac,但是对于初学者,是足够使用了。
并且在不同的系统上,安装步骤基本类似。
python环境的管理,个人建议大家使用conda。
conda不仅仅是用来安装python包的工具,其更重要的功能是环境管理的工具,我们可以通过conda创建python环境,每个环境之间是相互独立的,各个环境里可以使用不同版本的python,不同版本的开发包。
conda的环境类似docker,而且有了conda后,你再也不用在一个电脑因为代码的原因来回切换python的版本,或者为某个项目升降某个包而影响了其他项目。
conda的安装本位不在多讲,大家可以参考这篇文章(Windows,linux可自行百度)。
conda安装好后,一定记得配置国内的源,不然下载速度会受限。
python 安装好后,执行如下命令,创建一个python虚拟环境(名字大家可以自起),我使用的是3.7版本的Python,大家可自行选择自己需要的版本:
conda create --name Gym python=3.7
稍等片刻,conda就帮我们创建好了名字为Gym、python版本3.7的环境了,
conda info --envs
conda activate Gym
这两条命令是查看本机已经安装的python环境,另一个是当前终端激活虚拟环境Gym,也就是将当前终端使用的python切换到Gym,可以看大,最前面的符号,变为了(Gym)。
pip install gym
pip install pygame
pip install numpy
这样,Gym的基础环境就安装完成了,我们打开Pycharm(python的开发环境,建议使用Pycharm,页面简单,功能强大,如果有校园邮箱,可以通过教育优惠使用专业版,也可以使用社区办,也足够使用了),新建一个项目,创建一个python文件,将如下代码复制到文件中:
import gym
import time
env = gym.make("CartPole-v1")
observation, info = env.reset(seed=42, return_info=True)
for _ in range(1000):
# 显示图像
env.render()
action = env.action_space.sample()
observation, reward, done, info = env.step(action)
time.sleep(0.01)
if done:
observation, info = env.reset(return_info=True)
env.close()
想要执行上面代码,还需要在pycharm中将python环境设置为刚才我们创建的Gym,点击右下角,Add Interpreter,
然后选择Existing environment,记得勾选Make available to all project,这样以后其他项目就可以直接使用添加的interpreter了,
点击右方的三个点图标,到我们conda的安装目录下–>envs–>Gym目录下的python.exe(这个是windows下的目录,如果是linux,还需到进入bin目录,找到python可执行文件,带小问号图标)
点击ok,在点击ok即可,等pycharm切换好环境后,我们就可以执行上面的测试代码了,执行结果如下:
本文的内容到这里就结束了,Gym的基础环境搭建还是比较简单的。
Gym把不同的模块进行了抽离,我们上面安装的知识Gym的基础环境,其他的如Atari、mojoco等环境,还需要用户单独安装。
后面会有文章将如何安装Atari环境,并使用键盘玩Atari游戏。
如果本文能对你有所帮助,还请给点赞、收藏、关注博主,如果有什么错误,还请批评指正。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)