强化学习Openai Gym基础环境搭建

强化学习Openai Gym基础环境搭建,第1张

​ Gym提供了一些基础的强化学习环境,并且集成了许多有意思的环境,下面我们来一起看下如何在你的电脑上搭建Gym的开发环境吧。


​ Gym的Github地址。


1. ReadMe解读

​ Gym 是一个开源 Python 库,通过提供标准 API 在强化学习算法和环境之间进行通信,以及符合该 API 的标准环境集,用于开发和比较强化学习算法。


自发布以来,Gym 的 API 已成为强化学习领域的标准。


​ Gym的官方文档地址:https://www.gymlibrary.ml/

​ 起初,一直没找到这个文档,看到的是Gym官网上提供的简单的[一页文档](Gym (openai.com))。


一直觉得Gym的文档给的太过简单,内容也很少,想开发自己的环境让人无从下手,后面才发现了上面的文档,和自己这段时间的学习基本吻合,也算是两相印证。


​ Gym更多的是提供的一个强化学习环境的一个标准,你只要实现Gym的几个关键接口,其余内容都是可以自由发挥的,你可以使用Pygame、pyglet等开发一个游戏用做环境,也可以简单的使用matplotlib来做环境图像的渲染。


后面我会有文章单独介绍Gym的API。


​ Gym现在支持3.7,3.8,3.9,3.10版本的python,支持在Linux和Mac上安装;也支持Windows上安装Gym,但是并没有官方支持,Gym中的一些环境,如Mujoco,对于Windows的支持不如Linux和Mac,但是对于初学者,是足够使用了。


并且在不同的系统上,安装步骤基本类似。


2. 环境搭建

​ python环境的管理,个人建议大家使用conda。


conda不仅仅是用来安装python包的工具,其更重要的功能是环境管理的工具,我们可以通过conda创建python环境,每个环境之间是相互独立的,各个环境里可以使用不同版本的python,不同版本的开发包。


conda的环境类似docker,而且有了conda后,你再也不用在一个电脑因为代码的原因来回切换python的版本,或者为某个项目升降某个包而影响了其他项目。


​ conda的安装本位不在多讲,大家可以参考这篇文章(Windows,linux可自行百度)。


conda安装好后,一定记得配置国内的源,不然下载速度会受限。


​ python 安装好后,执行如下命令,创建一个python虚拟环境(名字大家可以自起),我使用的是3.7版本的Python,大家可自行选择自己需要的版本:

conda create --name Gym python=3.7

​ 稍等片刻,conda就帮我们创建好了名字为Gym、python版本3.7的环境了,

conda info --envs
conda activate Gym

​ 这两条命令是查看本机已经安装的python环境,另一个是当前终端激活虚拟环境Gym,也就是将当前终端使用的python切换到Gym,可以看大,最前面的符号,变为了(Gym)。


pip install gym
pip install pygame
pip install numpy

​ 这样,Gym的基础环境就安装完成了,我们打开Pycharm(python的开发环境,建议使用Pycharm,页面简单,功能强大,如果有校园邮箱,可以通过教育优惠使用专业版,也可以使用社区办,也足够使用了),新建一个项目,创建一个python文件,将如下代码复制到文件中:

import gym
import time
env = gym.make("CartPole-v1")
observation, info = env.reset(seed=42, return_info=True)

for _ in range(1000):
    # 显示图像
    env.render()
    action = env.action_space.sample()
    observation, reward, done, info = env.step(action)
    time.sleep(0.01)
    if done:
        observation, info = env.reset(return_info=True)
env.close()

​ 想要执行上面代码,还需要在pycharm中将python环境设置为刚才我们创建的Gym,点击右下角,Add Interpreter,

​ 然后选择Existing environment,记得勾选Make available to all project,这样以后其他项目就可以直接使用添加的interpreter了,

​ 点击右方的三个点图标,到我们conda的安装目录下–>envs–>Gym目录下的python.exe(这个是windows下的目录,如果是linux,还需到进入bin目录,找到python可执行文件,带小问号图标)

​ 点击ok,在点击ok即可,等pycharm切换好环境后,我们就可以执行上面的测试代码了,执行结果如下:

3. 总结

​ 本文的内容到这里就结束了,Gym的基础环境搭建还是比较简单的。


Gym把不同的模块进行了抽离,我们上面安装的知识Gym的基础环境,其他的如Atari、mojoco等环境,还需要用户单独安装。


后面会有文章将如何安装Atari环境,并使用键盘玩Atari游戏。


​ 如果本文能对你有所帮助,还请给点赞、收藏、关注博主,如果有什么错误,还请批评指正。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/langs/569939.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-04-09
下一篇 2022-04-09

发表评论

登录后才能评论

评论列表(0条)

保存