博客
关于我
在 Windows 10 中使用 OpenAI Spinning Up
阅读量:426 次
发布时间:2019-03-06

本文共 1898 字,大约阅读时间需要 6 分钟。

前段时间,openAI 发布了 Spinning Up ,本篇博客将介绍如何在 Windows 系统中使用 Spinning Up。

什么是 Spinning Up

先来说说 Spinning Up,Spinning Up 是由 OpenAI 发布的,包含以下核心内容

  • 强化学习技术的简介,包含各种算法和基本理论的直观理解;

  • 一些介绍如何才能做好强化学习研究的经验;

  • 重要论文的实现,按照主题进行分类;

  • 各种强化学习算法的单独实现,它们都有非常完善的介绍文档;

  • 最后还会有一些热身练习题。

安装

下面就来讲讲最头疼的安装问题,官方文档说是目前仅在 Linux 和 OSX 上支持Spinning Up,但 Windows 系统可能也可以使用。本篇博客将介绍如何在 Windows 上安装 Spinning Up。

1.WSL

1.以管理员身份打开 Power Shell,输入

Enable-WindowsOptionalFeature -Online -FeatureName Microsoft-Windows-Subsystem-Linux

安装完成后重启。

2.安装 Linux Distribution of Choice

打开 Microsoft Store 并选择您喜欢的 Linux 发行版

点击获取,然后安装。安装完成后,运行下好的 Linux

新安装的发行版第一次运行时,将打开一个控制台窗口,您将被要求等待一两分钟才能完成安装。

然后设置用户名和密码

设置完后就ok了。

这里顺便给出微软的文档

记得定期更新软件包目录

sudo apt update && sudo apt upgrade

2.安装 Xming

后面一路默认就好了。

3.在 WSL 中使用 Xming

打开cmd,输入 bash

键入

sudo apt-get install x11-apps

安装时间有那么点点久。。。。。。。。。。。。。。。。。。。

然后要做的操作(别一股脑的复制进去了,一行一行来,顺便看看括号里的内容)

   export DISPLAY=localhost:0.0     nano ~/.bashrc  #(add  export DISPLAY=localhost:0.0   at the end. Ctrl+X to exit/save)  这一步懂vim的应该都知道    sudo apt-get install gnome-calculator #will get you GTK

安装的好慢。。。。。。。。。。。。。。不知道是不是我网速的原因,耐心等待吧

4.安装 miniconda

选择 for Linux 的

下载好后,打开cmd,cd 到你下载的目录,然后输入

bash 文件名.sh

后面一直按回车即可,直到出现该界面

输入yes后就等待安装完成

5.安装spinningup

bash进入linux 的terminal,然后输入

conda create -n spinningup python=3.6

创建虚拟环境

创建完毕后输入

source activate spinningup

然后输入

sudo apt-get update && sudo apt-get install libopenmpi-dev

安装OpenMPI,又是漫长的等待。。。。。。。。。。。。。。。。。。。。

安装完成后,输入

git clone https://github.com/openai/spinningup.gitcd spinninguppip install -e .

(惊了,Ubuntu里没装git居然命令有效!!改天一定要去好好了解一下WSL的原理orz)

接着等上一段时间。。。。。。

到这里就安装完成了!

6.检验

安装完成后,输入

python -m spinup.run ppo --hid "[32,32]" --env LunarLander-v2 --exp_name installtest --gamma 0.999

来检查是否成功安装,大概要跑10分钟。。。。又是漫长的等待。。。。

 

看到这里就算成功安装了

接下来,就开始愉快的RL之旅了,后面的学习就靠看官方文档了。

 总结

一段愉快的踩坑之旅,还算好,没碰上什么大问题,除了WSL不太会用之外都还行,发现Windows还有很多未发现的高端黑科技,有空得去好好研究研究微软的官方文档orz。。。希望这篇博客能帮助到大部分入坑RL的研究者们。

参考文档:

转载请附上链接:

你可能感兴趣的文章
Objective-C实现armstrong numbers阿姆斯壮数算法(附完整源码)
查看>>
Objective-C实现articulation-points(关键点)(割点)算法(附完整源码)
查看>>
Objective-C实现atoi函数功能(附完整源码)
查看>>
Objective-C实现average absolute deviation平均绝对偏差算法(附完整源码)
查看>>
Objective-C实现average mean平均数算法(附完整源码)
查看>>
Objective-C实现average median平均中位数算法(附完整源码)
查看>>
Objective-C实现average mode平均模式算法(附完整源码)
查看>>
Objective-C实现avl 树算法(附完整源码)
查看>>
Objective-C实现AvlTree树算法(附完整源码)
查看>>
Objective-C实现backtracking Jump Game回溯跳跃游戏算法(附完整源码)
查看>>
Objective-C实现BACKTRACKING 方法查找集合的幂集算法(附完整源码)
查看>>
Objective-C实现bailey borwein plouffe算法(附完整源码)
查看>>
Objective-C实现base64加密和base64解密算法(附完整源码)
查看>>
Objective-C实现base64加解密(附完整源码)
查看>>
Objective-C实现base64编码 (附完整源码)
查看>>
Objective-C实现base85 编码算法(附完整源码)
查看>>
Objective-C实现basic graphs基本图算法(附完整源码)
查看>>
Objective-C实现BCC校验计算(附完整源码)
查看>>
Objective-C实现bead sort珠排序算法(附完整源码)
查看>>
Objective-C实现BeadSort珠排序算法(附完整源码)
查看>>