现在baseline
的版本更新了,我把指令也一并更新了,按照这个来操作就可以了:
用FetchReach
环境和her
算法训练,参数保存在save_path
路径下:
python -m baselines.run --alg=her --env=FetchReach-v1 --num_timesteps=5000 --save_path=~/policies/her/fetchreach5k
可视化训练效果:
python -m baselines.run --alg=her --env=FetchReach-v1 --num_timesteps=0 --load_path=~/policies/her/fetchreach5k --play
2020.03.05
进入到/baselines/baselines/her/experiment文件夹下,在该文件夹下有:
- config.py:设置参数
- train.py:训练DDPG+HER中的参数,诸如神经网络中的参数等
- play.py:调用训练好的参数
开始训练,训练的命令是:
python train.py --num_cpu=2
训练过程如图所示:
训练好后,进行调用:
python play.py /tmp/openai-2018-07-18-15-34-17-625849/policy_best.pkl
后面跟着的是训练好的参数文件,这个文件是保存在根目录tmp文件夹内的openai开头的文件(文件名是完成的时间日期)
一如既往的又有错误,输入训练命令python train.py --num_cpu=2
后,显示
CompileError: command '/usr/lib64/openmpi/bin/mpicc' failed with exit status 1
没有安装mpicc,可以通过指令which mpicc
查看安装的mpicc路径,如果没有输出就说明没有安装,装上就可以了。
sudo apt install mpich
如果上述的指令安装不了,可以再Google一下其他安装的方法,我试过好几种安装mpicc的方法了,有点混了,不确定用的是不是这个。
安装完再输入which mpicc
查看路径,如果不是在/usr/lib64/openmpi/bin/mpicc
这个路径下,把mpicc的可执行文件cp到这个路径下就可以了,加上sudo cp
Humanoid-Robot-with-Arduino
整个实验将使用类人机器人(研究代号 G-Bot V3)。 G-Bot V3 是 Robotis 的 19 自由度 (DOF) 机器人。 它由 19 个 Dynamixel Ax-12 舵机 + 1 个声音/距离传感器组成,由 CM5 控制器控制。 实验可以分为3个主要部分:
用 Arduino Yun/Uno 替换 CM5 控制器
伺服运动曲线的 SD 卡存储
物联网通讯
world = mjcpy.MJCWorld(model_path)
ERROR: Could not open activation key file src/3rdparty/mjpro/mjkey.txt
Press Enter to exit …
在terminal中尝试
成功案例!
失败案例!
pycharm中尝试
问题的根本原因
working directory的不同,导致了问题
<br />安装ttf-mscorefonts-installer中出错的原因是需要的文件无法下载。<br />我们可以事先下载好,在安装ttf-mscorefonts-installer<br /><br />1. 下载所需的所有的字体,到http://sourceforge.net/projects/corefonts/files/ 下。会有个别不容易下,多尝试几下,下不了的话,看上面有一行英文:Problems with the download? Please use this direct lin
所以把mujoco_rendering.py文件第593行代码中的 self.data.solver_iter 更改为 self.data.solver_niter 即可。
安装完毕,将C:\Users\yonghuming\.conda\envs\xxx\Lib\site-packages内的mujoco_py文件夹替换为下载的mujoco_py(这个好像能避免一些问题)在C:\Users\yonghuming中新建一个名为.mujoco的文件夹,把下载的压缩包解压到其中,命名为mujoco210(必须是这个命名)(尝试了修改mujoco-py\mujoco_py\builder.py,没用,而且建议不修改,可能会出现其他奇怪的问题)高赞回答,需要在自己的代码中添加。
和其它的机器学习方向一样,强化学习(Reinforcement Learning)也有一些经典的实验场景,像Mountain-Car,Cart-Pole等。由于近年来深度强化学习(Deep Reinforcement Learning)的兴起,各种新的更复杂的实验场景也在不断涌现。于是出现了OpenAI Gym,MuJoCo,rllab, DeepMind Lab,...
Ubuntu1804 成功安装Mujoco、mujoco_py 详细步骤、安装教程(也可在虚拟环境中安装Mujoco )1. mujoco的安装1.1 mujoco证书秘钥获取1.2 mujoco下载2. mujoco的环境变量配置3. mujoco_py的安装与配置3.1 mujoco_py下载3.2 mujoco_py安装
说明:虚拟环境中安装,需要在一开始激活虚拟环境,其他安装过程一样(我...