恒源云快速入门教程
1. 创建实例
首先登陆账号
在”我的实例“中点击创建实例,
然后选择自己需要的GPU类型,
选择镜像(所需框架、框架版本、cuda、python版本),然后进行创建,
实例创建之后会自动开启,在实例管理中可选择关机或重启,关机之后可以选择释放对应实例。
2. 上传数据
上传数据使用FileZilla,下载链接: 下载 - FileZilla中文网
点击新站点创建,然后协议,下拉选择SFTP,主机、端口、用户、密码来自于下面这张图中红框圈中部分,登陆指令:复制出来是ssh -p 27257 root@i-1.gpushare.com,其中 http:// i-1.gpushare.com 是主机名,27257是端口号,root是用户名,密码就是红框中的密码,直接复制粘贴就可以。输入信息之后点击连接。
连接之后,
在本地站点框中找到本地文件夹,然后选择文件上传即可
等待上传成功。
除了通过FileZilla,还可以借助oss上传到个人云盘,恒源云提供了50GB的免费个人云空间。
OSS命令工具支持Windows、MacOS、Linux等多种平台(暂不支持M1芯片的设备),OSS命令工具非常适合大文件传输,传输速率最高能达300Mbps/s,仅支持常见的压缩包格式,暂不支持以文件及目录方式进行传输;OSS命令是将数据上传到 个人数据 ,或者从 个人数据 中进行数据下载。
关于数据上传另外可参考: 数据上传 - 恒源云用户文档 (gpushare.com)
3. 数据解压缩
打开jupyter notebook, 然后打开terminal
zip命令:zip -q -r /hy-tmp/xxxx.zip /hy-tmp/xxxx/
unzip命令: unzip /hy-tmp/xxx.zip -d /hy-tmp/
Linux zip命令 | 菜鸟教程 (runoob.com)
Linux unzip命令 | 菜鸟教程 (runoob.com)
4. 模型训练
通过pip命令安装所需要的包,
通过python命令运行程序,
python train.py
在运行程序时可能会遇到如下错误:
ImportError: libgthread-2.0.so.0: cannot open shared object file: No such file or directory
解决方法:在terminal窗口中执行以下命令
apt-get update
apt-get install libglib2.0-dev
查看GPU使用情况
另外再打开一个terminal,
通过命令:watch -n 1 nvidia-smi 查看GPU的使用情况,1表示每1秒更新一次的更新频率。
5. 数据下载
可以通过zip命令进行压缩,然后通过FileZilla下载到本地。【也可以不压缩,直接下载文件或文件夹到本地】