%run new_file.py
This is new_file.py
9. 设置定时点击脚本
长时间不动colab,可能会出现断开连接的情况,这时候程序就停了。虽然还保存了已经训练得到的模型,但还是没有训练完,所以设置一个定时点击页面的脚本:
在网页按F12,进入调试页面-console控制台;
输入下面的代码,按Enter回车即可
function ClickConnect(){
console.log("Clicked on connect button");
document.querySelector("paper-button").click()
setInterval(ClickConnect,60000)
如果想要停止该脚本,刷新浏览器,colab不会断开。
10. 便签本 Notebook
在colab操作临时指令,打开一个特殊的 scratch notebook,该 notebook 所做的任何更改都不会保存到主目录中。
11. 单元计时
colab提供内置功能来计算一段代码执行耗时,在执行一个单元(cell)之后,将鼠标悬停在单元运行图标上,可以获取代码执行时间的估计值。
12. 运行某个cell单元格的一部分
选中需要运行的部分;
点击【代码执行程序】;
点击【运行所选单元格的内容】,或者键盘快捷键 Ctrl + Shift + Enter;
13. Jupyter Notebook 快捷键
在 Jupyter 的快捷键前面加上「Ctrl +M」就能在 Colab 中使用
快捷键已完全更改或保持不变
四、准备工作
注册google账号
用google账号登录colab
用google账号登录google云端硬盘
配置GPU
五、关键步骤
用colab训练自己的模型:
上传项目代码:将自己的项目代码上传到 goole 云盘;
上传数据;
挂载google云盘:使用授权码挂载 google 云盘;
配置项目运行环境;
运行python文件:在 ipynb 用命令执行python文件;
1. 上传项目代码
方法一(小项目推荐,上传文件小)
在google云盘中新建项目文件夹;
点击【新建】,点击【上传文件夹】,选择对应的文件夹;
方法二(大项目推荐,上传文件大)
在google云盘中新建项目文件夹;
挂载google云盘;
将本地项目代码上传到github;
切换工作目录,切换到新建的项目文件夹下;
import os
os.chdir('drive/MyDrive/xxx')
在colab中 git clone 下载项目代码;
!git clone https://github.com/WZMIAOMIAO/deep-learning-for-image-processing.git
2. 上传数据
将数据集上传到google云盘,建议直接上传压缩包,速度快,后面直接在Colab中解压即可。
!unzip /PATH/TO/images.zip -d /PATH/TO
3. 使用授权码挂载google云盘
from google.colab import drive
drive.mount('/content/drive')
获取 authorization code 授权码
输入 authorization code 授权码,按Enter确认
4. 配置项目运行环境
5. 运行python文件
!python /content/drive/MyDrive/yolov4-tiny/yolov4-tiny-pytorch-upload/VOCdevkit/VOC2007/voc2yolo4.py
六、环境配置
1. 参考资料
手把手教你更换Colab上的python版本
2. 重要说明
colab官方默认是python3.7,python3.6并不能使用这些库。如果要一个一个安装,不仅会浪费大量时间,而且有时候我们也不知道需要哪些库,正确的做法是直接复制:
!cp -r /usr/local/lib/python3.7/dist-packages /usr/local/lib/python3.6/
查看colab中已安装的python版本:
!python --version
查看colab中已安装的python版本
!ls /usr/local/lib/
pip安装库
!python3.6 -m pip install numpy
!apt-get install python3-pip
!python3.6 main.py
3. 导出项目运行所需的依赖包
pip freeze > ./requirements.txt
4. 安装项目运行所需的依赖包
pip install -r ./requirements.txt
5. google网盘扩容
获取GoogleDrive无限网盘
一分钟获取GOOGLEDRIVE无限网盘
使用谷歌Colab(Colaboratory)免费GPU训练自己的模型及谷歌网盘无限容量(Google drive)申请教程
受够了百度网盘?如何注册无限容量的Google Drive网盘
七、可能存在的问题
用Colab训练机器学习的经验以及踩坑的那些事
跑第一个epoch很慢
问题原因:
colab跑神经网络的第一个epoch需要加载数据集,跑完第一个epoch之后就很快了;
解决办法:
耐心等待第一个epoch完成
上传数据集,上传项目文件夹的时候,有重复的文件。
问题原因:
由于网络的原因,上传出现文件,google云盘支持相同的名称。
读取图片的时候读取不到,但是不会出现没有这个文件的报错,可能会出现Nantype的报错。
解决办法:
写一个python脚本,删除重复的文件。
上传压缩文件,然后解压,解压后的文件有问题。
问题原因:
google解压的文件数量有限。
解决办法:
分批次上传,并分批次解压,之后汇总。
复制代码