编者按:
没有什么比薅GPU羊毛更喜闻乐见。
之前有专门教程介绍谷歌资源,需要科学上网。但最近知乎上又有一套国产GPU资源的薅羊毛分享,价值上亿的高性能算力,对科研学习者完全免费。
这就是百度的AI Studio。现在,我们将这篇测评及使用分享转载如下,祝薅羊毛开心顺利。
1.AI Studio和飞桨(PaddlePaddle)
AI Studio和飞桨算是后起之秀,包括我在内的很多人还不是很熟悉这一整套方案,在开薅之前,所以先简单介绍下。
1.1 AI Studio
AI Studio是百度提供的一个针对AI学习者的在线一体化开发实训平台(https://aistudio.baidu.com/?fr=liangziwei)。
平台集合了AI教程, 深度学习样例工程, 各领域的经典数据集, 云端的运算及存储资源, 以及比赛平台和社区。[1]你可以把AI Studio看成国产版的Kaggle。
和Kaggle类似,AI Studio也提供了GPU支持,但百度AI Studio在GPU上有一个很明显的优势。Kaggle采用的是Tesla K80的GPU, AI Studio采用的是Tesla V100的GPU,那么下表对比两款单精度浮点运算性能,就能感觉v100的优势了。
明显在单精度浮点运算上,AI Studio提供的运行环境在计算性能上还是很有优势的。理论上训练速度可以提高近3倍左右。
虽然性能上好很多,但目前还是可以免费薅到,目前AI Studio提供了免费申请和运行项目奖励这两种获得算力卡的方式,最后一章我会带领大家去薅。
即使算力卡用完了(目前送得太多,根本用不完),AI Studio的CPU也是很有竞争力的。亲自用脚本测试过,AI Studio的CPU是Intel(R) Xeon(R) Gold 6148 CPU,可以说在配置上,AI Studio也是很有竞争力的。
1.2 飞桨
根据官网介绍,飞桨是百度推出的 “源于产业实践的开源深度学习平台”,致力于让深度学习技术的创新与应用更简单。
Paddle是Parallel Distributed Deep Learning的缩写,翻译过来是就是桨。和TensorFlow,Pytorch等框架一样,飞桨给开发者提供了很多常用的架构,也可以直接在包里直接加载常用的数据库,对于学习者来说,还是很方便的。
飞桨(PaddlePaddle)还是有点国产的意思,去Github可以搜到PaddlePaddle的项目,除了英文文档,还提供了中文文档,这个有时候还是挺方便的。虽然现在star比起TensorFlow还是差不少,但是感觉进展得如火如荼。
1.3 AI Studio与飞桨的生态
下图是百度在4月首届 WAVE SUMMIT 2019 深度学习开发者峰会时首次对外公布的 飞桨全景图。
生态其实设计得很好,可能TensorFlow先发得太早吧,感觉飞桨追赶得很吃力。但从百度最近推广飞桨的力度来看,我猜飞桨很有可能两三年左右进入主流深度学习框架之列。
2.AI Studio实例测评:以数字识别项目为例2.1 AI Studio GPU和CPU性能对比。
为了测试AI Studio的性能,我用最经典的MNIST数据集,在LeNet 5模型上跑,对比在GPU和CPU下在AI Studio的的性能。同时我进行了一个不算严谨的测试,我用最经典的MNIST数据集,飞桨用的MNIST数据集是60000个训练数据,10000个测试数据,Kaggle的训练集数据42000,测试集数据28000。https://aiStudio.baidu.com/aiStudio/projectdetail/45293
以下是AI Studio的CPU和GPU测试性能对比
GPU提升效果为11倍,因为训练过程有验证测试,而且CPU配置也太高了,所以并未达到理论上的47x的加速,但这速度还不错。
2.2 AI Studio和Kaggle对比测试
测试环境:
1. Kaggle Kernel.
测试kernel https://www.kaggle.com/orange90/mnist-with-lenet-5-test-run-time. Batch_size =50,训练5000轮,使用框架TensorFlow,CNN架构是LeNet-5
2.AI Studio.
测试项目https://aiStudio.baidu.com/aiStudio/projectdetail/45293
Batch_size = 64,训练5000轮,使用框架飞桨, CNN架构是LeNet-5
AI Studio的测试结果在2.1展示了,就不再赘述了,以下是Kaggle的性能测试对比:
在使用体验上,和Kaggle Kernel或者Jupyter Notebook很接近,虽然外观稍有不同,但快捷键基本一样,没有太大的不适应。除此之外,AI Studio由于在国内,页面响应比Kaggle更快,比Kaggle网络更稳定,断线重连几率要更低,毕竟断线重连要重跑还是挺蛋疼的。
不过需要提醒的是,AI Studio目前还是按运行环境启动时间来计费,是在无GPU环境下把代码写好,再开启GPU去跑。虽然AI Studio的算力卡也是送的,但也要赶紧薅起来,囤点算力资源,万一哪天百度没钱了,不送了呢?
3.羊毛来了,薅起来
现在的算力卡还是很好拿的,没什么门槛,自己申请一下就拿到了,而且每天运行一次项目,又送12个小时算力,连续运行5天再加送48小时。
值得注意的是,申请的算力卡到手就是48小时,裂变之后能凑120小时,而且有效期比日常运行获取的12小时这种要长很多。
我寻思每天免费让你12小时NVIDIA v 100GPU这种事情,真的是天上掉馅饼吧。
此外,AI Studio官方也有比赛,有奖金,如果你的实力在kaggle里离拿奖金只是一步之遥,那么蹭AI Studio还没火起来之前,去AI Studio比赛应该是很好拿奖的。
3.1 自己申请
点进https://aistudio.baidu.com/aistudio/questionnaire?activityid=539
接着填写个人信息
3.3 算力卡分裂
AI Studio的算力卡有分裂功能,你申请到算力卡会有三个邀请码,你可以分享给你的朋友。我申请的算力卡有三个分裂,我每天会在评论区放一个算力卡,对羊毛贪得无厌,或者懒得申请又想马上使用的,那可要盯紧评论区了。后续我再薅到新的算力卡就会评论区更新,先到先得,希望各位多多关注本文。
3.4 比赛薅羊毛
另外额外告诉大家一个可能能行的薅羊毛的方法,需要一定的实力。AI Studio也有一些常规比赛,相对于Kaggle,可能竞争会小点,如果你在Kaggle能top10%以上,来AI Studio薅类似的比赛,就很大几率拿得到奖金了。
羊毛不是天天有,该出手时就出手!
Reference:
【1】https://ai.baidu.com/docs#/AIStudio_Tutorial/top?fr=liangziwei
【2】http://www.PaddlePaddle.org/?fr=liangziwei
【3】https://ai.baidu.com/forum/topic/show/943419/?fr=liangziwei
谷歌计算资源薅羊毛教程传送门:
https://zhuanlan.zhihu.com/p/59305459
作者系网易新闻·网易号“各有态度”签约作者