来源:机器之心
机器之心发布
机器之心编辑部
百度 PaddlePaddle 团队开发的 PaddleClas 是一个适用于业界和学界的图像分类任务工具集,可以帮助用户训练更好的计算机视觉模型并应用于真实场景中。近期 PaddleClas 迎来了全面升级,其中提供了更高精度的知识蒸馏模型、更丰富的模型种类以及更佳的开发体验,从而使得开发者更方便地在服务器端或者移动端、IoT 端进行部署。
图像分类任务作为深度学习视觉领域的「基石」,几乎是每一位视觉方向开发者最先要学习的基础本领。众所周知,图像分类已广泛应用在智慧零售、智慧交通、智慧医疗、智慧安防等等各行各业。不仅如此,图像目标检测、图像分割、图像检索、OCR、人脸识别等高阶视觉任务也常将图像分类网络作为骨干网络。图像分类的网络结构和预训练模型则无疑是智能视觉技术的稳固地基和强壮骨架,它的性能直接影响高阶视觉任务的效果。
图像分类任务如此重要,但好的分类网络却没有那么容易被训练出来。开发者往往要面临像目标遮挡、尺度变化、变形、背景噪音过大、光照视角多变、目标姿态多变等问题。为了解决这些困难,大家一般需要从数据增广、骨干网络设计、损失定义、优化器设计、模型压缩裁剪量化、模型可解释性、特征迁移学习等不同的角度对图像分类问题进行深入探索。听起来是不是就头大?
莫慌!PaddleClas 就是一个超强的图像分类任务的工具集,助力开发者训练出更好的视觉模型并快速应用落地。PaddleClas 近期也完成了全新的升级,本次升级之后,PaddleClas 可算成为了
地表超强开源图像分类库
(不好说『最』,怕被请喝茶)。那这个称号是从哪里来的呢?让我们用事实说话,看看 PaddleClas 升级后到底有多强大!
更高精度的模型:基于百度自研的知识蒸馏方案(SSLD),PaddleClas 开源了
14
个 SSLD 分类预训练模型,精度普遍提升
3%
以上;其中 ResNet50_vd 模型在 ImageNet-1k 数据集上的 Top-1 精度达到了
84.0%
,Res2Net200_vd 预训练模型 Top-1 精度高达
85.1%
。同时也优化出更多业界 SOTA 模型,并支持图像检测、分割以及 OCR 等高阶视觉任务全面提升模型效果;
更丰富的模型种类:本次升级新增 4 个系列模型(InceptionV3、GhostNet、ResNeSt 和 RegNet),至此 PaddleClas 总共包含
29
个系列的分类网络以及
134
个预训练模型;
开发体验进一步升级:全面支持动态图,使你的算法构建、训练以及评估调试更轻松。并进一步打通全流程部署,无论是在移动端、IoT 端还是在服务器端进行部署,都可以在这里找到最佳的部署方案;
数十种图像分类算法开发的 Trick 和工具
!深入理解开发者算法开发过程中的难点,手把手教你提升算法性能!
已经迫不及待要去看项目代码了嘛?
传送门送你一程:
https://github.com/pad
dlepaddle/PaddleClas