一个最新的丰富的图像分类代码库
PaddleClas是最近开源的图像分类代码库,基于ImageNet1k分类数据集,提供ResNet、ResNet_vd、Res2Net、HRNet、MobileNetV3等23种系列的分类网络结构的简单介绍、论文指标复现配置,以及在复现过程中的训练技巧。与此同时,也提供了对应的117个图像分类预训练模型,以及在V100、T4、CPU不同设备不同batchsize的性能评估。
PaddleClas提供的SSLD知识蒸馏方案,模型效果普遍提升3%以上,准确率82.4%的ResNet50_vd_ssld和83.7%的ResNet101_vd_ssld,准确率79%的MV3_large_x1_0_ssld(M是MobileNet的简称),71.3%的MV3_small_x1_0_ssld、76.74%的MV2_ssld和77.89%的MV1_ssld。
PaddleClas提供了8种数据增广算法的复现和在统一实验环境下的效果评估,包括图像变换类是指对全图进行一些变换,例如AutoAugment,RandAugment。图像裁剪类是指对图像以一定的方式遮挡部分区域的变换,例如CutOut,RandErasing,HideAndSeek,GridMask。图像混叠类是指多张图进行混叠一张新图的变换,例如Mixup,Cutmix。
此外PaddleClas也提供10万类图像分类预训练模型和超越EfficientDet的面向服务器端应用的目标检测方案。
github地址: https:// github.com/PaddlePaddle /PaddleClas
文档教程地址: https://paddleclas.readthedocs.io