[PaperRead]PP-LCNet: A Lightweight CPU Convolutional Neural Network

相关文章推荐

腼腆的火柴 · flask+pyecharts的数据大屏 ...· 10 月前 ·

阳刚的牛排 · PyQt5 - ...· 1 年前 ·

深情的毛豆 · 错误处理：com.google.gson.s ...· 1 年前 ·

纯真的石榴 · C#在winform中调用系统控制台输出-阿 ...· 1 年前 ·

考研的台灯 · mysql自定义函数打印 mysql ...· 1 年前 ·

论文名称： PP-LCNet: A Lightweight CPU Convolutional Neural Network

作者：Cheng Cui, Tingquan Gao, Shengyu Wei,Yuning Du...

Code： github.com/PaddlePaddl…

总结了一些在延迟（latency）几乎不变的情况下精度提高的技术；

提出了一种基于MKLDNN加速策略的轻量级CPU网络，即PP-LCNet。

目前的轻量级网络在启用 MKLDNN 的Intel CPU上速度并不理想，考虑了一下三个基本问题：

如何促使网络学习到更强的特征，但不增加延迟？

在CPU上提高轻量级模型精度的要素是什么？

如何有效地结合不同的策略来设计CPU上的轻量级模型？

Method

PP-LCNet使用深度可分离卷积作为基础结构，构建了一个类似MobileNetV1的BaseNet，并在其基础上结合现有的技术，从而得到了PP-LCNet

参数配置：

Better activation function

激活函数是神经网络中非线性的来源，因此其质量一定程度上决定着网络的表达能力。

当激活函数由Sigmoid变为ReLU时，网络的性能得到了很大的提升，近来出现了很多超越ReLU的激活函数，如EfficientNet的Swish，MobileNetV3中将其升级为HSwish，避免了大量的指数运算；因此本网络中使用HSwish激活函数代替ReLU。

首先让我们看一下ReLU函数的近似推导：

\begin{aligned} f(x)&=\sum_{i=1}^{\infin}\sigma(x-i+0.5) &(stepped\ sigmoid)\\ &\approx log(1+e^x) &(softplus\ function)\\ &\approx max(0,N(0,1)) &(ReLU\ function) \end{aligned}

出于计算量的考虑和实验验证选择了ReLU

ReLU6：

增加了上界

Swish ：

f(x)=x\cdot sigmoid(\beta x)

\beta是个常数或可训练的参数。Swish 具备无上界有下界、平滑、非单调的特性。 Swish 在深层模型上的效果略优于 ReLU。仅仅使用 Swish 单元替换 ReLU 就能把 Mobile NASNetA 在 ImageNet 上的 top-1 分类准确率提高 0.9%，Inception-ResNet-v 的分类准确率提高 0.6%。

当β = 0时,Swish变为线性函数 $f(x)=\frac x 2$

HSwish：

Swish函数的计算量是很大的，因此提出了HSwish，H表示Hard，意味着超过某个范围，激活值为常数

对ReLU6除以6再向左平移三个单位可以得到HSigmoid：

HSwish的近似公式为x\cdot h\sigma(x)=\frac{relu6(x+3)}{6}，图像如下：

SE modules at appropriate positions

注意力模块无疑是轻量级网络完美的选择，本文探究了SE模块放置的位置，发现在网络深层的效果较好。

Larger convolution kernels

使用更大的卷积核尺寸，发现在网络深层效果较好

Larger dimensional1×1conv layer after GAP

在网络最后的GAP之后使用Pointwise卷积进行升维，以此提高网络的性能

Drop out

实验发现drop out可以提高性能

与其他网络进行对比