MobileNetV3

分类模型 MobileNetV3

背景

$MobileNetV3$ 提供了两个版本，分别为 $MobileNetV3 \ Large$ 以及 $MobileNetV3 \ Small$，分别适用于对资源不同要求的情况，论文中提到，$MobileNetV3 \ Small$ 在 $ImageNet$ 分类任务上，较 $MobileNetV2$，精度提高了大约 3.2%，时间却减少了 15%，$MobileNetV3 \ Large$ 在 $ImageNet$ 分类任务上，较 $MobileNetV2$，精度提高了大约 4.6%，时间减少了 5%，$MobileNetV3 \ Large$ 与 $MobileNetV2$ 相比，在 $COCO$ 上达到相同的精度，速度快了 25%，同时在分割算法上也有一定的提高。

本文另一个亮点在于，网络的设计利用了 $NAS$（$network \ architecture \ search$）算法以及 $NetAdapt$ 算法。

减少网络计算量的方法

基于轻量化网络设计：比如 $MobileNet$ 系列，$ShuffleNet$ 系列， $Xception$ 等，使用 $Group$ 卷积、$1\times1$ 卷积等技术减少网络计算量的同时，尽可能的保证网络的精度。
模型剪枝：大网络往往存在一定的冗余，通过剪去冗余部分，减少网络计算量。
量化：利用 $TensorRT$ 量化，一般在 $GPU$ 上可以提速几倍。
知识蒸馏：利用大模型（$teacher \ model$）来帮助小模型（$student \ model$）学习，提高 $student \ model$ 的精度。

网络结构

$NAS$ 搜索全局结构
$NetAdapt$ 搜索层结构

$MobileNetV3$ 通过应用平台感知 $NAS$ 和 $NetAdapt$ 进行网络搜索，并结合本节中定义的网络改进所提出。如下图所示，分 $Large$、$Small$ 两款，分别针对高资源和低资源使用情况。

MobileNetV3-Large

MobileNetV3-Small

MobileNetV3 改进

更改末端层结构

$MobileNetV2$ 的 $avg \ pooling$ 之前，存在一个 $1\times1$ 的卷积层，目的是提高特征图的维度，更有利于结构的预测，但是会带来一定的计算量。

为了减少延迟并保留高维特性，$MobileNetV3$ 将 $MobileNetV2$ 中的 $1\times1$ 卷积层移到 $avg \ pooling$ 之后。首先利用 $avg \ pooling$ 将特征图大小由 $7\times7$ 降到了 $1 \times 1$，然后再利用 $1\times1$ 提高维度，这样就减少了 $7 \times 7=49$ 倍的计算量。

为了进一步的降低计算量，作者直接去掉了前面纺锤型卷积中的 $3\times3$和$1\times1$ 卷积，进一步减少了计算量，如下图第二行所示。作者将其中的 $3\times3$ 以及 $1\times1$ 去掉后，精度并没有得到损失。这里降低了大约 $15ms$ 的速度。