激活函数HSwish

2021/04/18 BasicKnowledge 共 562 字,约 2 分钟

深度学习基础知识点激活函数HSwish

$HSwish$ 又称为 $Hard \ Swish$ 是对 $Swish$ 激活函数的改进,由谷歌团队在 $MobileNetV3$ 中提出,目的在于减少计算量。

Hard Swish

$Hard \ Swish$ 激活函数的原始形式:

\[f\left( x \right) =x\frac{\text{Re}LU6\left( x+3 \right)}{6}\]

作者基于 $ReLU6$ 对 $Swish$ 改进的原因,作者认为几乎所有的软件和硬件框架上都可以使用 $ReLU6$ 的优化实现。

$Hard \ Swish$ 和 $Swish$ 激活函数对比如下:


Hard Swish

优点

与 $Swish$ 相比 $Hard \ Swish$ 减少了计算量,具有和 $Swish$ 同样的性质。

缺点

与 $ReLU6$ 相比 $Hard \ Swish$ 的计算量仍然较大。

总结

$Hard \ Swish$ 可以看作 $Swish$ 激活函数的低精度版本,$Hard \ Swish$ 通过用线性类型的 $ReLU6$ 函数取代指数类型的 $Sigmoid$ 函数,减少了计算量。此外,在 $MobileNetV3$ 中作者认为 $Hard \ Swish$ 能够将通道数量减少到 $16$ 个的同时保持与使用 $ReLU6$ 或 $Swish$ 的 $32$ 个通道相同的精度。

参考

Searching for MobileNetV3

Search

    Categories Cloud

    Blog Git BasicKnowledge Linux Classification Article MachineLearning

    Table of Contents