卷积之Grouped Convolutions

深度学习基础知识点卷积Grouped Convolutions

组卷积最初是在 $AlexNet$ 中提出的，之后被大量应用在 $ResNeXt$ 网络结构中，提出的动机就是通过将 $feature$ 划分为不同的组来降低模型计算复杂度。

Grouped Convolutions

分组卷积就是将输入 $feature \ map$ 的通道进行分组，然后每个组内部进行卷积操作，最终将得到的组卷积的结果 $Concate$ 到一起，得到输出的 $feature \ map$。

训练效率高：由于卷积被分为几个不同的组，每个组的计算就可以分配给不同的 $GPU$ 核心来进行计算。这种结构的设计更符合 $GPU$ 并行计算的要求，这也能解释为何 $ResNeXt$ 在 $GPU$ 上效率要高于 $Inception$ 模块。
模型效率高：模型参数随着组数或者基数的增加而减少。
效果好：分组卷积可能能够比普通卷积组成的模型效果更优，这是因为滤波器之间的关系是稀疏的，而划分组以后对模型可以起到一定正则化的作用。从 $COCO$ 数据集榜单就可以看出来，有很多是 $ResNeXt101$ 作为 $backbone$ 的模型在排行榜非常靠前的位置。

$information$ 只是在分组的区域内交互，并没有在所有 $channels$ 上都进行交互融合，导致学得的特征也具有分组的特性，阻挡了不同分组之间的“信息流”。