可视化资源

汇聚(池化)

卷积之后,特征图往往很大。汇聚(pooling,也叫池化)就是把它“缩小”一圈:拿一个小窗口(这里 2×2)不重叠地扫过去,每块只留一个代表值——最大汇聚留最强的那个响应,平均汇聚留平均值。这样既减少了计算量,又让网络对位置的小变动不那么敏感(平移不变)。换换两种方式,看 8×8 怎么被缩成 4×4。

左边 8×8 是输入特征图(越亮响应越强)。2×2 窗口不重叠地滑动,每块输出一个值,得到右边 4×4。金框是当前窗口和它对应的输出格。

输入 8×8
汇聚后 4×4
最大汇聚

只留窗口里最强的响应——“这一带有没有出现这个特征”,最常用。

平均汇聚

取窗口平均,更平滑,保留整体强度但弱化尖峰。

为什么有用

缩小尺寸省算力;位置略微移动结果也基本不变(平移不变),还能扩大后层的感受野。