汇聚(池化)
卷积之后,特征图往往很大。汇聚(pooling,也叫池化)就是把它“缩小”一圈:拿一个小窗口(这里 2×2)不重叠地扫过去,每块只留一个代表值——最大汇聚留最强的那个响应,平均汇聚留平均值。这样既减少了计算量,又让网络对位置的小变动不那么敏感(平移不变)。换换两种方式,看 8×8 怎么被缩成 4×4。
左边 8×8 是输入特征图(越亮响应越强)。2×2 窗口不重叠地滑动,每块输出一个值,得到右边 4×4。金框是当前窗口和它对应的输出格。
输入 8×8
→
汇聚后 4×4
最大汇聚
只留窗口里最强的响应——“这一带有没有出现这个特征”,最常用。
平均汇聚
取窗口平均,更平滑,保留整体强度但弱化尖峰。
为什么有用
缩小尺寸省算力;位置略微移动结果也基本不变(平移不变),还能扩大后层的感受野。