卷积核手动滑动
卷积神经网络靠卷积核''看图——一个小小的方块(这里是 3×3)在图像上一格格滑过,每到一处就把覆盖的像素和核里的权重对应相乘再相加,得出一个数。不同的核找不同的东西:有的专挑边缘,有的专挑竖线、横线。换个核,看同一张图被看’‘出完全不同的特征。
左边是原图(一个``十''字),中间是卷积核,右边是算出来的``特征图'':越亮表示这个核在该位置的响应越强。蓝框是当前滑动窗口,金框是它对应的输出格。
原图 10×10
卷积核
→
特征图 8×8
核 = 一个小模式探测器
3×3 的权重决定它对什么敏感:边缘检测核在明暗交界处响应最大。
滑动 = 处处都查一遍
同一个核滑遍全图,所以图里任何位置出现该模式都能被发现(平移不变)。
多个核 = 多种特征
真实 CNN 一层有几十上百个核,各管一种模式;逐层叠加就能识别复杂物体。