卷积的感受野
卷积每次只看一个小窗口(比如 3 个像素),似乎“目光短浅”。但只要一层层往上叠,高层的一个神经元,能间接“看到”输入里越来越大的一片——这片范围叫它的感受野。这就是为什么深层卷积网络不靠大卷积核,也能理解整张图的全局结构:深度换来了广度。拖动“层数”滑块,看最顶上那个金色神经元的视野(蓝色锥形)怎样随深度一层层张开。
最下面一行是输入像素,往上每一行是一层卷积(核大小 3)。金色是顶层那个神经元,蓝色锥形圈出它最终依赖的输入像素——就是它的感受野。
小窗口
每层只看相邻 3 个,参数少、计算省。单看一层确实“目光短浅”。
叠出大视野
核大小 3 时,每加一层感受野就 ±1,L 层后顶层能看到 2L+1 个输入像素。
深度换广度
不必用大卷积核,靠堆深度就能覆盖全局——这是 CNN 高效的关键之一。