矩阵是空间变换
矩阵看着像一堆数字,其实它是对整个空间的一次“拉扯”——旋转、缩放、剪切、翻转,都能用一个 2×2 矩阵表示。神经网络每一层做的“乘以权重矩阵”,本质就是把数据所在的空间变换一下。秘密很简洁:矩阵的两列,正是两个基向量 î、ĵ 变换后的落点;行列式则是面积被放大了多少倍。拖动四个数,看网格和图形怎么变。
浅色是原始网格,深色是被矩阵变换后的网格。青箭头 î 是 (1,0) 的去向,金箭头 ĵ 是 (0,1) 的去向——它们正好是矩阵的两列。
变换矩阵
行列式 det = 1.00 面积不变
试试这些变换
列 = 基向量去向
第一列是 (1,0) 变到哪、第二列是 (0,1) 变到哪。知道这两个,整个变换就定了。
行列式 = 面积缩放
|det| 是面积放大倍数;det 为负表示空间被翻了面(镜像);det=0 表示被压扁成一条线。
神经网络的一层
“乘权重矩阵”就是这样变换数据空间,再配上激活函数掰弯,层层叠出复杂映射。