可视化资源

梯度下降下山

训练模型,本质上就是在一座误差山''上找最低点。办法很朴素:站在哪儿,就看脚下哪个方向最陡、往下走一步,反复如此——这就是梯度下降’‘。但步子(学习率)多大很关键:太小磨蹭,太大会一脚迈过头冲出去;有时还会卡在一个``看起来最低、其实不是’‘的小坑里。点曲线任意位置放小球,调步子试试。

金球沿曲线往低处滚,红色短线是它脚下的``坡度''。在曲线上点一下可以换个起点;调``学习率''看步子大小的影响。

0.25
当前位置 脚下坡度 误差曲线 第 0 步
步子太小

每步只挪一点点,方向没错,但要走很多步才到底,训练很慢。

步子太大

一脚跨过最低点,在谷底两侧来回弹、难以稳定落底;有时甚至直接跳进旁边的谷。

局部最低点

球可能停在一个小坑里,四周都是上坡,却不是真正最低的谷。换起点、或把步子调大一脚跨出去,才可能到全局谷底。