可视化资源

偏差与方差

模型的误差可以拆成两部分。偏差:模型太简单,根本抓不住真实规律,怎么训都偏;方差:模型太灵活,换一批训练数据,学出来的东西就大变样、很不稳定。理想是两者都小,但它们往往此消彼长——这正是过拟合''的另一面。拖动复杂度,看在多份不同数据上学出的曲线,是齐刷刷地偏’‘还是``乱七八糟地飘’‘。

金色虚线是真实规律。每条淡蓝线是用一份不同的随机训练数据学出来的模型,深蓝线是它们的平均。看复杂度低和高时,这些淡蓝线的``齐''与``散''。

1

8 份数据各自学出的曲线

误差的两个来源

偏差²(平均线离真实有多远)
方差(各条线之间有多散)
合计(偏差² + 方差)
高偏差(太简单)

曲线齐刷刷地挤在一起,却整体偏离真实——模型表达力不够,欠拟合。

高方差(太复杂)

换份数据就学出完全不同的曲线,乱飘——模型把噪声也学了,过拟合。

折中最好

总误差 = 偏差² + 方差,在中等复杂度处最低;这就是要``恰到好处''的原因。