贝叶斯更新
手里一枚来路不明的硬币,正面概率 p 是多少?贝叶斯的思路很像人之常情:先有个先验信念(一开始啥都不知道,觉得 p 可能是任何值),每抛一次就拿结果去更新信念,得到后验。抛得越多,信念分布就越窄、越笃定,慢慢逼近硬币真实的偏向。这正是模型“从数据里学参数”的概率版本。抛几次试试。
曲线是当前对 p(正面概率)的信念分布:越高的地方越可能。红虚线是硬币真实偏向(这里藏着 0.7),金线是当前的估计均值。抛硬币,看曲线怎么往真值收窄。
先验:起点信念
没数据时,对 p 一无所知,分布是平的——任何值都有可能。
更新:乘以似然
每个结果都让“与之相符的 p”更可信、不符的更不可信,分布随之移动、收窄。
数据越多越笃定
抛得越多,后验越窄、越集中在真值附近——这就是“从经验中学习”。