可视化资源

贝叶斯更新

手里一枚来路不明的硬币,正面概率 p 是多少?贝叶斯的思路很像人之常情:先有个先验信念(一开始啥都不知道,觉得 p 可能是任何值),每抛一次就拿结果去更新信念,得到后验。抛得越多,信念分布就越窄、越笃定,慢慢逼近硬币真实的偏向。这正是模型“从数据里学参数”的概率版本。抛几次试试。

曲线是当前对 p(正面概率)的信念分布:越高的地方越可能。红虚线是硬币真实偏向(这里藏着 0.7),金线是当前的估计均值。抛硬币,看曲线怎么往真值收窄。

正0 反0
先验:起点信念

没数据时,对 p 一无所知,分布是平的——任何值都有可能。

更新:乘以似然

每个结果都让“与之相符的 p”更可信、不符的更不可信,分布随之移动、收窄。

数据越多越笃定

抛得越多,后验越窄、越集中在真值附近——这就是“从经验中学习”。