贝叶斯更新

手里一枚来路不明的硬币，正面概率 p 是多少？贝叶斯的思路很像人之常情：先有个先验信念（一开始啥都不知道，觉得 p 可能是任何值），每抛一次就拿结果去更新信念，得到后验。抛得越多，信念分布就越窄、越笃定，慢慢逼近硬币真实的偏向。这正是模型“从数据里学参数”的概率版本。抛几次试试。

曲线是当前对 p（正面概率）的信念分布：越高的地方越可能。红虚线是硬币真实偏向（这里藏着 0.7），金线是当前的估计均值。抛硬币，看曲线怎么往真值收窄。

正0 反0

先验：起点信念

没数据时，对 p 一无所知，分布是平的——任何值都有可能。

更新：乘以似然

每个结果都让“与之相符的 p”更可信、不符的更不可信，分布随之移动、收窄。

数据越多越笃定

抛得越多，后验越窄、越集中在真值附近——这就是“从经验中学习”。