高斯分布与最大似然
一堆数据,假设它们来自一个高斯(正态)分布,那这个分布的中心 μ 和宽度 σ 该取多少?“最大似然”给出一个朴素的准则:选让这批数据出现得最“顺理成章”的参数。具体说,把每个点在曲线上的高度(概率密度)乘起来(取对数就是相加),谁让这个总和最大,谁就是最优。对高斯来说,答案漂亮得出奇——μ 就是样本均值,σ 就是样本标准差。拖动 μ、σ,看似然怎么在真值处最大。
黑点是数据(落在横轴上)。蓝钟形是你假设的高斯,金色竖线是每个点在曲线上的高度。把曲线对准数据、宽窄也合适时,这些高度乘起来(对数似然)最大。
对数似然(越大越好)—
似然 = 数据的“顺理成章”度
每个点在曲线上的密度相乘;曲线越贴合数据,乘积越大。
取对数好算
连乘容易下溢,取对数变成相加,最大值位置不变。
高斯的最优解
μ* = 样本均值,σ* = 样本标准差——最大似然给了一个干净的闭式答案。