GAN：生成器与判别器的博弈

生成对抗网络（GAN）让两个网络打一场“猫鼠游戏”。判别器 D 是警察，努力分辨哪些样本是真数据、哪些是仿造的；生成器 G 是造假者，努力造出能骗过 D 的假样本。两边交替训练、互相施压：D 越练越会挑刺，G 就被逼着把假货做得越来越像。理论上的终点是——G 造的分布和真数据完全重合，D 再也分不出真假，只能两边都猜 50%。这里把一切压到一维：真数据是一条钟形分布，G 只能平移、缩放一个标准正态。点“自动训练”，看金色的假直方图怎么一步步贴上真分布。

淡灰直方图是真数据（来自 N(0.62, 0.10²)），金色直方图是 G 造的假数据，蓝曲线是 D(x)——判别器认为 x 是“真”的概率（0~1）。训练让蓝曲线先学会一高一低分辨真假，再被 G 拉平回 0.5。

真分布：单峰

训练步数 0 G 的 μ 0.25 → μ*=0.62 G 的 σ 0.30 → σ*=0.10

D 学着分辨

判别器做梯度上升，在真数据处把 D(x) 推高、在假数据处压低——蓝曲线先拱出“真高假低”的形状。

G 学着骗过

生成器朝“让 D 觉得是真”的方向挪动 μ、σ（非饱和损失），把假直方图往 D 评分高的地方搬。

纳什均衡

当假分布贴上真分布，D 处处只能猜 0.5、两边谁也占不到便宜——博弈到达平衡，训练自然停下。