可视化资源

GAN:生成器与判别器的博弈

生成对抗网络(GAN)让两个网络打一场“猫鼠游戏”。判别器 D 是警察,努力分辨哪些样本是真数据、哪些是仿造的;生成器 G 是造假者,努力造出能骗过 D 的假样本。两边交替训练、互相施压:D 越练越会挑刺,G 就被逼着把假货做得越来越像。理论上的终点是——G 造的分布和真数据完全重合,D 再也分不出真假,只能两边都猜 50%。这里把一切压到一维:真数据是一条钟形分布,G 只能平移、缩放一个标准正态。点“自动训练”,看金色的假直方图怎么一步步贴上真分布。

淡灰直方图是真数据(来自 N(0.62, 0.10²)),金色直方图是 G 造的假数据蓝曲线是 D(x)——判别器认为 x 是“真”的概率(0~1)。训练让蓝曲线先学会一高一低分辨真假,再被 G 拉平回 0.5。

真分布:单峰
训练步数 0 G 的 μ 0.25 → μ*=0.62 G 的 σ 0.30 → σ*=0.10
D 学着分辨

判别器做梯度上升,在真数据处把 D(x) 推高、在假数据处压低——蓝曲线先拱出“真高假低”的形状。

G 学着骗过

生成器朝“让 D 觉得是真”的方向挪动 μ、σ(非饱和损失),把假直方图往 D 评分高的地方搬。

纳什均衡

当假分布贴上真分布,D 处处只能猜 0.5、两边谁也占不到便宜——博弈到达平衡,训练自然停下。