GAN:生成器与判别器的博弈
生成对抗网络(GAN)让两个网络打一场“猫鼠游戏”。判别器 D 是警察,努力分辨哪些样本是真数据、哪些是仿造的;生成器 G 是造假者,努力造出能骗过 D 的假样本。两边交替训练、互相施压:D 越练越会挑刺,G 就被逼着把假货做得越来越像。理论上的终点是——G 造的分布和真数据完全重合,D 再也分不出真假,只能两边都猜 50%。这里把一切压到一维:真数据是一条钟形分布,G 只能平移、缩放一个标准正态。点“自动训练”,看金色的假直方图怎么一步步贴上真分布。
淡灰直方图是真数据(来自 N(0.62, 0.10²)),金色直方图是 G 造的假数据,蓝曲线是 D(x)——判别器认为 x 是“真”的概率(0~1)。训练让蓝曲线先学会一高一低分辨真假,再被 G 拉平回 0.5。
D 学着分辨
判别器做梯度上升,在真数据处把 D(x) 推高、在假数据处压低——蓝曲线先拱出“真高假低”的形状。
G 学着骗过
生成器朝“让 D 觉得是真”的方向挪动 μ、σ(非饱和损失),把假直方图往 D 评分高的地方搬。
纳什均衡
当假分布贴上真分布,D 处处只能猜 0.5、两边谁也占不到便宜——博弈到达平衡,训练自然停下。