第7章：生成模型

数据增强

概述

数据增强（Data Augmentation）是指通过生成模型人工扩展训练数据集的技术，旨在提高模型的泛化能力和鲁棒性。传统的数据增强方法（如旋转、裁剪图像）受限于原始数据的线性变换，而基于生成模型的方法能创造更丰富的合成数据。

生成模型在数据增强中的应用

GAN-based Augmentation
- 使用生成对抗网络（如DCGAN、StyleGAN）生成逼真样本
- 示例：医疗影像稀缺时，生成合成CT扫描图像辅助诊断模型训练
- 优势：可生成高分辨率、多样化的数据
VAE-based Augmentation
- 通过变分自编码器的隐空间插值生成新样本
- 适用场景：文本数据增强时保持语义连贯性
扩散模型增强
- 利用扩散模型生成高质量图像细节
- 典型案例：Stable Diffusion生成不同风格的训练图片

技术挑战与解决方案

挑战	解决方案
模式坍塌（GAN）	采用Wasserstein GAN或谱归一化
样本真实性不足	引入条件生成（cGAN）控制特征
类别不平衡	使用类别条件生成（如AC-GAN）

实际案例

自动驾驶：通过GAN生成极端天气下的虚拟道路场景
工业检测：用VAE生成缺陷产品图像以覆盖罕见故障模式
NLP：基于GPT的文本改写扩充对话数据集

评估指标

FID分数（Fréchet Inception Distance）衡量生成图像与真实数据的分布距离
分类器置信度：增强数据训练的模型在测试集上的准确率提升
多样性指标：计算生成样本的LPIPS距离（感知差异）

# 示例：使用GAN进行图像增强的伪代码
from tensorflow.keras import layers

def build_generator():
    model = Sequential([
        layers.Dense(256, input_dim=100),
        layers.LeakyReLU(),
        layers.BatchNormalization(),
        layers.Dense(784, activation='tanh')  # MNIST图像生成
    ])
    return model

# 生成增强数据
noise = np.random.normal(0, 1, (batch_size, 100))
generated_images = generator.predict(noise)

未来方向

跨模态增强：如文本到图像的扩散模型生成多模态数据
主动增强：根据模型训练反馈动态调整生成策略
隐私保护增强：差分隐私GAN生成可用的匿名化数据

关键洞见：生成式数据增强正在从"数量补充"转向"质量优化"，通过合成困难样本（hard examples）主动提升模型性能。