第4章:去噪扩散概率模型(DDPM)
4.1 DDPM的原始论文与核心思想
4.1.1 原始论文背景
去噪扩散概率模型(Denoising Diffusion Probabilistic Models, DDPM)由Ho等人在2020年提出(论文《Denoising Diffusion Probabilistic Models》),是扩散模型发展史上的里程碑工作。该论文首次系统性地建立了基于马尔可夫链的扩散模型理论框架,并通过变分推断实现了高效训练。
4.1.2 核心思想概述
DDPM的核心思想包含两个对称过程:
- 前向扩散过程(Forward Process)
通过固定方差的马尔可夫链逐步向数据添加高斯噪声,将复杂数据分布转化为简单的高斯分布。 - 逆向去噪过程(Reverse Process)
通过神经网络学习逐步去噪,从纯噪声中重建原始数据分布:
4.1.3 关键理论突破
重参数化技巧
将噪声预测目标转化为对的预测,而非直接预测均值:# 伪代码示例:噪声预测网络 def forward(self, x, t): # x: 带噪样本, t: 时间步 return self.model(x, t) # 输出预测噪声简化损失函数
采用加权MSE损失,重点关注高频细节:渐进式生成理论
通过数百至数千步的微小更新保证生成质量,与GANs的单步生成形成对比。
4.1.4 与早期模型的区别
| 特性 | DDPM | GANs | VAEs |
|---|---|---|---|
| 训练稳定性 | 高 | 低(模式坍塌) | 中等 |
| 生成质量 | 极高 | 高 | 中等 |
| 采样速度 | 慢(需多步) | 快(单步) | 快(单步) |
| 理论可解释性 | 强 | 弱 | 中等 |
4.1.5 案例研究:CIFAR-10生成
原始论文中DDPM在CIFAR-10上取得:
- Inception Score (IS): 9.46
- Fréchet Inception Distance (FID): 3.17
(当时超越多数GANs模型)

图:DDPM的前向扩散与逆向去噪过程对比
数学补充:前向过程的闭式解
对于任意时间步,可以直接计算的分布:其中
