Skip to content

扩散模型

约 267 字小于 1 分钟

LLM

2026-03-27

  • VAE
  • Flow-based
  • diffusion model
  • GAN

Diffusion Model 是什么

Diffusion Model 扩散模型是一种“对原始数据逐步添加噪声,再学习如何一步一步去掉噪声还原数据”的生成模型。

扩散模型的核心思想是,学习基于一个图生成另一个图太困难,而学习一个图到另一个图的差别较为容易,所以扩散模型不直接生成复杂的数据,而是将任务分解为“从纯噪声中,逐步去噪恢复结构”的子问题。

扩散模型本质上是,学习从噪声 → 数据分布的随机动态系统。

零零散散

影像生成模型本质上的共同目标

在一个 distribution 上采样,经过 network 得到一个 distribution,这个distribution和 Real Image 的 distribution 越接近越好。

这也是 diffusion model 训练的目标。

如何训练 Noise Predictor

    创造训练数据
    Text-to-Image

Stable Diffusion

Text Encoder, Generation Model, Decoder

训练

encoder-decoer

U-net

FID

CLIP