拡散モデル (Diffusion Model) インタラクティブ解説

Stable DiffusionやMidjourneyなどの画像生成AIは、どのようにして無から画像を「創造」するのでしょうか?その秘密は「一度壊してから、直し方を学ぶ」という拡散モデルのアイデアにあります。

元画像 (t=0)

現在の画像 (t)

1. フォワードプロセス (壊す過程)

まず、元画像に少しずつランダムなノイズを加えていきます。このステップを何百回も繰り返すと、画像は最終的にただのノイズになります。

スライダーを右に動かすか、「自動デモ開始」ボタンを押して、画像が徐々にノイズに変わっていく様子(拡散していく様子)を見てみましょう。

2. リバースプロセス (創る過程)

ここがAIの出番です。AIの目的は、ノイズが加えられた画像を見て、「どのようなノイズが加えられたか」を予測することです。この「ノイズ予測」を完璧にマスターするように学習します。

スライダーを左に動かすか、「自動デモ開始」ボタンを押して、AIがノイズを取り除いて画像を復元する様子をシミュレーションしてみましょう。