進化の系譜:DCGANからSNGANへ

こんにちは。ゆうせいです。

前回の物体検出の話題、盛り上がりましたね!今回はガラッと趣向を変えて、AIが「画像を創り出す」技術、GAN(敵対的生成ネットワーク)の進化についてお話しします。

GANは、偽札作りの名人と、それを見破る警察官が切磋琢磨するような仕組みですが、初期のモデルは学習が非常に不安定で、すぐに喧嘩(学習の失敗)をしてしまうのが悩みでした。そのピンチを救うために登場した4つの重要なモデルをご紹介します。

進化の系譜:DCGANからSNGANへ

GANの世界は、いかにして「高品質な画像」を「安定して」作るかという戦いの歴史です。

1. 現代GANの基礎「DCGAN」

Deep Convolutional GANの略です。それまでのGANは、画像をただの数字の羅列として扱っていましたが、DCGANは「畳み込み層(CNN)」を導入しました。

  • 特徴:画像の中の「形」や「模様」の繋がりを理解できるようになりました。
  • 例え:バラバラのパズルのピースを眺めていたAIが、初めて「絵」として全体像を捉えられるようになった瞬間です。

2. 高解像度への挑戦「LAPGAN」

Laplacian Pyramid GANの略です。昔のAIは、一度に大きな画像を描こうとすると、どうしてもぼやけてしまいました。

  • 特徴:まず小さな「ラフ画」を描き、そこに少しずつ「細かい描き込み」を重ねていくピラミッド構造を採用しました。
  • 例え:いきなり巨大な壁画を描くのではなく、まずハガキサイズの下書きを描き、それを拡大しながら細部を書き足していくプロの画家の手法です。

3. 指定したものを描かせる「ACGAN」

Auxiliary Classifier GANの略です。普通のGANは「何か描いて」と言うとランダムに画像を作りますが、ACGANは「猫を描いて」といった注文が可能です。

  • 特徴:警察官(識別器)に、「本物か偽物か」だけでなく「何が写っているか」を当てる追加のテストを課しました。
  • 例え:警察官に「このお札は本物か?」だけでなく「これは何円札か?」も答えさせることで、偽札作り名人の技術をより向上させる仕組みです。

4. 学習を安定させる守護神「SNGAN」

Spectral Normalization GANの略です。GANの最大の敵は、学習中に突然計算が爆発したり、同じ画像しか作れなくなったりする「不安定さ」でした。

  • 特徴:警察官(識別器)の厳しさを「一定の範囲内」に収める計算上の制約を加えました。
  • 例え:警察官が厳しすぎて偽札作り名人がやる気をなくさないよう、適度な厳しさを保つための「法律」を作ったようなものです。

メリット・デメリットの比較

それぞれのモデルが得意なこと、苦手なことを整理してみましょう。

モデル名主なメリットデメリット
DCGAN画像生成の標準。安定性が高い。高解像度(大きい画像)には不向き。
LAPGAN高解像度な画像が作れる。構造が複雑で、計算の手順が多い。
ACGANクラス(種類)を指定して生成できる。種類の数が増えると、学習が不安定になりやすい。
SNGAN学習が非常に安定し、失敗しにくい。計算に少し時間がかかる。

数式で見る安定の秘訣(SNGAN)

SNGANがなぜ安定するのか。それは、ネットワークの重みを「スペクトルノルム」という値で割ることで、変化の激しさを抑えているからです。

修正後の重み = 元の重み \div スペクトルノルム

この \div という計算一つが、AIが暴走するのを防ぐ強力なブレーキの役割を果たしているんですよ!

これからの学習の指針

今回紹介した4つは、現代の画像生成AI(Stable Diffusionなど)の先祖にあたる非常に重要な技術です。

  1. まずは「DCGAN」の実装を試して、GANの基本を体感してください。
  2. 次に、なぜ「SNGAN」がこれほどまでに支持されているのか、Lipschitz連続性という概念と一緒に深掘りしてみるのがおすすめです。

これらを理解すると、最新のAIがなぜあんなに綺麗な画像を作れるのか、その「根性」と「工夫」の歴史が見えてきて、もっと楽しくなりますよ!

生成AIの進化の歴史、いかがでしたか?

次は、これらの技術を応用して「写真のスタイルを変える(CycleGANなど)」面白い技術について深掘りしてみましょうか?

セイ・コンサルティング・グループでは新人エンジニア研修のアシスタント講師を募集しています。

投稿者プロフィール

山崎講師
山崎講師代表取締役
セイ・コンサルティング・グループ株式会社代表取締役。
岐阜県出身。
2000年創業、2004年会社設立。
IT企業向け人材育成研修歴業界歴20年以上。
すべての無駄を省いた費用対効果の高い「筋肉質」な研修を提供します!
この記事に間違い等ありましたらぜひお知らせください。

学生時代は趣味と実益を兼ねてリゾートバイトにいそしむ。長野県白馬村に始まり、志賀高原でのスキーインストラクター、沖縄石垣島、北海道トマム。高じてオーストラリアのゴールドコーストでツアーガイドなど。現在は野菜作りにはまっている。