「CNNモデルを時系列で整理!LeNetからEfficientNetまでの進化と違い・語源・覚え方を完全ガイド」

こんにちは。ゆうせいです。

ディープラーニングの分野では、さまざまな画像認識モデル(CNN=畳み込みニューラルネットワーク)が登場し、どんどん進化してきました。

「ResNetとGoogLeNetってどっちが新しいの?」
「VGGっていつ出たんだっけ?」
「MobileNetやDenseNetは何が特徴?」

こうした疑問を持つ方のために、有名なCNNモデルを「時系列」で整理しながら、特徴・語源・覚え方まで丁寧に解説していきます!


時系列で見るCNNモデルの進化表

モデル名特徴語源・覚え方
1998LeNet-5初期のCNN。手書き数字認識に使用。LeCun(開発者)+ Net → 「CNNの元祖」
2012AlexNetReLU導入。ImageNetで圧勝。開発者Alex Krizhevskyの名前
2014VGGNet単純で深い。全て3×3畳み込み。Oxford大学のVisual Geometry Group(VGG)→「きれい好きのミニマリスト」
2014GoogLeNet(Inception v1)複数の畳み込みサイズを並列実行Google + LeNet → 「多視点の万能型」
2015ResNet残差接続で超深層ネットでも学習可Residual Network → 「ショートカットする努力家」
2016DenseNet各層がすべての前の層とつながるDense(密) + Net → 「情報共有マニア」
2017MobileNet軽量モデル。スマホで使えるMobile + Net → 「スマホ用スリム型」
2019EfficientNet精度と効率の最適バランスEfficient(効率的) + Net → 「コスパ最強の優等生」

それぞれのモデルを詳しく見ていこう!


① LeNet-5(1998年)

特徴:

  • CNNの原型。5層程度の浅いネットワーク。
  • 主に手書き数字の認識(MNIST)で使われた。

覚え方:

ディープラーニング界の「そろばん」
原始的だけど基礎を作ったモデル。


② AlexNet(2012年)

特徴:

  • ReLUを導入して勾配消失問題を回避。
  • ImageNetコンテストで大差で優勝。
  • ドロップアウトを初採用。

覚え方:

「革命児」的存在
ディープラーニングブームを作ったパイオニア。


③ VGGNet(2014年)

特徴:

  • すべての畳み込みを3×3で統一。
  • 非常にシンプルで扱いやすい構造。

覚え方:

「無駄を嫌う几帳面」な人
「何でも3×3にそろえちゃう」性格。


④ GoogLeNet / Inception v1(2014年)

特徴:

  • Inception Moduleを導入。1×1, 3×3, 5×5の畳み込みを並列実行。
  • パラメータ数を抑えつつ高性能。

覚え方:

「同時にいろんな角度から見る天才」
複眼的に物事を見るタイプ。


⑤ ResNet(2015年)

特徴:

  • 残差学習(Residual Learning)を導入。
  • 152層もの超深層ネットワークが学習可能に。

覚え方:

「最短ルートを見つける努力家」
ショートカットで効率よく学ぶタイプ。


⑥ DenseNet(2016年)

特徴:

  • 各層が前のすべての層と接続(密結合)。
  • 情報伝播が豊かで、無駄な学習が減る。

覚え方:

「グループワーク大好き」な生徒
みんなと連絡取りながら学ぶスタイル。


⑦ MobileNet(2017年)

特徴:

  • Depthwise Separable Convolutionで軽量化。
  • モバイル端末向けのCNN。

覚え方:

「荷物が少ない旅行上手」
必要最低限のものだけで高パフォーマンス。


⑧ EfficientNet(2019年)

特徴:

  • Compound Scalingで「深さ・幅・解像度」を同時にスケーリング。
  • 高精度で軽量な万能型。

覚え方:

「バランス型の天才」
学習時間、ノート量、記憶力…すべてバランスよく育てる。


最後に:ImageNetの役割を再確認!

ImageNet(2009年〜)

  • CNNモデルを学習・評価するための「画像の問題集」
  • クラス数:1,000以上
  • 枚数:1,400万枚以上

覚え方:

「模試のデータベース」
モデルの成績を測るために欠かせない存在!


全体の進化をビジュアルで理解!

LeNet ──► AlexNet ──► VGG ──► GoogLeNet ──► ResNet ──► DenseNet ──► MobileNet ──► EfficientNet
↓
    (ImageNet:全モデルの共通試験)


今後の学習の指針

次は以下の点を深掘りしてみましょう!

  • 各モデルのアーキテクチャを図で比較
  • ResNetやDenseNetの接続構造を手書きして理解
  • モデルサイズと精度の関係をグラフ化してみる
  • PyTorchやKerasで実際に動かして精度比較する
  • 最近のモデル(Vision Transformer、ConvNeXtなど)にも挑戦!

これらを段階的に学ぶことで、モデル選定やカスタマイズもできるようになりますよ!

生成AI研修のおすすめメニュー

投稿者プロフィール

山崎講師
山崎講師代表取締役
セイ・コンサルティング・グループ株式会社代表取締役。
岐阜県出身。
2000年創業、2004年会社設立。
IT企業向け人材育成研修歴業界歴20年以上。
すべての無駄を省いた費用対効果の高い「筋肉質」な研修を提供します!
この記事に間違い等ありましたらぜひお知らせください。