「CNNモデルを時系列で整理!LeNetからEfficientNetまでの進化と違い・語源・覚え方を完全ガイド」

こんにちは。ゆうせいです。
ディープラーニングの分野では、さまざまな画像認識モデル(CNN=畳み込みニューラルネットワーク)が登場し、どんどん進化してきました。
「ResNetとGoogLeNetってどっちが新しいの?」
「VGGっていつ出たんだっけ?」
「MobileNetやDenseNetは何が特徴?」
こうした疑問を持つ方のために、有名なCNNモデルを「時系列」で整理しながら、特徴・語源・覚え方まで丁寧に解説していきます!
時系列で見るCNNモデルの進化表
年 | モデル名 | 特徴 | 語源・覚え方 |
---|---|---|---|
1998 | LeNet-5 | 初期のCNN。手書き数字認識に使用。 | LeCun(開発者)+ Net → 「CNNの元祖」 |
2012 | AlexNet | ReLU導入。ImageNetで圧勝。 | 開発者Alex Krizhevskyの名前 |
2014 | VGGNet | 単純で深い。全て3×3畳み込み。 | Oxford大学のVisual Geometry Group(VGG)→「きれい好きのミニマリスト」 |
2014 | GoogLeNet(Inception v1) | 複数の畳み込みサイズを並列実行 | Google + LeNet → 「多視点の万能型」 |
2015 | ResNet | 残差接続で超深層ネットでも学習可 | Residual Network → 「ショートカットする努力家」 |
2016 | DenseNet | 各層がすべての前の層とつながる | Dense(密) + Net → 「情報共有マニア」 |
2017 | MobileNet | 軽量モデル。スマホで使える | Mobile + Net → 「スマホ用スリム型」 |
2019 | EfficientNet | 精度と効率の最適バランス | Efficient(効率的) + Net → 「コスパ最強の優等生」 |
それぞれのモデルを詳しく見ていこう!
① LeNet-5(1998年)
特徴:
- CNNの原型。5層程度の浅いネットワーク。
- 主に手書き数字の認識(MNIST)で使われた。
覚え方:
ディープラーニング界の「そろばん」
原始的だけど基礎を作ったモデル。
② AlexNet(2012年)
特徴:
- ReLUを導入して勾配消失問題を回避。
- ImageNetコンテストで大差で優勝。
- ドロップアウトを初採用。
覚え方:
「革命児」的存在
ディープラーニングブームを作ったパイオニア。
③ VGGNet(2014年)
特徴:
- すべての畳み込みを3×3で統一。
- 非常にシンプルで扱いやすい構造。
覚え方:
「無駄を嫌う几帳面」な人
「何でも3×3にそろえちゃう」性格。
④ GoogLeNet / Inception v1(2014年)
特徴:
- Inception Moduleを導入。1×1, 3×3, 5×5の畳み込みを並列実行。
- パラメータ数を抑えつつ高性能。
覚え方:
「同時にいろんな角度から見る天才」
複眼的に物事を見るタイプ。
⑤ ResNet(2015年)
特徴:
- 残差学習(Residual Learning)を導入。
- 152層もの超深層ネットワークが学習可能に。
覚え方:
「最短ルートを見つける努力家」
ショートカットで効率よく学ぶタイプ。
⑥ DenseNet(2016年)
特徴:
- 各層が前のすべての層と接続(密結合)。
- 情報伝播が豊かで、無駄な学習が減る。
覚え方:
「グループワーク大好き」な生徒
みんなと連絡取りながら学ぶスタイル。
⑦ MobileNet(2017年)
特徴:
- Depthwise Separable Convolutionで軽量化。
- モバイル端末向けのCNN。
覚え方:
「荷物が少ない旅行上手」
必要最低限のものだけで高パフォーマンス。
⑧ EfficientNet(2019年)
特徴:
- Compound Scalingで「深さ・幅・解像度」を同時にスケーリング。
- 高精度で軽量な万能型。
覚え方:
「バランス型の天才」
学習時間、ノート量、記憶力…すべてバランスよく育てる。
最後に:ImageNetの役割を再確認!
ImageNet(2009年〜)
- CNNモデルを学習・評価するための「画像の問題集」
- クラス数:1,000以上
- 枚数:1,400万枚以上
覚え方:
「模試のデータベース」
モデルの成績を測るために欠かせない存在!
全体の進化をビジュアルで理解!
LeNet ──► AlexNet ──► VGG ──► GoogLeNet ──► ResNet ──► DenseNet ──► MobileNet ──► EfficientNet
↓
(ImageNet:全モデルの共通試験)
今後の学習の指針
次は以下の点を深掘りしてみましょう!
- 各モデルのアーキテクチャを図で比較
- ResNetやDenseNetの接続構造を手書きして理解
- モデルサイズと精度の関係をグラフ化してみる
- PyTorchやKerasで実際に動かして精度比較する
- 最近のモデル(Vision Transformer、ConvNeXtなど)にも挑戦!
これらを段階的に学ぶことで、モデル選定やカスタマイズもできるようになりますよ!
生成AI研修のおすすめメニュー
投稿者プロフィール
