スキップコネクションの魔法!なぜAIは「遠回り」をすることで賢くなれるのか?

AIの世界をさらに一歩深く探求していきましょう!今回は、最新のAIが「賢さの限界」を突破するために発明された画期的な仕組みについてお話しします。

こんにちは。ゆうせいです。

ディープラーニングの世界では、層を深くすればするほど、つまりAIの「脳のシワ」を増やせば増やすほど、より複雑なことを理解できるようになると信じられてきました。

しかし、ある時大きな問題にぶつかったのです。「層を深くしすぎると、逆にバカになってしまう」という不思議な現象です。

この絶望的な壁を打ち破ったヒーローが、今回解説する「スキップコネクション」です。研修でもよく質問が出るこの技術、実は私たちの日常生活にも通じる意外な仕組みなんです!

重なりすぎる層が引き起こす「伝言ゲームの崩壊」

AIの学習は、前回の記事でお話しした「偏微分」を使った伝言ゲームでしたね。

しかし、層が100枚、200枚と重なると、後ろから戻ってくる「修正指示」が途中でどんどん小さくなって消えてしまうことがあります。これを専門用語で「勾配消失問題」と呼びます。

想像してみてください。あなたは100人の列の最後尾にいて、先頭の人に「もっと右に動いて!」と伝えてもらおうとしています。でも、一人ひとりが小声で伝えていくうちに、真ん中あたりでメッセージが消えてしまい、先頭には何も届かなくなってしまいました。

これでは、先頭のネジ(重み)をどう回せばいいのか分からず、学習が全く進みません。

スキップコネクションは「特急ルート」

この問題を解決するために登場したのが、スキップコネクション(残差接続)です。

やり方は驚くほどシンプルです。ある層への入力を、いくつかの層を飛び越えて(スキップして)、先の層の出力に直接足し合わせるのです。

高校生の皆さんに例えるなら、学校の先生からの指示が、担任、副担任、学級委員……と降りてくる途中で歪んでしまわないように、先生が直接あなたに「原本」をメールで送ってくれるようなものです。

これにより、以下の2つのデータが合体することになります。

  1. 途中の層で加工された「難しい特徴」
  2. スキップしてきた「加工前の生のデータ」

数式で見るスキップコネクション

本来、層を通るたびに入力 x は複雑な関数 f によって f(x) に変化します。

スキップコネクションがない場合:

出力 = f(x)

スキップコネクションがある場合:

出力 = f(x) + x

この + x というたった一項目が、AIの歴史を変えました。

なぜなら、微分をしたときに、この x のおかげで「最低でも 1 という値」が勾配として残るようになるからです。これにより、何百層あっても伝言(勾配)が途絶えることなく、最初の方の層まで届くようになりました。

偏微分の視点から見たメリットとデメリット

この技術がもたらした恩恵は計り知れません。

項目内容
メリット1000層を超えるような超深層ネットワークでも学習が可能になる
メリットネットワークが「学習する必要がない」と判断した層を実質的に無視できる
デメリット計算時に一時的に保持するデータ量が増え、メモリを消費する

「何もしないこと(入力をそのまま通すこと)」を学習するのが得意になった、というのがこの技術の面白いポイントです。

恒等写像という考え方

専門用語では、この「入力をそのまま出力する」ことを「恒等写像」と呼びます。

深いAIを作っても、もし途中の層が邪魔なら、その層の働きを \times 0 にしてしまえばいい。そうすれば x だけがスキップルートを通って先へ進みます。

この「最悪でも現状維持ができる」という安心感があるからこそ、AIは大胆に深い層へと挑戦できるようになったのです。

これからの学習の指針

スキップコネクションは、今や画像認識の王様である「ResNet」や、ChatGPTの基盤技術である「Transformer」など、あらゆる最新AIに採用されています。

もしもっと深く知りたくなったら、次のステップへ進みましょう。

  1. 「ResNet」というモデルの名前を調べて、実際の構造を見てみる。
  2. 「勾配消失」の対義語である「勾配爆発」についても調べてみる。
  3. 足し算(ResNet)ではなく、結合(DenseNet)するタイプのスキップ構造を比較してみる。

「複雑なことをするために、あえて単純な道を残しておく」というスキップコネクションの哲学。これって、私たちの仕事や勉強の進め方にも応用できそうだと思いませんか?

セイ・コンサルティング・グループでは新人エンジニア研修のアシスタント講師を募集しています。

投稿者プロフィール

山崎講師
山崎講師代表取締役
セイ・コンサルティング・グループ株式会社代表取締役。
岐阜県出身。
2000年創業、2004年会社設立。
IT企業向け人材育成研修歴業界歴20年以上。
すべての無駄を省いた費用対効果の高い「筋肉質」な研修を提供します!
この記事に間違い等ありましたらぜひお知らせください。

学生時代は趣味と実益を兼ねてリゾートバイトにいそしむ。長野県白馬村に始まり、志賀高原でのスキーインストラクター、沖縄石垣島、北海道トマム。高じてオーストラリアのゴールドコーストでツアーガイドなど。現在は野菜作りにはまっている。