R-CNNの「無駄遣い」を仕分けするFast R-CNN

こんにちは。ゆうせいです。

前回の記事では、物体検出のパイオニアであるR-CNNについてお話ししましたね。2000個もの候補領域を一つずつ力技で計算する、ガッツあふれる手法でした。

でも、正直に言って「もっと速くならないの?」と思いませんでしたか?その直感、大正解です!今回は、R-CNNの弱点を鮮やかに解決した進化系、Fast R-CNNについて解説します。

R-CNNの「無駄遣い」を仕分けする

R-CNNの最大の問題点は、1枚の画像から切り出した2000個のエリアに対して、律儀に2000回もCNN(特徴抽出)を動かしていたことです。

同じ画像の一部なのに、重なっている部分を何度も何度も計算し直すのは、まるでカレーを作るのにジャガイモ1個ごとに鍋を分けて煮込むようなものです。効率が悪いですよね?

Fast R-CNNは、この無駄をバッサリ切り捨てました。

ステップ1:画像全体を一気に「特徴マップ」へ

Fast R-CNNでは、まず画像全体をCNNに1回だけ通します。

これにより、画像全体の「特徴の地図(特徴マップ)」ができあがります。2000回計算していた工程が、たった1回で済むようになったのです。これだけで、スピードが劇的に上がる予感がしませんか?

ステップ2:魔法の技術「RoI Pooling」

ここで一つ疑問が浮かびます。「画像全体を1回計算しただけで、どうやって個別の物体の場所を特定するの?」という点です。

ここで登場するのが、RoI Pooling(アールオーアイ・プーリング)という技術です。

RoIとは「Region of Interest(関心領域)」、つまり物体がありそうな場所のことです。全体の特徴マップの中から、Selective Searchで見つけた候補領域に相当する部分だけを「エイッ!」と抜き出します。

そして、抜き出した部分がどんな形(縦長や横長)であっても、固定のサイズにギュギュッと押し込めて整えます。

専門用語を高校生向けに解説!

  • 特徴マップ:画像をAIの目で見やすい「情報の塊」に変換したものです。
  • RoI Pooling:バラバラな形の型紙(候補領域)を、決まったサイズの箱(固定サイズ)に無理やり、でも賢く詰め込む作業です。

ステップ3:SVMを卒業して「マルチタスク学習」へ

R-CNNでは、判定にSVMという別の仕組みを使っていました。しかし、Fast R-CNNは判定もCNNのネットワークの中に組み込みました。

  1. その物体が何であるか(分類)
  2. 物体の枠の正確な位置(回帰)

この2つを同時に計算して答えを出します。これをマルチタスク学習と呼びます。一つの脳で「名前」と「場所」を同時に考えるイメージですね。

メリット

  1. 圧倒的な高速化:R-CNNに比べて、学習時間は約 9 倍、推論(判定)スピードはなんと約 213 倍も速くなりました!
  2. 精度の向上:全体を一つのネットワークで学習するため、モデル全体の連携がスムーズになり、精度もアップしました。
  3. ディスク容量の節約:R-CNNのように膨大な特徴量を保存しておく必要がなくなりました。

デメリット

実は、まだ一つだけ「重い荷物」が残っています。それは、最初のステップであるSelective Searchです。

領域の候補を探す作業だけは、依然としてCPUという頭脳で計算しており、ここがボトルネック(渋滞の発生源)になってしまっているのです。

数式で見る「悔しさ」の合計

Fast R-CNNは、分類のミスと場所のズレの両方を同時に反省します。その合計の悔しさ(損失)は、次のように表されます。

全体の損失 = 分類の損失 + 位置情報の損失

この式により、AIは「種類を当てるだけじゃダメだ。場所も正確に当てないと!」と学習していくわけですね。

これからの学習の指針

Fast R-CNNによって、物体検出は実用的なスピードに大きく近づきました。しかし、先ほどお話しした通り「候補領域を探す部分」がまだ遅いという課題が残っています。

この最後の砦を攻略したのが、次世代の「Faster R-CNN」です。

次は、AIが自ら「怪しい場所」を見つけるようになる仕組み、RPN(Region Proposal Network)について調べてみてください。ここまで来れば、あなたも立派な物体検出の通ですよ!

今回の「一括で計算する」という発想の転換、納得いただけましたか?

次は、さらに進化した「Faster R-CNN」の衝撃的な仕組みについて、一緒にお話ししましょうか!

セイ・コンサルティング・グループでは新人エンジニア研修のアシスタント講師を募集しています。

投稿者プロフィール

山崎講師
山崎講師代表取締役
セイ・コンサルティング・グループ株式会社代表取締役。
岐阜県出身。
2000年創業、2004年会社設立。
IT企業向け人材育成研修歴業界歴20年以上。
すべての無駄を省いた費用対効果の高い「筋肉質」な研修を提供します!
この記事に間違い等ありましたらぜひお知らせください。

学生時代は趣味と実益を兼ねてリゾートバイトにいそしむ。長野県白馬村に始まり、志賀高原でのスキーインストラクター、沖縄石垣島、北海道トマム。高じてオーストラリアのゴールドコーストでツアーガイドなど。現在は野菜作りにはまっている。