物体検出とその性能指標「SSD」と「mAP」の授業

こんにちは。ゆうせいです。

今日は、AI技術の中でも特に人気の高い「物体検出」の世界へ皆さんをご案内します。

研修でこの分野を教えるとき、一番の悩みは何でしょうか?

「複雑な図や表を見せないと説明できない……」

そう思い込んでいませんか?

実は、適切な「例え話」さえあれば、専門用語だらけのこの技術も、ラジオ番組のように言葉だけで直感的に理解してもらうことができるんです。

今日は、スライドや資料が手元になくても、生徒さんの頭の中に鮮明なイメージを作り出す、そんな説明テクニックをご紹介します。

瞬きの速さで正解を見抜く「SSD」

まずは、今回の主役である技術「SSD」についてです。

正式名称は Single Shot MultiBox Detector と言いますが、これは一旦忘れましょう。

生徒さんには、こうイメージしてもらってください。

「SSD は、一度チラッと見ただけで部屋の状況をすべて把握できる、凄腕の探偵」です。

従来のAIは、虫眼鏡で画像を端から端までじっくり見ていました。丁寧ですが、これでは時間がかかりすぎます。

対して SSD は、画像全体を「パッ」と一度(Single Shot)見るだけで、「あそこに人がいる」「ここに猫がいる」と瞬時に判断します。

「とにかく仕事が速い」

これが SSD の最大の特徴であり、メリットです。自動運転や防犯カメラなど、一瞬の判断が生死を分ける現場で重宝されている理由がここにあります。

成績表の読み方「mAP」と「IoU」

次に、このAIが優秀かどうかを判断する指標についてです。専門用語で「mAP(エム・エー・ピー)」と言います。

これも難しく考える必要はありません。シンプルに「AIのテストの平均点」と呼んでしまいましょう。

100 点満点中、何点取れたかを表す数字です。

では、この採点はどうやって行われるのでしょうか? ここで登場するのが「IoU(アイ・オー・ユー)」というルールです。これは「重なり具合」のことです。

クッキーの型抜きを想像してみてください。

  1. 生地の上に、理想の「正解の形」が描かれています。
  2. AIが「ここだ!」と型を抜きます。
  3. その「抜いた形」と「正解の形」が、どれくらいピッタリ重なっているか?

もし完全に重なれば 100 %。半分ズレていれば 50 %です。

AIの世界では、この重なりが「 50 %以上なら正解(合格)」として採点することが一般的です。もちろん、「 75 %以上じゃないとダメ」という厳しい基準(厳しい先生)で採点することもあります。

つまり、mAP とは「どれくらい上手に型抜きができたか」の平均点なのです。

「解像度」はテレビの画質と同じ

さて、ここから少し面白い事実をお話しします。

この SSD という技術、入力する画像の「解像度」によって、テストの点数が変わるんです。

実際の実験データでは、以下の2つのモデルがよく比較されます。

  • SSD300: 解像度が低い(例えるなら、昔のアナログテレビ)
  • SSD512: 解像度が高い(例えるなら、最新の4Kテレビ)

結果はどうなると思いますか?

当然、画質の良い SSD512 の方が、テストの点数が高くなります。

なぜなら、画質が粗いと、遠くにいる小さな人や、背景に紛れた小さな看板が潰れて見えなくなってしまうからです。画質が良ければ、それらをくっきりと捉えることができます。

「細かいところまで見たいなら、良いメガネ(高い解像度)が必要」ということです。

ただし、デメリットもあります。解像度を上げると、処理するデータ量が増えるため、その分だけ「判断スピード」は少し落ちてしまいますし、コンピュータのパワーも必要になります。

SSDが苦手な「魔の問題集」

最後に、SSD の弱点について触れておきましょう。

AIの学習には「問題集(データセット)」を使いますが、世の中には「COCO(ココ)」と呼ばれる、超難問の問題集が存在します。

この問題集には、豆粒のような小さな物体がたくさん写り込んでいます。

実は、SSD はこの「小さな物体」を見つけるのが少し苦手なんです。

先ほど「一度見るだけで判断する」と言いましたが、そのスピードの代償として、じっくり見ないと分からないような小さなものは見落としがちなのです。

実際に、標準的な問題集では 80 点近く取れる優秀なAIでも、この難問問題集(COCO)になると、点数がガクンと下がってしまうことがあります。

「SSD は、大きな獲物を見つけるのは得意だけど、砂浜でコンタクトレンズを探すような仕事は苦手」

そう伝えてあげると、生徒さんも納得してくれるはずです。

今日のまとめ

いかがでしたか? 難解な図表を使わなくても、言葉の選び方一つで技術の本質は伝えられます。

  1. SSD は「一目で全体を把握するスピードスター」
  2. mAP は「テストの点数」、IoU は「型抜きの重なり」
  3. 解像度 が高い(SSD512)と、小さなものも見えて点数が上がる
  4. でも、小さすぎる物体(COCOのような難問)は苦手

次回は、この知識を持って、実際に街中の映像をAIに見せたらどうなるか? というシミュレーションの話をしてみましょう。

言葉だけでイメージできた皆さんなら、きっと映像を見たときの感動もひとしおはずです。

それでは、また次の記事でお会いしましょう!

セイ・コンサルティング・グループでは新人エンジニア研修のアシスタント講師を募集しています。

投稿者プロフィール

山崎講師
山崎講師代表取締役
セイ・コンサルティング・グループ株式会社代表取締役。
岐阜県出身。
2000年創業、2004年会社設立。
IT企業向け人材育成研修歴業界歴20年以上。
すべての無駄を省いた費用対効果の高い「筋肉質」な研修を提供します!
この記事に間違い等ありましたらぜひお知らせください。

学生時代は趣味と実益を兼ねてリゾートバイトにいそしむ。長野県白馬村に始まり、志賀高原でのスキーインストラクター、沖縄石垣島、北海道トマム。高じてオーストラリアのゴールドコーストでツアーガイドなど。現在は野菜作りにはまっている。