条件付き確率の罠にハマるな!ベイズの定理で読み解く逆転のロジック

こんにちは。ゆうせいです。

あなたは、検査で陽性が出たからといって、必ずしもその病気にかかっているとは限らないという話を聞いたことがありますか。

直感に反するかもしれませんが、実は確率の世界では、原因と結果をひっくり返すだけで、数字の意味が劇的に変わってしまうのです。

今回は、ビジネスや日常生活で私たちが陥りがちな思い込みを打破する、ベイズの定理についてお話しします。

難しい数式を覚える必要はありません。

一緒に頭の体操をする感覚で読み進めてみてくださいね。

そもそもベイズの定理とは何か

ベイズの定理を一言で言うなら、新しい情報が入るたびに、手持ちの確率を更新していくためのルールです。

これを理解する上で避けて通れないのが、条件付き確率という考え方です。

条件付き確率とは、あることが起きたという前提条件のもとで、別のことが起きる確率を指します。

記号では P(A|B) と書きますが、これを見ただけでアレルギー反応を起こさないでくださいね。

右側の B が前提、左側の A が知りたい結果だと捉えれば大丈夫です。

ここが重要!P(A|B)とP(B|A)は別物

研修で多くの人がつまずくポイントが、ここです。

Aという条件のときのBの確率と、Bという条件のときのAの確率は、全くの別物なのです。

例えば、次の二つの文章を比べてみてください。

  1. 犯人が現場にいた確率
  2. 現場にいた人が犯人である確率

いかがでしょうか。

1は、もしある人が犯人なら、その人が現場にいるのは当たり前(100%に近い)ですよね。

しかし、2はどうでしょう。

たまたま野次馬として現場に居合わせただけの人もいるかもしれません。

現場に100人いたとしたら、その中で本当の犯人はたった1人かもしれません。

このように、前提と結果を入れ替えると、確率は大きく変動します。

これを混同してしまうことを、専門用語で検察官の謬謬(びゅうびゅう)と呼んだりします。

恐ろしい名前ですが、要するに思い込みによるミスですね!

具体的な例で計算してみよう

もっと身近な例で考えてみましょう。

ある学校に、猫好きの人と、猫を飼っている人がいるとします。

猫好きである確率を A

猫を飼っている確率を B

とします。

ここで、猫を飼っている人は必ず猫が好きだと仮定しましょう。

このとき、猫を飼っている(B)という条件の下で猫が好き(A)である確率 P(A|B) は 100% です。

では、逆はどうでしょうか。

猫が好き(A)という条件の下で、実際に猫を飼っている(B)確率 P(B|A) はどうなるでしょう。

猫は好きだけれど、マンションの規則で飼えない人や、アレルギーで飼えない人もいますよね。

そうすると、この確率はぐっと低くなるはずです。

実際に数字を当てはめて、ベイズの定理の形に整えてみます。

ある集団で、

猫を飼っている人の割合: 10%

猫が好きな人の割合: 50%

猫を飼っている人の中で猫が好きな人の割合: 100%

このとき、猫が好きな人が実際に猫を飼っている確率は、以下の式で求められます。

猫が好きな人が猫を飼っている確率 = 猫を飼っている人の割合 \times 猫を飼っている人が猫を好きである確率 \div 猫が好きな人の割合

これを先ほどの数字で計算すると、

10% \times 100% \div 50% = 20%

となります。

100%と20%、これほどまでに差が出るのです。

前提を入れ替えるだけで、これだけ景色が変わるということに驚きませんか。

ベイズの定理を使うメリットとデメリット

この考え方をマスターすると、ビジネスの現場でも強力な武器になります。

メリット

  • 少ないデータから予測ができる従来の統計学では膨大なデータが必要でしたが、ベイズの考え方なら、今ある情報から暫定的な答えを出し、新しい情報が入るたびに修正していけます。
  • 直感のミスを防げる先ほどの例のように、思い込みで判断を下すリスクを減らし、客観的な数値で状況を判断できるようになります。

デメリット

  • 最初の設定に左右される最初に設定する確率(事前確率)が適当すぎると、結果も信頼できないものになってしまいます。
  • 計算が複雑になりがち扱う要素が増えると、手計算では追いつかなくなります。そのため、実務ではコンピューターを使った高度な計算が必要になる場面も多いです。

学びを深めるためのステップ

さて、ここまで読んでくださったあなたは、すでに確率の罠を見抜く第一歩を踏み出しています。

P(A|B)とP(B|A)は違う!

この合言葉を忘れないでください。

これからの学習指針を提案します。

  1. 日常の違和感を探すニュースや広告を見ていて、前提条件がすり替わっていないかチェックしてみてください。
  2. 条件付き確率の基礎を固める高校数学の確率の教科書をパラパラとめくってみるのが意外と近道です。
  3. 迷惑メールフィルタの仕組みを調べる実はベイズの定理は、迷惑メールを判定する技術にも使われています。身近な技術と結びつけると理解が深まりますよ。

次は、実際にエクセルなどを使って、簡単なシミュレーションをしてみるのも面白いかもしれませんね。

データの海に溺れず、論理という羅針盤を持って進んでいきましょう!

セイ・コンサルティング・グループでは新人エンジニア研修のアシスタント講師を募集しています。

投稿者プロフィール

山崎講師
山崎講師代表取締役
セイ・コンサルティング・グループ株式会社代表取締役。
岐阜県出身。
2000年創業、2004年会社設立。
IT企業向け人材育成研修歴業界歴20年以上。
すべての無駄を省いた費用対効果の高い「筋肉質」な研修を提供します!
この記事に間違い等ありましたらぜひお知らせください。

学生時代は趣味と実益を兼ねてリゾートバイトにいそしむ。長野県白馬村に始まり、志賀高原でのスキーインストラクター、沖縄石垣島、北海道トマム。高じてオーストラリアのゴールドコーストでツアーガイドなど。現在は野菜作りにはまっている。