驚きの計算マジック!ポアソンクランピングでデータに騙されない自分になろう

こんにちは。ゆうせいです。

みなさんは、普段の生活の中で不思議な偶然を感じることはありませんか。

例えば、昨日まで誰も持っていなかった珍しいスニーカーを、今日だけで三人もの人が履いているのを見かけた。

あるいは、一週間に何度も同じ誕生日の人と出会う。

そんなとき、何か特別な意味があるのではないかと感じてしまうのが人間の性ですよね。

しかし、その直感、実は脳が仕掛けた罠かもしれません。

今回は、データの集まりの中に潜むいたずらっ子、ポアソンクランピングという現象についてお話しします。

一見すると不自然な偏りに見えるものが、実は数学的に当たり前の現象だとしたら、どう感じますか。

ポアソンクランピングとは何か

ポアソンクランピングという言葉を初めて聞く方も多いでしょう。

これは、完全にランダムに発生しているはずの出来事が、なぜか一箇所にギュッと固まって発生してしまう現象を指します。

このクランピングという言葉は、英語で塊を意味するクランプから来ています。

まるで、パラパラと撒いたはずのゴマが、なぜかお皿の一箇所に集まってお団子のようになっている状態をイメージしてください。

私たちは、ランダムと聞くと、全体にきれいに、均等に散らばっている様子を想像しがちです。

しかし、本当のランダムとは、実はもっとデコボコしていて、ムラがあるものなのです。

ポアソン分布という物差し

この現象を理解するために欠かせないのが、ポアソン分布という専門用語です。

これは、ある一定の時間や範囲の中で、めったに起こらない出来事が何回発生するかを表す確率のモデルです。

高校生の皆さんに分かりやすく例えるなら、一日のうちに家の前を通り過ぎる赤いスポーツカーの数を数えるようなものです。

一日平均で3台通るとしましょう。

すると、ある日は0台の日もあれば、運悪く(あるいは運良く)一時間に3台がまとめて走ってくることもあります。

この、たまたま固まってやってくる様子を数学的に記述したものが、ポアソン分布というルールなのです。

ポアソンクランピングのメリット

この概念を知ることで、私たちは世界をより冷静に見る力が手に入ります。

  • 無駄な不安や期待を捨てられる偶然が重なったときに、不吉な予兆だ!と怯えたり、今日は絶対ツイている!とギャンブルに走ったりする失敗を防げます。
  • データの真実を見抜ける仕事や研究でグラフを見たとき、一部分にデータが集中していても、それが異常事態なのか、それとも単なる確率のゆらぎなのかを区別できるようになります。

何事も落ち着いて分析できる大人の視点を持てるようになる、ということですね。

知っておくべきデメリットと注意点

逆に、この現象を理解していないと、私たちは大きな間違いを犯してしまいます。

  • 存在しない法則を見出してしまう人間は、バラバラな点の中に無理やり星座を見つけようとする生き物です。本当はただの偶然なのに、そこに重大な原因があると思い込み、間違った対策に時間やお金を注ぎ込んでしまう可能性があります。
  • クラスター対策の誤認病気の発生や事故が特定の地域で重なったとき、このポアソンクランピングを考慮しないと、本当の汚染源がない場所を疑ってしまうという悲劇が起こりかねません。

ポアソンクランピングを計算してみよう

では、実際にどの程度の確率で出来事が重なるのか、簡単な式で見てみましょう。

例えば、ある期間に平均して1回起こる出来事が、その期間内にちょうど 0 回、つまり一度も起こらない確率は、以下のようになります。

確率 = 1 / e

ここで、e は数学で使われる特別な定数で、約 2.72 という数字です。

計算すると、確率は約 37 % になります。

つまり、平均 1 回のはずなのに、3 回に 1 回以上は一回も起こらないのです。

逆に言えば、残りの 63 % の中に、2 回や 3 回といった固まり(クランプ)が隠れていることになります。

平均値 \lambda (ラムダ)を使って、ちょうど k 回起こる確率を求める式はこう書けます。

P ( k ) = ( \lambda^k \times e^{ - \lambda } ) / k!

一見難しそうですが、要するに、平均から外れてたくさん起こることも、数学的に計算可能な範囲内なのだと理解してください。

これからの学習の指針

ポアソンクランピングを学ぶことは、統計学という大海原への第一歩です。

これから学習を深めるなら、以下のステップがおすすめです。

  1. 身近なデータのムラを探してみる雨の降る日や、テストの点数の分布など、自分の周りにあるデータの偏りを楽しんで観察してください。
  2. 統計学の基礎に触れる平均値や分散といった、データのバラつきを測る道具について調べてみましょう。
  3. 確率論を深掘りする今回紹介したポアソン分布以外にも、世の中には様々な分布があります。

偶然を味方につけるのではなく、偶然を正しく理解する。

そんな理知的な姿勢を身につけていきましょう!

セイ・コンサルティング・グループでは新人エンジニア研修のアシスタント講師を募集しています。

投稿者プロフィール

山崎講師
山崎講師代表取締役
セイ・コンサルティング・グループ株式会社代表取締役。
岐阜県出身。
2000年創業、2004年会社設立。
IT企業向け人材育成研修歴業界歴20年以上。
すべての無駄を省いた費用対効果の高い「筋肉質」な研修を提供します!
この記事に間違い等ありましたらぜひお知らせください。

学生時代は趣味と実益を兼ねてリゾートバイトにいそしむ。長野県白馬村に始まり、志賀高原でのスキーインストラクター、沖縄石垣島、北海道トマム。高じてオーストラリアのゴールドコーストでツアーガイドなど。現在は野菜作りにはまっている。