期待値と平均値の正体とは?データに騙されないための基礎知識

こんにちは。ゆうせいです。

突然ですが、みなさんに質問です。

「平均的な年収」と「みんなが実際に稼いでいる年収」は、全く同じものだと思っていませんか?

実は、数学の世界では、平均値と期待値は似ているようでいて、現実のデータの中では「感覚的なズレ」を生むことがあります。

今日は、この不思議な関係について、誰でも納得できるように詳しく紐解いていきましょう!

期待値と平均値の違いを知っていますか?

まず、結論からお伝えします。

期待値と平均値は、数学的な定義の上では同じものを指すことが多いですが、私たちが目にするデータにおいては、異なる結果を示すことが頻繁にあります。

えっ、同じなのに違うってどういうこと?と驚かれるかもしれませんね。

その謎を解く鍵は、分母となるデータの性質に隠されています。

平均値:過去の集計結果

平均値とは、すでに手元にあるいくつかの数値をすべて合計して、その個数で割った値のことです。

学校のテストの点数でよく使われる、あのお馴染みの計算方法ですね。

例えば、3人のテスト結果が 60点、70点、80点だった場合を考えてみましょう。

平均値の計算式は次のようになります。

( 60 + 70 + 80 ) \div 3 = 70

これは、過去に起きた事実をまとめた数字に過ぎません。

期待値:未来の予測値

一方で期待値とは、これから起こるかもしれない出来事に対して、「一回あたりどれくらいの数値が見込めるか」という未来を予測するための指標です。

これを理解するために、クジ引きを例に挙げてみましょう。

10枚に1枚、1000円が当たるクジがあるとします。ハズレは0円です。

このとき、1回クジを引いたときに手に入る金額の見込み、つまり期待値は以下の式で求められます。

( 1000 \times 0.1 ) + ( 0 \times 0.9 ) = 100

この 100円 という数字こそが期待値です。

面白いのは、このクジに 100円 という賞金は存在しない点です!

0円か1000円しかないのに、期待値は 100円 になる。

これこそが、期待値が持つ「確率の重み」を考慮した特徴なのです。

なぜ平均値と期待値がズレて感じるのか

理論上、試行回数を無限に増やしていけば、平均値は期待値にどんどん近づいていきます。

しかし、現実の世界ではそう上手くいきません。

なぜなら、世の中には「外れ値」と呼ばれる、とんでもなく巨大な数値が紛れ込むからです。

億万長者が隣に座ったら?

例えば、10人の村人がいて、全員の年収が 300万円 だったとします。

この村の平均年収は当然 300万円 です。

ところが、そこへ突然、年収 100億円 の大富豪が引っ越してきたらどうなるでしょうか。

村人は11人になり、合計年収は 103億円 に跳ね上がります。

103億円 \div 11 = 約 9億3600万円

平均年収は一気に9億円を超えてしまいました!

でも、元からいた村人たちの生活は何も変わっていませんよね?

これが「平均値の罠」です。

一部の極端なデータに引っ張られることで、私たちが直感的に期待する「普通」の値と、計算上の平均値が大きく乖離してしまうのです。

メリットとデメリットを比較しよう

状況に応じて、どちらの指標を重視すべきか見極めることが大切です。

平均値を使う場面

メリット:

  • 手元のデータを単純に要約できる
  • 誰でも計算式が理解しやすい
  • 合計値を把握するのに役立つ

デメリット:

  • 飛び抜けた数値(外れ値)に非常に弱い
  • 「大多数の人が実感している値」とは限らない

期待値を使う場面

メリット:

  • ギャンブルや投資など、リスクを伴う意思決定の基準になる
  • 起こる確率まで考慮した公平な判断ができる

デメリット:

  • 正確な確率が分かっていないと計算できない
  • 一回限りの出来事では、期待値通りの結果が出ることはまずない

これからの学習の指針

平均値と期待値の違いを理解することは、データを正しく読み解くための第一歩です。

もし、発表された平均値に違和感を覚えたら、それは一部の強烈なデータが平均を引き上げている証拠かもしれません。

今後は、以下のステップで学習を深めてみてください。

  1. 中央値(ちゅうおうち)を調べるデータを順番に並べたときに、ちょうど真ん中にくる数値のことです。平均値が外れ値に引きずられているときは、この中央値の方が実感を反映していることが多いですよ。
  2. 標準偏差(ひょうじゅんへんさ)を学ぶデータがどれくらいバラついているかを示す指標です。平均値だけを見るのではなく、その周りにどれくらい数値が散らばっているかを知ることで、より深くデータを理解できます。

数字は嘘をつきませんが、数字の見せ方によって受ける印象はガラリと変わります。

騙されないためにも、常に「この数字の背景には何があるのか?」と問い続ける姿勢を持ってください!

セイ・コンサルティング・グループでは新人エンジニア研修のアシスタント講師を募集しています。

投稿者プロフィール

山崎講師
山崎講師代表取締役
セイ・コンサルティング・グループ株式会社代表取締役。
岐阜県出身。
2000年創業、2004年会社設立。
IT企業向け人材育成研修歴業界歴20年以上。
すべての無駄を省いた費用対効果の高い「筋肉質」な研修を提供します!
この記事に間違い等ありましたらぜひお知らせください。

学生時代は趣味と実益を兼ねてリゾートバイトにいそしむ。長野県白馬村に始まり、志賀高原でのスキーインストラクター、沖縄石垣島、北海道トマム。高じてオーストラリアのゴールドコーストでツアーガイドなど。現在は野菜作りにはまっている。