標準偏差を当てよう!ゲーム
この100点満点のテストの点数分布から、ばらつき具合(標準偏差)はどれでしょう?
標準偏差ってなんだろう?
1. 標準偏差とは?
標準偏差(Standard Deviation, SD)は、データが平均値からどれくらい散らばっているか(ばらついているか)を示す指標です。値が大きいほどデータが広範囲に散らばっており、小さいほどデータが平均値の周りに集中していることを意味します。
- 標準偏差が小さい: グラフの山は高く、鋭くなる。(みんな似たような値)
- 標準偏差が大きい: グラフの山は低く、なだらかに広がる。(値がバラバラ)
ゲームのコツ: グラフの「山の広がり具合」を見てください。山が「細ければ」標準偏差は小さく、「太ければ」標準偏差は大きいと推測できます。
2. 平均・分散・標準偏差の関係
標準偏差を理解するために、平均と分散も知っておくと便利です。
指標 | 何を表すか | 計算方法のイメージ |
---|---|---|
平均値 | データの中心がどこにあるか | 全データの合計 ÷ データ数 |
分散 | データの散らばり具合(2乗されている) | 各データと平均値の差(偏差)を2乗し、その平均をとる |
標準偏差 | データの散らばり具合(元の単位と同じ) | 分散の正の平方根 (√分散) |
分散は単位が「2乗」になってしまい直感的でないため、その平方根をとって単位を元に戻したものが標準偏差です。例えば、身長のデータ(cm)なら、標準偏差の単位も(cm)となり、解釈しやすくなります。
3. いろいろな分布
世の中の多くのデータは「正規分布」という、平均値(グラフの点線)を中心とした左右対称の釣鐘型の分布に従います。正規分布では、標準偏差を使ってデータが特定の範囲に収まる確率を予測できます。
- 平均 ± 1σ の範囲: 全体の約 68% のデータが含まれる(グラフのオレンジの線)
- 平均 ± 2σ の範囲: 全体の約 95% のデータが含まれる(グラフの青の線)
- 平均 ± 3σ の範囲: 全体の約 99.7% のデータが含まれる(グラフの緑の線)
このゲームでは、時々、左右非対称な(偏った)分布、非常に鋭く尖った分布、ピークが2つある分布など、様々な形の問題も出題されます。 グラフの形が綺麗な釣鐘型でなくても、標準偏差は「平均値からのばらつき具合」を表す便利な指標です。 どんな形のグラフでも、全体の広がり方に注目して答えてみましょう!