カイ二乗検定チャレンジ
~2つの変数に関連はあるか?~
この2つの変数に、統計的に意味のある「関連」はあると思いますか?
統計的結論:
わかる!カイ二乗(χ²)検定のキホン
このゲームは、クロス集計表のデータを見て「2つの項目(変数)が互いに関連しているか、それとも無関係(独立)か」を判断する練習です。この手法を「カイ二乗(χ²)検定」の「独立性の検定」と呼びます。
帰無仮説 vs 対立仮説
カイ二乗検定では、次のような仮説を立てます。
- 帰無仮説 (H₀): 「2つの変数に関連はない(独立である)」。基本の立場。
- 対立仮説 (H₁): 「2つの変数に関連がある(独立ではない)」。証明したい仮説。
まず「関連はない」と仮定し、もしそうなら観測されたデータの構成比がどれだけ珍しいかを確率(p値)で評価します。
期待度数とカイ二乗値
カイ二乗検定では、まず「もし2つの変数が完全に無関係だったら、各マス(セル)の人数(度数)はどうなるか?」を計算します。これを「期待度数」と呼びます。 そして、実際に観測された「観測度数」と「期待度数」のズレの大きさを、カイ二乗値 (χ²値) という1つの数値で表します。この値が大きいほど、「ズレが大きい = 関連がありそう」と考えられます。
結論の出し方:p値と有意水準 α=0.05
p値は「もし本当に2つの変数が無関係だとしたら、観測されたデータ以上にズレが大きくなる確率」を示します。
- p値 < 0.05: 偶然では5%未満でしか起こらない珍しいズレ。→ 帰無仮説を棄却し、「統計的に有意な関連がある」と結論。
- p値 ≧ 0.05: 偶然でも起こりうる範囲のズレ。→ 帰無仮説は棄却できず、「統計的に有意な関連があるとは言えない」と結論。
ゲームでは、表の数値とグラフの「比率」に注目して、2つのグループで傾向が違うかどうかを見抜くのがコツです!