相関係数を当てよう!ゲーム
この散布図のデータ間の関係の強さ(相関係数)はどれでしょう?
相関係数と回帰係数ってなんだろう?
1. 相関係数(ゲームモード1)
相関係数は、2つのデータの「関係の強さ」と「方向」を1つの数値で表したものです。データがどれだけ直線に近い形で並んでいるかを示します。
値は必ず -1 から +1 の間に収まります。
- +1に近い (例: 0.9): 強い正の相関。点がほぼ右上がりの一直線に並ぶ。
- -1に近い (例: -0.8): 強い負の相関。点がほぼ右下がりの一直線に並ぶ。
- 0に近い (例: 0.1, -0.2): ほとんど相関がない。点の散らばりが大きく、直線的な関係が見られない。
2. 回帰係数(ゲームモード2)
回帰係数は、グラフにおける「直線の傾き」です。片方のデータ(X)が1増えたときに、もう片方のデータ(Y)がどれだけ変化するかを予測するための数値です。
値はマイナス無限大からプラス無限大まで、どんな値も取り得ます。
- 値がプラス: Xが増えるとYも増える(右上がりのグラフ)
- 値がマイナス: Xが増えるとYは減る(右下がりのグラフ)
- 値の大きさ: 傾きの急さを表す。
2.5
は0.5
より急な傾き。
重要!相関係数と回帰係数の違い
この2つは似ていますが、役割が全く異なります。ゲームでその違いを体感してみましょう!
相関係数 (関係の強さ) | 回帰係数 (傾き) | |
---|---|---|
目的 | 関係性の測定 (どれくらい直線的?) | 予測 (Xが1増えたらYは?) |
値の範囲 | -1 ~ +1 | -∞ ~ +∞ |
単位の影響 | 受けない (無次元) | 受ける (例: cm/kg) |
ゲームのコツ | グラフの点のまとまり具合(ばらつき)を見る | グラフの傾きの急さを見る |
例えば、「身長(cm)」と「体重(kg)」のデータで回帰係数を計算した後、身長を「メートル(m)」に変えて計算し直すと、回帰係数の値は大きく変わります。しかし、相関係数はどちらの単位で計算しても全く同じ値になります。これが「単位の影響」です。