【統計学入門】カイ二乗検定に「片側・両側」はあるの?
こんにちは。ゆうせいです。
新人エンジニアのみなさん、データ分析の勉強は進んでいますか?
統計学を学んでいると、「検定」という壁にぶつかることがありますよね。特に「片側検定」や「両側検定」という言葉が出てくると、どっちを使えばいいのか迷ってしまうことも多いはずです。
そこで、今回はこんな疑問にお答えします。
「カイ二乗検定にも、片側とか両側っていう考え方はあるの?」
結論から言うと、カイ二乗検定は基本的に「右片側検定」として扱われます。
「えっ、なんで?」「両側じゃダメなの?」
そんな声が聞こえてきそうですね。でも大丈夫です。なぜそうなるのか、数式をなるべく使わずに、高校生でもわかるような例え話で解説していきます。
統計アレルギーを克服するチャンスですよ!さあ、一緒に見ていきましょう。
カイ二乗検定ってなに?(ズレを測るものさし)
まず、カイ二乗検定とは何かを簡単におさらいしましょう。
これは一言で言うと、「予想と結果のズレが、偶然なのか必然なのか」を調べるための道具です。
例えば、あなたがサイコロを 回振ったとします。普通なら、どの数字もだいたい
回ずつ出るはずですよね。これが「期待値(予想)」です。
でも実際には、1が 回しか出なかったり、6が
回出たりします。これが「観測値(結果)」です。
この「予想」と「結果」のズレが、単なる偶然なのか、それとも「このサイコロ、重心がズレてるんじゃない?」と疑うべきレベルなのか。それを判定するのがカイ二乗検定なのです。
なぜ「片側」しか見ないの?
では、本題に入りましょう。なぜカイ二乗検定は基本的に「右片側検定」なのでしょうか。
これを理解するには、カイ二乗検定の「計算の仕組み」を少しだけイメージする必要があります。
ズレを「2乗」する魔法
カイ二乗検定で使う値(統計量と言います)を計算するとき、とても重要なルールがあります。それは「ズレを2乗(掛け算)する」ということです。
数式っぽく書くと、こんなイメージです。
カイ二乗値 ( 結果
予想 )
予想
ここで注目してほしいのは、( 結果 予想 )
の部分です。
数学の授業を思い出してください。マイナスの数字も、2回掛ける(2乗する)とプラスになりますよね?
- 予想より
多かった場合:
- 予想より
少なかった場合:
そうなんです!
結果が予想より多くても少なくても、計算される値は必ず「プラス」になります。つまり、カイ二乗値というのは、「ズレの大きさ」だけを表していて、プラスやマイナスといった「方向」の情報は消えてしまうのです。
ダーツの的に例えてみよう
これをダーツに例えてみましょう。
的の中心(予想)を狙って投げたとします。
- 右に
cm ズレた
- 左に
cm ズレた
どちらの場合も、「中心から cm 離れている」という事実は変わりませんよね。カイ二乗検定は、この「中心からの距離の合計」を見ているようなものです。
距離が cm ならピッタリ(ズレなし)。
距離が大きくなればなるほど、ズレが大きい(異常あり)と判断します。
このとき、グラフの左端(ズレがマイナスの領域)を見る必要はありません。なぜなら、すべてのズレは2乗されてプラス(右側)に積み上がっていくからです。
だから、私たちはグラフの「右端(ズレが極端に大きい部分)」だけを見て、「このズレはありえない大きさだ!」と判定するのです。
これが、カイ二乗検定が「右片側検定」になる理由です。
2×2のクロス集計表の場合は注意!
ただし、ここで一つだけ注意点があります。少し専門的な話になりますが、聞いてください。
「 のクロス集計表」というものをご存知でしょうか?
例えば、「男性・女性」と「商品購入あり・なし」のような、2つの項目を掛け合わせる場合です。
この特定のケースにおいてのみ、実は「比率の差の検定(Z検定)」と同じような意味を持ちます。Z検定には「両側検定」という考え方があります。
- AはBより大きいか?(片側)
- AとBには差があるか?(両側)
この場合、カイ二乗検定を行うことは、Z検定の「両側検定」を行っているのと数学的に同じ意味になることがあります。
初心者のうちは少しややこしいかもしれませんが、以下のことだけ覚えておけばOKです。
- カイ二乗検定の計算そのものは、ズレを2乗するので「右側の裾」だけを見る。
- でも、その意味合いは「違いがあるかどうか」を見ているので、感覚としては「両側検定(差があることの検定)」に近い結果を出している。
メリットとデメリットを整理しよう
この「2乗して片側だけ見る」という性質には、良い点も悪い点もあります。
メリット
- どんなズレでも検知できる予想より「多すぎる」場合も「少なすぎる」場合も、等しく「ズレ」としてカウントしてくれます。「とにかく、普通じゃないことが起きている!」という異常検知には非常に強力です。
- 計算がシンプルプラスマイナスを気にせず、すべてのズレを足し合わせることができるので、全体の傾向を一つの数字で表しやすいです。
デメリット
- 「どっちに」ズレているか分からないこれが最大の弱点です。「有意差あり(ズレてます)」という結果が出ても、それが「予想より多いから」なのか「少ないから」なのかは、検定結果の数字だけでは分かりません。必ず元のデータを見直す必要があります。
- 直感と反する場合がある「片側検定」と言われると、「片方の可能性しか調べていないの?」と不安になるかもしれません。実際は両方向のズレを合算しているのですが、言葉の響きで誤解されやすいです。
まとめ
いかがでしたか?
カイ二乗検定において「片側・両側」という議論が少し特殊な理由が見えてきたでしょうか。
最後にポイントをまとめます。
- カイ二乗検定は、ズレを2乗するので値が必ずプラスになる。
- そのため、分布の右側(値が大きいほう)だけを見る「右片側検定」を行う。
- 結果として「何らかのズレがある」ことは分かるが、「どちら向きのズレか」はデータを見て確認する必要がある。
みなさんが普段扱っているデータの「異常」を見つけるとき、このカイ二乗検定はとても役に立ちます。
今後の学習の指針
次は、実際にPythonやExcelを使って、簡単なクロス集計表のカイ二乗検定を行ってみましょう!
その際、「P値(ピーち)」という言葉が出てきます。今回学んだ「右側の面積」が、まさにこのP値につながっていきます。
手を動かして計算してみると、「あ、本当に右側しか見ていないんだ!」と実感できるはずです。
焦らず一歩ずつ、統計の世界を楽しんでいきましょう!
あなたならきっと使いこなせますよ。応援しています!
それでは、また次回の記事でお会いしましょう。
セイ・コンサルティング・グループの新人エンジニア研修のメニューへのリンク
投稿者プロフィール
- 代表取締役
-
セイ・コンサルティング・グループ株式会社代表取締役。
岐阜県出身。
2000年創業、2004年会社設立。
IT企業向け人材育成研修歴業界歴20年以上。
すべての無駄を省いた費用対効果の高い「筋肉質」な研修を提供します!
この記事に間違い等ありましたらぜひお知らせください。
最新の投稿
山崎講師2025年12月14日A/Bテストの失敗を未然に防ぐ!「データは何件必要?」に即答するための検出力分析入門
山崎講師2025年12月14日「P値だけでは不十分?」ビジネスを動かす真の指標「効果量」を直感的に理解する
山崎講師2025年12月14日「P値はデータが増えるとなぜ下がる?」新人エンジニアが陥る統計の罠と解決策
山崎講師2025年12月14日エクセルとPythonで計算結果がズレる?その驚きの原因と解決策を徹底解説