【統計学入門】カイ二乗検定に「片側・両側」はあるの?

こんにちは。ゆうせいです。

新人エンジニアのみなさん、データ分析の勉強は進んでいますか?

統計学を学んでいると、「検定」という壁にぶつかることがありますよね。特に「片側検定」や「両側検定」という言葉が出てくると、どっちを使えばいいのか迷ってしまうことも多いはずです。

そこで、今回はこんな疑問にお答えします。

「カイ二乗検定にも、片側とか両側っていう考え方はあるの?」

結論から言うと、カイ二乗検定は基本的に「右片側検定」として扱われます。

「えっ、なんで?」「両側じゃダメなの?」

そんな声が聞こえてきそうですね。でも大丈夫です。なぜそうなるのか、数式をなるべく使わずに、高校生でもわかるような例え話で解説していきます。

統計アレルギーを克服するチャンスですよ!さあ、一緒に見ていきましょう。


カイ二乗検定ってなに?(ズレを測るものさし)

まず、カイ二乗検定とは何かを簡単におさらいしましょう。

これは一言で言うと、「予想と結果のズレが、偶然なのか必然なのか」を調べるための道具です。

例えば、あなたがサイコロを 60 回振ったとします。普通なら、どの数字もだいたい 10 回ずつ出るはずですよね。これが「期待値(予想)」です。

でも実際には、1が 5 回しか出なかったり、6が 15 回出たりします。これが「観測値(結果)」です。

この「予想」と「結果」のズレが、単なる偶然なのか、それとも「このサイコロ、重心がズレてるんじゃない?」と疑うべきレベルなのか。それを判定するのがカイ二乗検定なのです。

なぜ「片側」しか見ないの?

では、本題に入りましょう。なぜカイ二乗検定は基本的に「右片側検定」なのでしょうか。

これを理解するには、カイ二乗検定の「計算の仕組み」を少しだけイメージする必要があります。

ズレを「2乗」する魔法

カイ二乗検定で使う値(統計量と言います)を計算するとき、とても重要なルールがあります。それは「ズレを2乗(掛け算)する」ということです。

数式っぽく書くと、こんなイメージです。

カイ二乗値 = ( 結果 - 予想 ) ^2 \div 予想

ここで注目してほしいのは、( 結果 - 予想 ) ^2 の部分です。

数学の授業を思い出してください。マイナスの数字も、2回掛ける(2乗する)とプラスになりますよね?

  • 予想より 5 多かった場合: 5 \times 5 = 25
  • 予想より 5 少なかった場合: -5 \times -5 = 25

そうなんです!

結果が予想より多くても少なくても、計算される値は必ず「プラス」になります。つまり、カイ二乗値というのは、「ズレの大きさ」だけを表していて、プラスやマイナスといった「方向」の情報は消えてしまうのです。

ダーツの的に例えてみよう

これをダーツに例えてみましょう。

的の中心(予想)を狙って投げたとします。

  • 右に 10 cm ズレた
  • 左に 10 cm ズレた

どちらの場合も、「中心から 10 cm 離れている」という事実は変わりませんよね。カイ二乗検定は、この「中心からの距離の合計」を見ているようなものです。

距離が 0 cm ならピッタリ(ズレなし)。

距離が大きくなればなるほど、ズレが大きい(異常あり)と判断します。

このとき、グラフの左端(ズレがマイナスの領域)を見る必要はありません。なぜなら、すべてのズレは2乗されてプラス(右側)に積み上がっていくからです。

だから、私たちはグラフの「右端(ズレが極端に大きい部分)」だけを見て、「このズレはありえない大きさだ!」と判定するのです。

これが、カイ二乗検定が「右片側検定」になる理由です。


2×2のクロス集計表の場合は注意!

ただし、ここで一つだけ注意点があります。少し専門的な話になりますが、聞いてください。

2 \times 2 のクロス集計表」というものをご存知でしょうか?

例えば、「男性・女性」と「商品購入あり・なし」のような、2つの項目を掛け合わせる場合です。

この特定のケースにおいてのみ、実は「比率の差の検定(Z検定)」と同じような意味を持ちます。Z検定には「両側検定」という考え方があります。

  • AはBより大きいか?(片側)
  • AとBには差があるか?(両側)

この場合、カイ二乗検定を行うことは、Z検定の「両側検定」を行っているのと数学的に同じ意味になることがあります。

初心者のうちは少しややこしいかもしれませんが、以下のことだけ覚えておけばOKです。

  • カイ二乗検定の計算そのものは、ズレを2乗するので「右側の裾」だけを見る。
  • でも、その意味合いは「違いがあるかどうか」を見ているので、感覚としては「両側検定(差があることの検定)」に近い結果を出している。

メリットとデメリットを整理しよう

この「2乗して片側だけ見る」という性質には、良い点も悪い点もあります。

メリット

  1. どんなズレでも検知できる予想より「多すぎる」場合も「少なすぎる」場合も、等しく「ズレ」としてカウントしてくれます。「とにかく、普通じゃないことが起きている!」という異常検知には非常に強力です。
  2. 計算がシンプルプラスマイナスを気にせず、すべてのズレを足し合わせることができるので、全体の傾向を一つの数字で表しやすいです。

デメリット

  1. 「どっちに」ズレているか分からないこれが最大の弱点です。「有意差あり(ズレてます)」という結果が出ても、それが「予想より多いから」なのか「少ないから」なのかは、検定結果の数字だけでは分かりません。必ず元のデータを見直す必要があります。
  2. 直感と反する場合がある「片側検定」と言われると、「片方の可能性しか調べていないの?」と不安になるかもしれません。実際は両方向のズレを合算しているのですが、言葉の響きで誤解されやすいです。

まとめ

いかがでしたか?

カイ二乗検定において「片側・両側」という議論が少し特殊な理由が見えてきたでしょうか。

最後にポイントをまとめます。

  • カイ二乗検定は、ズレを2乗するので値が必ずプラスになる。
  • そのため、分布の右側(値が大きいほう)だけを見る「右片側検定」を行う。
  • 結果として「何らかのズレがある」ことは分かるが、「どちら向きのズレか」はデータを見て確認する必要がある。

みなさんが普段扱っているデータの「異常」を見つけるとき、このカイ二乗検定はとても役に立ちます。

今後の学習の指針

次は、実際にPythonやExcelを使って、簡単なクロス集計表のカイ二乗検定を行ってみましょう!

その際、「P値(ピーち)」という言葉が出てきます。今回学んだ「右側の面積」が、まさにこのP値につながっていきます。

手を動かして計算してみると、「あ、本当に右側しか見ていないんだ!」と実感できるはずです。

焦らず一歩ずつ、統計の世界を楽しんでいきましょう!

あなたならきっと使いこなせますよ。応援しています!

それでは、また次回の記事でお会いしましょう。

セイ・コンサルティング・グループの新人エンジニア研修のメニューへのリンク

投稿者プロフィール

山崎講師
山崎講師代表取締役
セイ・コンサルティング・グループ株式会社代表取締役。
岐阜県出身。
2000年創業、2004年会社設立。
IT企業向け人材育成研修歴業界歴20年以上。
すべての無駄を省いた費用対効果の高い「筋肉質」な研修を提供します!
この記事に間違い等ありましたらぜひお知らせください。