積分で面積を計算?P値の正体と「片側・両側」の謎を解き明かそう
こんにちは。ゆうせいです。
P値の正体、それはまさに「確率分布というグラフの、端っこの部分の面積」なんです。
今日は、その鋭い気づきをさらに深掘りして、「片側の面積」と「両側の面積」ってどう使い分けるの?という疑問にお答えしましょう。ここが分かると、統計の世界がもっとクリアに見えてきますよ。
面積を求める=確率を求める
前回のおさらいになりますが、統計学では「積分」を使ってグラフの下側の面積を計算します。
グラフ全体の面積は (つまり100%)になるように作られています。
その中で、極端な値が出る部分(グラフの裾野の部分)の面積を計算したものがP値です。
数式風に書くなら、こうなります。
P値 積分で求めた端っこの面積
これが、偶然起こる確率を表しているわけですね。
片側と両側、どっちの面積を使えばいいの?
ここで新たな疑問が浮かびます。「右側の端っこだけ見るの?それとも左右両方の端っこを見るの?」
これを専門用語で「片側検定」と「両側検定」と言います。それぞれ解説しましょう。
両側検定(左右両方の面積を見る)
これは、「とにかく差があるかどうか」を知りたいときに使います。
たとえば、「新しい薬Aは、従来の薬Bと効果が違うか?」という場合です。
めちゃくちゃ効くかもしれないし、逆に全然効かない(悪化する)かもしれません。「良い方向」か「悪い方向」かに関わらず、「普通とは違う」ことを見つけたいのです。
このときは、グラフの右端(すごく効く)と左端(すごく効かない)の両方の面積を合計してP値を計算します。
P値 右側の面積
左側の面積
片側検定(片方の面積だけ見る)
こちらは、「特定の方向に差があるか」を知りたいときに使います。
たとえば、「新しい薬Aは、従来の薬Bより優れているか?」という場合です。
「薬Bより悪い」という結果には興味がありません。「良くなっているかどうか」だけを確認したいのです。
このときは、グラフの片側(たとえば右端だけ)の面積を計算します。
P値 片側の面積
メリットとデメリットで使い分けよう
じゃあ、いつも片側検定でいいんじゃない?と思うかもしれません。でも、それぞれに良し悪しがあるんです。
片側検定のメリット・デメリット
メリットは、「差を見つけやすい」ことです。
同じ有意水準(たとえば5%)を使う場合、片側検定なら片方の端だけで5%の面積を使えます。つまり、ハードルが少し下がるので、「効果あり」と言いやすくなるのです。
デメリットは、「逆方向の変化を見逃す」ことです。
もし薬が「劇的に悪化させる」ものだったとしても、片側検定では「効果なし」と判定されてしまい、危険を見落とす可能性があります。これは怖いですよね。
両側検定のメリット・デメリット
メリットは、「慎重で安全」なことです。
どちらの方向に転んでも「差」を検知できます。学術論文や一般的な分析では、こちらを使うのが基本ルールとされています。
デメリットは、「差があることを証明するハードルが高い」ことです。
有意水準5%の場合、左右に2.5%ずつ分け合うことになります。
片側の面積 有意水準
2
つまり、より極端な結果が出ないと「意味がある差」として認めてもらえないのです。
今後の学習の指針
P値が「積分の面積」であり、それが「片側」か「両側」かによって意味合いが変わることが理解できたでしょうか?
面積を半分にするのか、そのまま使うのか。この違いだけで結論が変わってしまうこともあるので、統計の世界は奥が深いですね。
次は、実際にこの面積計算の元となる「正規分布」というグラフの形について学んでみてはいかがでしょうか?この山の形を知れば、積分のイメージがもっと鮮明になりますよ。
焦らず、面積のイメージを持って統計を楽しんでいきましょう!
片側検定は合格しやすい?数字で見る「ハードルの高さ」の違い
こんにちは。ゆうせいです。
前回の話で、P値は面積だということがわかりましたね。
では、面積の取り方(片側か両側か)を変えるだけで、どれくらい判定の結果が変わってしまうのでしょうか?
実は、具体的な数字で見ると、そのハードルの高さの違いに驚くかもしれません。
今回は、統計学で最もよく使われる「標準正規分布」というグラフを例にして、その違いをハッキリと数字で見てみましょう。これを知ると、なぜ学術論文で「両側検定」が推奨されるのか、その理由が痛いほどよくわかりますよ!
共通のルール:有意水準は5%
比較をするために、まずは共通のルールを決めましょう。
今回は、統計検定で最も一般的な基準である「有意水準5%」を使います。
これは、「95%は普通の範囲だけど、残り5%の端っこに入ったら、それは珍しいこと(有意)だと認めよう」というルールのことです。
この「5%の面積」をどう配分するかで、合格ライン(棄却域の境界線)が変わってきます。
両側検定の場合(厳しい審査員)
まずは、基本となる両側検定です。
これは「極端に大きい」場合と「極端に小さい」場合の両方をチェックします。
そのため、持ち点である5%の面積を、左右に半分ずつ分けなければなりません。
片側の面積 (2.5%)
つまり、右端のトップ2.5%に入らなければ「意味がある」と認めてもらえないのです。
これを「Z値」というスコア(偏差値のようなもの)に換算すると、境界線は以下の数字になります。
合格ライン
スコアが を超えて初めて、「統計的に有意差がある」と判定されます。約2倍の標準偏差を超えないといけないので、結構厳しいハードルです。
片側検定の場合(優しい審査員)
次に、片側検定です。
こちらは「大きいかどうか」だけをチェックすればいいので、反対側(小さい方)は無視します。
そのため、持ち点の5%をすべて右側に集中させることができます。
片側の面積 (5%まるごと)
トップ2.5%ではなく、トップ5%に入ればいいわけですから、ハードルは下がります。
これを先ほどと同じくスコアに換算すると、こうなります。
合格ライン
なんと、 から
まで下がりました!
数字だけ見るとわずかな差に見えるかもしれませんが、統計の世界ではこの差が運命を分けます。
具体例で見る「運命の分かれ道」
では、実際に実験をして、あなたのデータのスコアが だったとしましょう。
この という数字は、両側検定の基準(
)と、片側検定の基準(
)のちょうど中間にあります。
もし「両側検定」で分析していたら
あなたのスコア は、基準の
に届きません。
結論:「有意差なし(効果は確認できなかった)」
実験は失敗、レポートには「差はありませんでした」と書くことになります。
もし「片側検定」で分析していたら
あなたのスコア は、基準の
を超えています。
結論:「有意差あり(効果あり!)」
実験は成功、レポートには「新薬には効果がありました!」と華々しく書くことができます。
なぜ片側検定は慎重に使うべきなのか
こうして見ると、片側検定を使いたくなりますよね?
同じデータなのに、検定方法を変えるだけで「失敗」が「成功」に変わってしまうのですから。
しかし、これが落とし穴です。
もし実験結果を見たあとに、「おっと、両側検定だとダメだったから、片側検定に変えちゃえ」と後出しジャンケンをしたらどうなるでしょうか?
それは単にハードルを下げて無理やり合格にしただけで、科学的な正しさは失われてしまいます。
だからこそ、多くの科学的な研究では、より厳しく、後出しの言い訳ができない「両側検定」を使うのが基本マナーとなっているのです。
片側検定を使うなら、データを取る前に「これまでの研究からして、絶対に数値が増えることしかあり得ない!」という強い根拠と宣言が必要です。
今後の学習の指針
両側検定の と、片側検定の
。
この数字の違いが、研究者の運命を左右することが実感できたでしょうか。
統計学は、単に計算するだけでなく、こうした「ルールの決め方」が結果に大きく影響する学問です。そこが難しくもあり、面白いところでもあります。
さて、ここまで来ると「じゃあ、間違って『効果あり』と判定してしまうミス(慌てん坊のミス)」と、「本当は効果があるのに見逃してしまうミス(ぼんやり屋のミス)」についても気になりませんか?
次は、統計的仮説検定における「第一種の過誤」と「第二種の過誤」について学んでみてください。ここを理解すると、統計の信頼性がより深く見えてきますよ。
一緒に統計リテラシーを高めていきましょう!
セイ・コンサルティング・グループの新人エンジニア研修のメニューへのリンク
投稿者プロフィール
- 代表取締役
-
セイ・コンサルティング・グループ株式会社代表取締役。
岐阜県出身。
2000年創業、2004年会社設立。
IT企業向け人材育成研修歴業界歴20年以上。
すべての無駄を省いた費用対効果の高い「筋肉質」な研修を提供します!
この記事に間違い等ありましたらぜひお知らせください。
最新の投稿
山崎講師2025年12月2日積分で面積を計算?P値の正体と「片側・両側」の謎を解き明かそう
山崎講師2025年12月2日【AIC入門】そのモデル、複雑すぎませんか?「シンプルで賢い」を選ぶ最強の指標
山崎講師2025年12月2日「自由度調整済み決定係数」と「補正R2」は同じものですか?
山崎講師2025年12月2日【決定係数の罠】説明変数を増やすとなぜ精度が良く見える?エンジニア1年目が知るべきロジック