正解率と適合率の違いとは?混乱しやすい評価指標をやさしく解説

こんにちは。ゆうせいです。
今回は、「正解率と適合率の違いとは?混乱しやすい評価指標をやさしく解説」というテーマで進めていきます。


「正解率」と「適合率」は何が違うのか?

どちらも機械学習モデルの評価指標としてよく使われますが、混同しやすい用語です。
特に分類問題(たとえばスパムメール判定や病気の診断)で重要になってきます。

「どっちも“正しく当てた割合”じゃないの?」と思ってしまうかもしれません。
しかし、見ている視点がまったく異なるんです!


まずはざっくり定義から

指標意味数式(日本語)
正解率(Accuracy)全体の中で正しく予測できた割合(真陽性+真陰性)÷(全体)
適合率(Precision)「陽性と予測した中で、本当に陽性だった割合」真陽性 ÷(真陽性+偽陽性)

ここで出てくる専門用語を整理しましょう。


混同行列(Confusion Matrix)とは?

機械学習の分類問題では、次のような4つの分類結果に分かれます:

実際\予測陽性と予測(Positive)陰性と予測(Negative)
実際に陽性(Positive)TP(真陽性)FN(偽陰性)
実際に陰性(Negative)FP(偽陽性)TN(真陰性)
  • TP(True Positive):正しく陽性と当てた
  • TN(True Negative):正しく陰性と当てた
  • FP(False Positive):間違って陽性と予測(本当は陰性)
  • FN(False Negative):間違って陰性と予測(本当は陽性)

正解率(Accuracy)とは?

正解率は、「全部の予測の中で、正しかった割合」です。

例えば、100人中90人を正しく予測できたなら、正解率は90%。

数式で表すと:

例え話:

100問のテストで90問正解したら、正解率90%。
シンプルで分かりやすい評価指標ですが、データが偏っている場合には注意が必要です!


データが偏っているときの落とし穴

例えば、病気の人が全体の1%しかいないとしましょう。

  • 100人中、1人が病気
  • モデルが「全員健康」と予測した

すると…

  • TN = 99、FN = 1
  • TP = 0、FP = 0

このとき正解率は

…でも、病気の人を1人も当ててないですよね?
こんなとき、正解率だけ見ていると本当に重要なところを見逃してしまうんです。


適合率(Precision)とは?

今度は「モデルが陽性(たとえば“スパム”)と予測したものの中に、どれくらい本当に陽性だったか?」を見る指標です。

例え話:

あなたが先生で、カンニングしてそうな生徒を10人選びました。
実際にカンニングしていたのは、そのうち6人。
このとき適合率は

つまり、「選んだ人の中でどれくらい当たってたか?」を見るわけです。


適合率と正解率はどう使い分ける?

それぞれ得意な場面が違います。

指標向いている場面
正解率データが均等に分布しているとき(例:犬・猫・鳥を分類)
適合率陽性予測の信頼性が重要なとき(例:がんの検出、迷惑メール判定)

精度だけではダメ?他にも指標がある!

実は、再現率(Recall)やF1スコアという指標もあります。

  • 再現率:実際の陽性の中で、どれだけ正しく当てられたか
  • F1スコア:適合率と再現率のバランスを取った評価指標

適合率だけ高くても、見逃しが多ければ意味がない。
そこでF1スコアのような総合指標が必要になるんです。

こんにちは。ゆうせいです。


✅ 再現率(Recall)の解説:

「見逃さない力」を測る指標


● 定義

再現率(Recall)は、実際に陽性だったデータのうち、モデルがどれだけ正しく陽性と判定できたかを表す指標です。
とくに、「本物をどれだけ拾えたか?」という視点で重要になります。


● 数式

  • TP(True Positive):本当は陽性で、陽性と予測できた件数
  • FN(False Negative):本当は陽性なのに、陰性と見逃してしまった件数

● イメージで理解

再現率は、「本物をどれだけ逃さずに拾えたか」を表します。
たとえば病院のがん検査を考えた場合、

  • 再現率が高い → がんの人を見逃さずに発見できている
  • 再現率が低い → がんの人を見逃してしまっている

● 例え話:金属探知機

空港で金属探知機を使って「武器」を見つけるとしましょう。

  • 本当に武器を持っている人を検知できた割合
  • 見逃した武器が少ないほど、再現率は高い!

● 特に重要な場面

  • 医療(病気の見逃しが致命的)
  • セキュリティ(攻撃者を逃すのはリスク)
  • 異常検知(たとえ誤検出が増えても、見逃さないことが大事)

● 注意点

再現率だけを高めようとすると、「陽性かも!」ととにかく陽性と判定しすぎてしまう傾向があります。
これにより、誤検出(False Positive)が増える可能性もあるため、バランスが大切になります。


✅ F1スコアの解説:

「適合率と再現率のバランスを取る指標」


● 定義

F1スコアは、Precision(適合率)と Recall(再現率)のバランスを評価する指標です。
特に、どちらか一方が極端に低くても高評価を与えない、
“厳しめの平均”として知られています。


● 数式

これは、「調和平均」という特殊な平均を使ってバランスを取っています。


● なぜ“調和平均”なのか?

普通の平均(算術平均)だと、一方が高ければもう一方が低くてもそこそこの数字になります。
でもF1スコアは、どちらか一方でも低いとスコアが低くなるんです。

📌 例:

  • Precision = 0.9、Recall = 0.1 → F1 = 約0.18(バランスが悪いと低評価)

ちなみにF1スコアの「F」は、もともと統計学・情報検索(Information Retrieval)で使われてきた F-measure(F値) に由来します。
この “F” は 「Function(関数)」 の頭文字を取ったものです。

F1スコアの「1」は、数式におけるパラメータ β(ベータ) が「1」であることを表しています。このβは、Precision(適合率)と Recall(再現率)のどちらを重視するかをコントロールする重み係数です。「β = 1:両者を等しく評価するスコア」という意味です。


● イメージで理解

F1スコアは、「ちゃんと当てて、しかも見逃していない」状態を高く評価します。
たとえばスパムメール検出:

  • Precisionが高い → 迷惑メール判定の正しさ
  • Recallが高い → 本当のスパムをちゃんと拾えてる

F1スコアはその中間の“総合力”評価になります。


● いつ使うべき?

  • データに偏りがある場合(クラス不均衡)
  • Precision も Recall も両方大切な場面
    • 例:詐欺検出、医療診断、品質チェックなど

● 注意点

  • F1スコアは分かりやすさでは正解率に劣ります
  • ですが「バランスの良い分類性能」を知りたいときには最適な指標です!


まとめ

  • 正解率は「全部の中で正しく当てた割合」
  • 適合率は「陽性と予測した中で、正しく当たった割合」
  • 再現率:見逃さない力
  • F1スコア:当てる力と見逃さない力のバランス

今後の学習の指針

評価指標を深く理解することで、モデルの「強み」や「弱点」を見抜く力がつきます。
次のステップとして、ぜひ以下も学んでみましょう!

  • 再現率(Recall)との違いと使い分け
  • F1スコアと調和平均の考え方
  • ROC曲線とAUC(曲線下面積)の理解
  • 評価指標の選び方とビジネスへの応用

ご希望があれば、それぞれ詳しく解説できますので、ぜひ気軽にリクエストしてくださいね!

生成AI研修のおすすめメニュー

投稿者プロフィール

山崎講師
山崎講師代表取締役
セイ・コンサルティング・グループ株式会社代表取締役。
岐阜県出身。
2000年創業、2004年会社設立。
IT企業向け人材育成研修歴業界歴20年以上。
すべての無駄を省いた費用対効果の高い「筋肉質」な研修を提供します!
この記事に間違い等ありましたらぜひお知らせください。