誤差(ごさ)」について、やさしく丁寧に解説

こんにちは。ゆうせいです。

今回は、機械学習や統計の基礎中の基礎である
「誤差(ごさ)」について、やさしく丁寧に解説していきます。

「誤差って、ようするに“間違い”のことでしょ?」
そうですね、ざっくり言えばそれで正解です。でも、どんな種類があるのか?何に使われるのか?
をしっかり理解すると、モデルの精度や評価指標を正しく扱えるようになります。

この記事では、誤差の意味、種類、数式、そして実例まで、初心者の方にもわかりやすく説明していきます!


誤差とは何か?ひとことで言うと

「予測した値と、実際の値とのズレ」のこと

数学的には、以下のように表されます:

 誤差 = 予測値 - 実測値 = \hat{y} - y

もしくは、

 誤差 = 実測値 - 予測値 = y - \hat{y}

どちらの定義でもOKですが、文脈によって変わります(後で説明します)。


たとえ話で理解しよう!

例:テストの点数予測

  • 実際の点数(正解):80点
  • モデルの予測:75点

このときの誤差は、

 誤差 = 80 - 75 = 5

つまり、「5点ぶん外れていた」ということですね。
このズレの大小を測って、「モデルがどれだけ正確だったか」を判断するのが、誤差の役割です。


誤差の種類

誤差と一言で言っても、実はいくつか種類があります。代表的なものを紹介します。

残差(residual)

 残差 = y_i - \hat{y}_i

  • 実際のデータと予測値のズレ(データ1件ずつの誤差)
  • 回帰分析などでよく使われる

真の誤差(true error)

  • モデルが未知のデータに対してどれくらい間違えるか?
  • 実際には直接測れないけど、汎化性能に関係する

平均誤差(Mean Error)

 ME = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)

  • 正の誤差と負の誤差が打ち消し合うので、誤差の“平均”としては向かないことが多い
  • その代わりに、MAEやMSEを使う(前回説明しましたね!)

絶対誤差と二乗誤差

絶対誤差(Absolute Error)

 |y_i - \hat{y}_i|

  • ズレの大きさを重視(方向は無視)
  • MAE(平均絶対誤差)などに使われる

二乗誤差(Squared Error)

 (y_i - \hat{y}_i)^2

  • 大きな誤差に強くペナルティを与える
  • MSEやRMSEで使われる

誤差の使い道

誤差は、単に「ズレ」を測るだけではなく、さまざまな場面で使われます:

使い道内容
モデル評価MSE・RMSE・MAEなどの計算に必要
モデル訓練損失関数として使い、勾配を求める
異常検知「誤差が大きすぎるもの」を異常と判定
信頼区間・予測区間誤差を使って「どれくらいズレるか」を推定する

グラフで直感的に見てみよう!

データ点(実測)    ●
予測値(モデル)     ◯
誤差 = ●と◯の縦のズレ

このズレをすべてのデータについて計算して、合計したり平均したりすることで、
「このモデルは全体としてどれくらいズレてるか?」を把握します。


最後にまとめ!

用語意味備考
誤差予測値と実測値のズレモデルの精度を評価する基本
残差手元のデータでの誤差推定された予測とのズレ
真の誤差未知データに対する誤差汎化誤差・テスト誤差とも言われる
絶対誤差誤差の大きさ(正負無視)MAEに使われる
二乗誤差誤差を2乗したものMSEやRMSEに使われる

今後の学習の指針

誤差の基本がわかったら、次のような内容に進んでみましょう!

  1. 損失関数(Loss Function)と誤差の違い
  2. バイアスとバリアンスのトレードオフ
  3. 汎化誤差(Generalization Error)の理解
  4. 誤差に基づくモデル選択(交差検証・情報量基準など)

誤差は、すべてのモデル評価の土台になる考え方です。
この基本をしっかり押さえておくことで、今後の学習がグッと楽になりますよ。

生成AI研修のおすすめメニュー

投稿者プロフィール

山崎講師
山崎講師代表取締役
セイ・コンサルティング・グループ株式会社代表取締役。
岐阜県出身。
2000年創業、2004年会社設立。
IT企業向け人材育成研修歴業界歴20年以上。
すべての無駄を省いた費用対効果の高い「筋肉質」な研修を提供します!
この記事に間違い等ありましたらぜひお知らせください。