誤差(ごさ)」について、やさしく丁寧に解説

こんにちは。ゆうせいです。
今回は、機械学習や統計の基礎中の基礎である
「誤差(ごさ)」について、やさしく丁寧に解説していきます。
「誤差って、ようするに“間違い”のことでしょ?」
そうですね、ざっくり言えばそれで正解です。でも、どんな種類があるのか?何に使われるのか?
をしっかり理解すると、モデルの精度や評価指標を正しく扱えるようになります。
この記事では、誤差の意味、種類、数式、そして実例まで、初心者の方にもわかりやすく説明していきます!
誤差とは何か?ひとことで言うと
「予測した値と、実際の値とのズレ」のこと
数学的には、以下のように表されます:
もしくは、
どちらの定義でもOKですが、文脈によって変わります(後で説明します)。
たとえ話で理解しよう!
例:テストの点数予測
- 実際の点数(正解):80点
- モデルの予測:75点
このときの誤差は、
つまり、「5点ぶん外れていた」ということですね。
このズレの大小を測って、「モデルがどれだけ正確だったか」を判断するのが、誤差の役割です。
誤差の種類
誤差と一言で言っても、実はいくつか種類があります。代表的なものを紹介します。
残差(residual)
- 実際のデータと予測値のズレ(データ1件ずつの誤差)
- 回帰分析などでよく使われる
真の誤差(true error)
- モデルが未知のデータに対してどれくらい間違えるか?
- 実際には直接測れないけど、汎化性能に関係する
平均誤差(Mean Error)
- 正の誤差と負の誤差が打ち消し合うので、誤差の“平均”としては向かないことが多い
- その代わりに、MAEやMSEを使う(前回説明しましたね!)
絶対誤差と二乗誤差
絶対誤差(Absolute Error)
- ズレの大きさを重視(方向は無視)
- MAE(平均絶対誤差)などに使われる
二乗誤差(Squared Error)
- 大きな誤差に強くペナルティを与える
- MSEやRMSEで使われる
誤差の使い道
誤差は、単に「ズレ」を測るだけではなく、さまざまな場面で使われます:
使い道 | 内容 |
---|---|
モデル評価 | MSE・RMSE・MAEなどの計算に必要 |
モデル訓練 | 損失関数として使い、勾配を求める |
異常検知 | 「誤差が大きすぎるもの」を異常と判定 |
信頼区間・予測区間 | 誤差を使って「どれくらいズレるか」を推定する |
グラフで直感的に見てみよう!
データ点(実測) ●
予測値(モデル) ◯
誤差 = ●と◯の縦のズレ
このズレをすべてのデータについて計算して、合計したり平均したりすることで、
「このモデルは全体としてどれくらいズレてるか?」を把握します。
最後にまとめ!
用語 | 意味 | 備考 |
---|---|---|
誤差 | 予測値と実測値のズレ | モデルの精度を評価する基本 |
残差 | 手元のデータでの誤差 | 推定された予測とのズレ |
真の誤差 | 未知データに対する誤差 | 汎化誤差・テスト誤差とも言われる |
絶対誤差 | 誤差の大きさ(正負無視) | MAEに使われる |
二乗誤差 | 誤差を2乗したもの | MSEやRMSEに使われる |
今後の学習の指針
誤差の基本がわかったら、次のような内容に進んでみましょう!
- 損失関数(Loss Function)と誤差の違い
- バイアスとバリアンスのトレードオフ
- 汎化誤差(Generalization Error)の理解
- 誤差に基づくモデル選択(交差検証・情報量基準など)
誤差は、すべてのモデル評価の土台になる考え方です。
この基本をしっかり押さえておくことで、今後の学習がグッと楽になりますよ。
生成AI研修のおすすめメニュー
投稿者プロフィール

- 代表取締役
-
セイ・コンサルティング・グループ株式会社代表取締役。
岐阜県出身。
2000年創業、2004年会社設立。
IT企業向け人材育成研修歴業界歴20年以上。
すべての無駄を省いた費用対効果の高い「筋肉質」な研修を提供します!
この記事に間違い等ありましたらぜひお知らせください。