誤差逆伝播法と勾配降下法の関係を徹底解説！ニューラルネットワーク学習の心臓部を覗いてみよう

2025年8月28日 2025年8月28日山崎講師

山崎講師

誤差逆伝播法と勾配降下法の関係を徹底解説！ニューラルネットワーク学習の心臓部を覗いてみよう

こんにちは。ゆうせいです。

今回は、ニューラルネットワークの学習において避けて通れない、誤差逆伝播法（バックプロパゲーション）と勾配降下法（グラディエントディセント）の関係について、詳しく解説していきます。

「名前は聞いたことがあるけど、仕組みはよくわからない…」
そんな方もご安心ください！高校生でもイメージしやすい例えを使って、図や数式も交えてわかりやすく説明していきます。

ニューラルネットワークはどうやって学ぶのか？

まず前提として、ニューラルネットワークは学習するために「パラメータ（重みとバイアス）」を少しずつ調整していく仕組みです。

この調整のために登場するのが、

勾配降下法（Gradient Descent）
誤差逆伝播法（Backpropagation）

この2つです。

例えで理解しよう：山登りではなく「山下り」

ニューラルネットワークの学習は、山の上にいるボールが谷底を目指して転がっていくイメージで捉えるとわかりやすいです。

ボールの位置 = パラメータ（重みやバイアス）
山の地形 = 損失関数（誤差の量を測る指標）
谷底 = 損失関数が最小となる最適なパラメータ

この谷底を探すとき、どっちの方向に転がればいいかを教えてくれるのが「勾配（こうばい）」です。

勾配降下法とは？

定義

勾配降下法（Gradient Descent）は、損失関数を最小にするように、パラメータを少しずつ更新していく手法です。

「勾配」とは、ある地点での関数の傾きのこと。つまり、「今どっちに動けば損失が減るか」の情報をくれます。

数式で表すと

$w = w - \eta \frac{\partial L}{\partial w}$

日本語で読むと：

重み＝今の重み − 学習率 × （損失関数を重みで偏微分した値）

ここで出てくる「学習率（Learning Rate）」とは、どれだけのステップで進むかを決める調整つまみのようなものです。

誤差逆伝播法とは？

定義

誤差逆伝播法（Backpropagation）は、出力層で生じた誤差を、入力層に向かって順番にさかのぼりながら、各重みがどれくらい誤差に影響したかを計算する方法です。

これは「どの重みがどれだけ悪さをしたか」を調べているようなイメージです。

例えで理解するなら…

間違った結果を出したとき、「どの原因がそのミスに一番関与したか」を探るようなものです。
たとえば、テストで点数が悪かったときに「英語の単語を覚えてなかったのが原因」なのか、「数式が間違ってたのか」を逆算して調べる感覚に似ています。