【初心者でも分かる】シグモイド関数の微分が美しい！AIが学ぶ仕組みの核心

2025年10月6日 2025年10月6日山崎講師

山崎講師

こんにちは。ゆうせいです。

ニューラルネットワークを学ぶ上で、多くの人が一度は出会う「シグモイド関数」。S字のなめらかな曲線が特徴的で、物事の確率を表現するのによく使われますね。

このシグモイド関数ですが、実は「微分する」ことで、AIの学習において非常に重要な役割を果たします。今回は、一見難しそうに見えるシグモイド関数の微分を、ステップバイステップで解き明かし、なぜその結果が「美しい」と言われるのかを探っていきましょう！

なぜ微分が必要なの？「間違い」から学ぶため

そもそも、なぜ関数を微分する必要があるのでしょうか？

機械学習、特にニューラルネットワークの学習は、「予測の答え合わせをして、間違いが小さくなるようにパラメータを調整する」という作業の繰り返しです。

この「調整」のときに、微分が活躍します。微分を使うと、関数の特定の点における「傾き」が分かります。この傾きが、パラメータをどちらの方向に、どれくらい動かせば間違いが減るのかを教えてくれる「道しるべ」になるのです。

例えるなら、あなたは霧深い山で、谷底（間違いが最も小さい場所）を目指している探検家です。目隠しされていても、足元の地面の傾きさえ分かれば、「ああ、こっちが下り坂だから、こっちに進めばいいんだな」と判断できますよね？この「足元の傾き」を計算するのが、微分なのです。

まずは主役であるシグモイド関数 $\sigma(x)$ の式を確認しましょう。

$\sigma(x) = \frac{1}{1 + e^{-x}}$

$latex e latex x $に入力されても、出力は必ず0から1の間に収まります。

ちなみに、この関数は入力$latex x latex x=0 $を代入してみましょう。

$\sigma(0) = \frac{1}{1 + e^{-0}} = \frac{1}{1 + 1} = \frac{1}{2}$

どんな数も0乗すると1になるので、 $e^0$ は1になります。つまり、シグモイド関数のグラフを描いたとき、そのS字カーブは必ず(0, 0.5)という中心点を通るのです。

では、この関数を $x$ で微分していきましょう。高校数学を思い出しながら、ゆっくり進めば大丈夫です！

分数のまま微分するのは少し大変なので、指数を使って式を書き換えます。「 $\frac{1}{A} = A^{-1}$ 」というルールを使うと、こうなります。

$\sigma(x) = (1 + e^{-x})^{-1}$

この式は、$latex u = 1 + e^{-x} latex -1 $乗した形になっています。このような「関数の中に関数が入っている」形を微分するときは、「合成関数の微分（連鎖律）」を使います。

「外側の微分 × 内側の微分」と覚えている方も多いかもしれませんね。

外側の微分: まずは $(\cdot)^{-1}$ という外側の部分を微分します。 $x^{-1} の微分がlatex -x^{-2}$ になるのと同じルールで、 $-(u)^{-2}$ となります。 $-(1 + e^{-x})^{-2}$
内側の微分: 次に $u = 1 + e^{-x}$ という内側の部分を微分します。定数である1の微分は0、 $e^{-x} の微分はlatex -e^{-x}$ になります。 $0 - e^{-x} = -e^{-x}$