AIでビジネスを加速させる!ロジスティック回帰とシグモイド関数の魔法を徹底解説

こんにちは。ゆうせいです。

あなたは、目の前にあるデータが「合格か不合格か」「購入するかしないか」といった二択の結果を予測したいと思ったことはありませんか。ビジネスの現場では、このような「白黒はっきりさせたい場面」が数多く存在します。

そんな時に大活躍するのが、今回ご紹介するロジスティック回帰です。名前だけ聞くと難しそうに感じるかもしれませんが、実はとても人間味のある、面白い仕組みを持った手法なのです。

一緒に、その仕組みを紐解いていきましょう!


ロジスティック回帰とは?二択を予測する賢い仕組み

ロジスティック回帰は、統計学や機械学習の世界で使われる「分類」のための手法です。名前に「回帰」と付いていますが、実際には「ある事象が起こる確率」を計算して、最終的にどちらのグループに属するかを判断するために使われます。

身近な例えで理解しよう

例えば、あなたが明日の天気を予想するとします。空模様や湿度を見て「明日は80パーセントの確率で雨が降るだろう」と推測しますよね。この「80パーセント」という確率を導き出し、最終的に「傘を持っていく(雨のグループ)」と決断するプロセスこそが、ロジスティック回帰の役割です。

専門用語:オッズと対数

ここで、少しだけ背伸びをして専門用語を覗いてみましょう。ロジスティック回帰を理解する上で欠かせないのが「オッズ」という考え方です。

オッズとは、競馬や賭け事でも耳にする言葉ですが、数学的には「ある事象が起こる確率」を「起こらない確率」で割った値を指します。

数式で表すと、次のようになります。

オッズ = 成功の確率 / 失敗の確率

もし成功する確率が0.8なら、失敗は0.2ですよね。この場合のオッズは4となります。ロジスティック回帰では、このオッズをさらに加工して、どんなに複雑なデータでも扱いやすい形に変換していくのです。


魔法のフィルター:シグモイド関数の正体

ロジスティック回帰の心臓部には、シグモイド関数という特別な計算式が組み込まれています。これが、どんな数字も「0から1の間」にギュッと押し込めてくれる魔法のフィルターなのです。

なぜ0から1の間なのか?

確率は、0パーセント(絶対に起こらない)から100パーセント(絶対に起こる)の間でしか存在しませんよね。しかし、普通に計算をしていると、答えが100を超えてしまったり、マイナスになってしまったりすることがあります。

そこでシグモイド関数の出番です!この関数は、どれほど大きな数字が放り込まれても、必ず0と1の間に収めてくれます。

シグモイド関数の数式を見てみよう

少し複雑に見えますが、形に注目してください。

f(x) = 1 / (1 + e^{-x})

この式の中にある e は、ネイピア数と呼ばれる特別な数字です。この数式を通すことで、グラフを描くと滑らかな「S字カーブ」が現れます。

想像してみてください。急激に立ち上がり、最後は緩やかに1へと近づいていく坂道を。この坂道のどこにデータが位置するかで、「これは合格に近いな」といった判断を下すのです。


ロジスティック回帰のメリットとデメリット

どんなに優れた手法にも、得意と不得意があります。これを知っておくことで、道具を正しく使いこなせるようになりますよ。

メリット:中身がわかりやすい

  • 計算結果が「確率」で出るため、説得力がある。
  • どのデータが結果に強く影響しているかが一目でわかる。
  • 計算が比較的軽く、パソコンへの負担が少ない。

ビジネスの会議で「AIがこう言っています」とだけ伝えるよりも、「購入確率が85パーセントなので、この施策を打ちましょう」と言えたほうが、周囲の納得感は高まりますよね。

デメリット:複雑な境界線は苦手

  • データが直線的に分けられない複雑な関係だと、精度が落ちる。
  • 外れ値(極端に異常なデータ)に影響を受けやすい。

迷路のように入り組んだデータを見分けるには、もっと別の強力なアルゴリズムが必要になる場合もあります。


実際にどう使われているの?

あなたの身の回りでも、ロジスティック回帰はひっそりと、しかし確実に働いています。

  • 銀行での融資審査:この人に貸して大丈夫か(貸し倒れ確率の算出)
  • 医療現場:検査結果から、特定の病気である可能性を推定
  • マーケティング:メールマガジンを開封してくれるかどうかの予測

これらはすべて、過去の膨大なデータから「確率」を導き出しているのです。


まとめとこれからの学習指針

ロジスティック回帰とシグモイド関数の関係、少しは身近に感じていただけたでしょうか。

今回のポイントをおさらいしましょう。

  1. ロジスティック回帰は、二択の確率を予測する手法である。
  2. シグモイド関数は、どんな数字も0から1の確率に変換するフィルターである。
  3. 結果がシンプルで解釈しやすいため、ビジネス判断に非常に役立つ。

次は、実際にエクセルやプログラミング言語のPythonを使って、手元のデータをこの式に放り込んでみることをおすすめします!数字が綺麗なS字カーブを描き、確率として現れる瞬間を体験すると、きっと感動するはずです。

次の一歩として、まずは「重回帰分析」との違いを調べてみましょう。

「どちらも回帰って付いているけれど、何が違うの?」

「どうやって使い分ければいいの?」

そんな疑問を抱くのは、あなたがしっかりと内容を吸収している証拠です!今回は、この2つの手法の決定的な違いを、スッキリと整理していきましょう。


決定的な違いは「答えの形」にある

結論からお伝えします。ロジスティック回帰と重回帰分析の最大の違いは、予測したいターゲット(目的変数)が何であるか、という点に尽きます。

重回帰分析は「量」を当てる

重回帰分析は、連続した数値を予測するのが得意です。例えば、以下のような場面で使われます。

  • 部屋の広さや築年数から、家賃(20万円、21万円……)を予測する
  • 気温や曜日から、アイスクリームの売上個数を予測する

このように、答えが「どこまでも続く数字」である場合に重回帰分析を選びます。

ロジスティック回帰は「カテゴリー」を当てる

対して、前回学んだロジスティック回帰は、イエスかノーかの「分類」を予測します。

  • 顧客の行動履歴から、商品を購入するか(1)、しないか(0)を予測する
  • 検査数値から、病気であるか、健康であるかを予測する

仕組みの違いを「グラフの形」で理解しよう

この2つの手法は、計算のゴール地点が全く異なります。高校数学の知識を少しだけ思い出しながら、イメージを膨らませてみてください。

直線で突き進む重回帰分析

重回帰分析は、データの間を一本の「直線」で突き進もうとします。数式にすると、このような形です。

予測値 = a \times 特徴 + b \times 特徴 + \dots + 切片

これをグラフにすると、右肩上がりの真っ直ぐな線になります。しかし、これを「合格・不合格」の判定に使おうとすると問題が起きます。直線のままだと、予測値が1(100パーセント)を超えて2や3になってしまったり、逆にマイナスになってしまったりするからです。

S字で踏みとどまるロジスティック回帰

そこで、前回の主役「シグモイド関数」の登場です!

ロジスティック回帰は、重回帰分析のような直線的な計算結果を、シグモイド関数というフィルターに通します。

確率 = 1 / (1 + e^{-(重回帰の計算式)})

これにより、どんなに大きな数値が計算されても、最終的な答えは必ず0と1の間に収まる「S字カーブ」になります。


使い分けのチェックリスト

どちらを使うべきか迷ったら、この表を参考にしてみてください。

特徴重回帰分析ロジスティック回帰
予測したいもの数値(いくら?何個?)分類(どっち?YESかNOか)
グラフの形直線S字カーブ
出力結果連続した数字0から1までの確率
明日の最高気温の予測明日雨が降るかどうかの予測

まとめ

いかがでしたか。

「いくらになるか」を当てるのが重回帰分析、「どっちになるか」を当てるのがロジスティック回帰。この違いさえ押さえておけば、データ分析の現場で迷うことはもうありません!

  1. 予測したいターゲットが「数値」か「カテゴリー」かを確認する。
  2. カテゴリー(二択)ならロジスティック回帰を選択する。
  3. シグモイド関数のおかげで、答えが確率として出てくることを思い出す。

セイ・コンサルティング・グループでは新人エンジニア研修のアシスタント講師を募集しています。

投稿者プロフィール

山崎講師
山崎講師代表取締役
セイ・コンサルティング・グループ株式会社代表取締役。
岐阜県出身。
2000年創業、2004年会社設立。
IT企業向け人材育成研修歴業界歴20年以上。
すべての無駄を省いた費用対効果の高い「筋肉質」な研修を提供します!
この記事に間違い等ありましたらぜひお知らせください。

学生時代は趣味と実益を兼ねてリゾートバイトにいそしむ。長野県白馬村に始まり、志賀高原でのスキーインストラクター、沖縄石垣島、北海道トマム。高じてオーストラリアのゴールドコーストでツアーガイドなど。現在は野菜作りにはまっている。