確率と尤度の違いを「時間の矢」で攻略!未来の予測と過去の推理

こんにちは。ゆうせいです。

新人エンジニアのみなさん、統計学や機械学習の勉強をしていて「尤度(ゆうど)」という言葉に出会ったことはありませんか?

「確率はなんとなくわかるけれど、尤度ってなんだろう?」「確率と同じじゃないの?」と疑問に思う方も多いはずです。実は、ある新人の方から非常に鋭い視点をいただきました。

「平均値は過去の実現値で、期待値は未来の理論値ですよね?」

この感覚、本当に素晴らしいです。まさにその「時間の矢(過去か未来か)」という視点こそが、確率と尤度の違いを理解するカギなのです。今回は、この鋭い直感をベースに、確率と尤度の正体を一緒に解き明かしていきましょう!

確率と尤度は「向き」が逆だった

結論から言ってしまうと、尤度に対応する言葉は、ズバリ「確率」です。

しかし、この二つは似て非なるもの。何が違うかというと、視点の「向き」が正反対なのです。みなさんの直感にある「時間の矢」を使って整理すると、以下のようになります。

  • 確率(Probability):未来に向かう視点
  • 尤度(Likelihood):過去を振り返る視点

これだけだと少し抽象的ですよね。もう少し詳しく見ていきましょう。

確率は「未来」を語る

確率は、原因(設定)がわかっている状態で、これから起きる結果(データ)を予測するときに使います。

例えば、歪みのないサイコロがあるとします。これが「原因」や「設定」です。このサイコロを振ったときに「6が出る確率はいくつか?」と考えるのが確率の考え方です。

まだ起きていない未来の結果を、現在の設定から予測していますよね。つまり、矢印は「原因」から「結果」へと向いています。

尤度は「過去」を解釈する

一方で尤度は、すでに結果(データ)が出ている状態で、その原因(設定)が何だったのかを推測するときに使います。

例えば、「サイコロを振ったら6が出た」という事実があるとします。これは「過去のデータ」です。この結果を見て、「このサイコロは歪んでいなかったと言えるだろうか?それとも6が出やすいイカサマサイコロだったのだろうか?」と考えるのが尤度の考え方です。

手元にある結果から、過去にあったはずの原因を探っていますよね。矢印は「結果」から「原因」へと逆向きに走っているのです。

ミステリー小説で例えてみよう

この関係性、ミステリー小説の「犯人」と「探偵」に置き換えると、もっとイメージしやすくなりますよ。

確率は「犯人」の視点

犯人がトリックを仕掛けるときを想像してください。「このトリック(原因)を使えば、現場はこうなるだろう(結果)」と予測しますよね。

  • もし私が毒を使えば、被害者は苦しむはずだ(確率が高い)。

これは、原因から結果を見ている「未来への予測」です。

尤度は「探偵」の視点

次に、探偵が現場検証をするときを想像してください。探偵が見ているのは、すでに事件が起きた後の現場(結果)です。

  • 被害者が苦しんだ跡がある(結果)。ということは、犯人は毒を使った可能性が高い(もっともらしい)。

これは、結果から原因を逆推測している「過去への解釈」です。このときの「もっともらしさ」こそが、まさに「尤度」なのです。

数式で見るともっとスッキリする

ここで少しだけ数式の力を借りてみましょう。高校数学で習った記号が出てきますが、怖がらなくて大丈夫です。WordPressなどのブログで数式を書く際、日本語は数式の中に入れられないので、日本語と数式を分けて書きますね。

確率を数式で表すと、以下のようになります。

P(x|\theta)

ここで、\theta は「パラメータ(原因)」、x は「データ(結果)」を表します。縦線 | は「~という条件のもとで」という意味です。

つまり、「原因 \theta が決まっているときに、結果 x が起きる確率」と読みます。

では、尤度はどうなるでしょうか?

L(\theta|x)

記号の左右が入れ替わりましたね!

これは、「結果 x が観測された条件で、それが原因 \theta によるものである尤度(もっともらしさ)」を表しています。

こうして見ると、やっていることは単に視点の逆転だということがよくわかります。

メリットとデメリット

さて、この二つの概念には、それぞれどんな良い点(メリット)と注意点(デメリット)があるのでしょうか。

確率のメリット・デメリット

確率は、モデルや設定が既知の場合に、未来をシミュレーションするのに最適です。「もしこの設定なら、来月の売上はどうなるか?」といった予測に役立ちます。

一方で、現実世界では「真の設定(神様のサイコロ)」が何であるかは誰にもわかりません。前提となる設定が間違っていると、予測も的外れになってしまうのが弱点です。

尤度のメリット・デメリット

尤度は、手元にあるデータから、未知の「真の設定」をあぶり出すのに強力な力を発揮します。「もっともらしい原因」を探し出すことができるため、AIやデータ分析の現場では、この尤度を最大にする設定を探す「最尤推定」という手法が頻繁に使われます。

しかし、尤度はあくまで「もっともらしさ」の指標であり、確率そのものではありません。初心者の方が「尤度=確率」と混同してしまい、解釈を誤りやすい点はデメリットと言えるでしょう。

まとめ

最後に、今回の話を整理しましょう。

質問者様の「平均値と期待値」の分類に見事に当てはまりましたね。

  • 平均値(過去のデータ) と対になるのは 期待値(未来の予測モデル)
  • 尤度(過去データからの推論) と対になるのは 確率(未来データへの予測)

「確率は未来を語り、尤度は過去を解釈する」

このフレーズを覚えておけば、もう迷うことはありません。

今後の学習の指針

今回理解した「尤度」は、機械学習の基礎となる「最尤推定法」や、さらに進んだ「ベイズ統計学」への入り口です。

次は、実際に手元のデータを使って、「どのパラメータが一番もっともらしいか?」を計算するプロセス(最尤推定)を学んでみると良いでしょう。そこでは微分などの数学も登場しますが、今回の「探偵の視点」を持っていれば、数式の意味がスッと頭に入ってくるはずですよ。

焦らず、一つずつ「過去」と「未来」をつなげていきましょう!

セイ・コンサルティング・グループの新人エンジニア研修のメニューへのリンク

投稿者プロフィール

山崎講師
山崎講師代表取締役
セイ・コンサルティング・グループ株式会社代表取締役。
岐阜県出身。
2000年創業、2004年会社設立。
IT企業向け人材育成研修歴業界歴20年以上。
すべての無駄を省いた費用対効果の高い「筋肉質」な研修を提供します!
この記事に間違い等ありましたらぜひお知らせください。

学生時代は趣味と実益を兼ねてリゾートバイトにいそしむ。長野県白馬村に始まり、志賀高原でのスキーインストラクター、沖縄石垣島、北海道トマム。高じてオーストラリアのゴールドコーストでツアーガイドなど。現在は野菜作りにはまっている。