確率と尤度の違いを「時間の矢」で攻略!未来の予測と過去の推理
こんにちは。ゆうせいです。
新人エンジニアのみなさん、統計学や機械学習の勉強をしていて「尤度(ゆうど)」という言葉に出会ったことはありませんか?
「確率はなんとなくわかるけれど、尤度ってなんだろう?」「確率と同じじゃないの?」と疑問に思う方も多いはずです。実は、ある新人の方から非常に鋭い視点をいただきました。
「平均値は過去の実現値で、期待値は未来の理論値ですよね?」
この感覚、本当に素晴らしいです。まさにその「時間の矢(過去か未来か)」という視点こそが、確率と尤度の違いを理解するカギなのです。今回は、この鋭い直感をベースに、確率と尤度の正体を一緒に解き明かしていきましょう!
確率と尤度は「向き」が逆だった
結論から言ってしまうと、尤度に対応する言葉は、ズバリ「確率」です。
しかし、この二つは似て非なるもの。何が違うかというと、視点の「向き」が正反対なのです。みなさんの直感にある「時間の矢」を使って整理すると、以下のようになります。
- 確率(Probability):未来に向かう視点
- 尤度(Likelihood):過去を振り返る視点
これだけだと少し抽象的ですよね。もう少し詳しく見ていきましょう。
確率は「未来」を語る
確率は、原因(設定)がわかっている状態で、これから起きる結果(データ)を予測するときに使います。
例えば、歪みのないサイコロがあるとします。これが「原因」や「設定」です。このサイコロを振ったときに「6が出る確率はいくつか?」と考えるのが確率の考え方です。
まだ起きていない未来の結果を、現在の設定から予測していますよね。つまり、矢印は「原因」から「結果」へと向いています。
尤度は「過去」を解釈する
一方で尤度は、すでに結果(データ)が出ている状態で、その原因(設定)が何だったのかを推測するときに使います。
例えば、「サイコロを振ったら6が出た」という事実があるとします。これは「過去のデータ」です。この結果を見て、「このサイコロは歪んでいなかったと言えるだろうか?それとも6が出やすいイカサマサイコロだったのだろうか?」と考えるのが尤度の考え方です。
手元にある結果から、過去にあったはずの原因を探っていますよね。矢印は「結果」から「原因」へと逆向きに走っているのです。
ミステリー小説で例えてみよう
この関係性、ミステリー小説の「犯人」と「探偵」に置き換えると、もっとイメージしやすくなりますよ。
確率は「犯人」の視点
犯人がトリックを仕掛けるときを想像してください。「このトリック(原因)を使えば、現場はこうなるだろう(結果)」と予測しますよね。
- もし私が毒を使えば、被害者は苦しむはずだ(確率が高い)。
これは、原因から結果を見ている「未来への予測」です。
尤度は「探偵」の視点
次に、探偵が現場検証をするときを想像してください。探偵が見ているのは、すでに事件が起きた後の現場(結果)です。
- 被害者が苦しんだ跡がある(結果)。ということは、犯人は毒を使った可能性が高い(もっともらしい)。
これは、結果から原因を逆推測している「過去への解釈」です。このときの「もっともらしさ」こそが、まさに「尤度」なのです。
数式で見るともっとスッキリする
ここで少しだけ数式の力を借りてみましょう。高校数学で習った記号が出てきますが、怖がらなくて大丈夫です。WordPressなどのブログで数式を書く際、日本語は数式の中に入れられないので、日本語と数式を分けて書きますね。
確率を数式で表すと、以下のようになります。
ここで、 は「パラメータ(原因)」、
は「データ(結果)」を表します。縦線
は「~という条件のもとで」という意味です。
つまり、「原因 が決まっているときに、結果
が起きる確率」と読みます。
では、尤度はどうなるでしょうか?
記号の左右が入れ替わりましたね!
これは、「結果 が観測された条件で、それが原因
によるものである尤度(もっともらしさ)」を表しています。
こうして見ると、やっていることは単に視点の逆転だということがよくわかります。
メリットとデメリット
さて、この二つの概念には、それぞれどんな良い点(メリット)と注意点(デメリット)があるのでしょうか。
確率のメリット・デメリット
確率は、モデルや設定が既知の場合に、未来をシミュレーションするのに最適です。「もしこの設定なら、来月の売上はどうなるか?」といった予測に役立ちます。
一方で、現実世界では「真の設定(神様のサイコロ)」が何であるかは誰にもわかりません。前提となる設定が間違っていると、予測も的外れになってしまうのが弱点です。
尤度のメリット・デメリット
尤度は、手元にあるデータから、未知の「真の設定」をあぶり出すのに強力な力を発揮します。「もっともらしい原因」を探し出すことができるため、AIやデータ分析の現場では、この尤度を最大にする設定を探す「最尤推定」という手法が頻繁に使われます。
しかし、尤度はあくまで「もっともらしさ」の指標であり、確率そのものではありません。初心者の方が「尤度=確率」と混同してしまい、解釈を誤りやすい点はデメリットと言えるでしょう。
まとめ
最後に、今回の話を整理しましょう。
質問者様の「平均値と期待値」の分類に見事に当てはまりましたね。
- 平均値(過去のデータ) と対になるのは 期待値(未来の予測モデル)
- 尤度(過去データからの推論) と対になるのは 確率(未来データへの予測)
「確率は未来を語り、尤度は過去を解釈する」
このフレーズを覚えておけば、もう迷うことはありません。
今後の学習の指針
今回理解した「尤度」は、機械学習の基礎となる「最尤推定法」や、さらに進んだ「ベイズ統計学」への入り口です。
次は、実際に手元のデータを使って、「どのパラメータが一番もっともらしいか?」を計算するプロセス(最尤推定)を学んでみると良いでしょう。そこでは微分などの数学も登場しますが、今回の「探偵の視点」を持っていれば、数式の意味がスッと頭に入ってくるはずですよ。
焦らず、一つずつ「過去」と「未来」をつなげていきましょう!
セイ・コンサルティング・グループの新人エンジニア研修のメニューへのリンク
投稿者プロフィール
- 代表取締役
-
セイ・コンサルティング・グループ株式会社代表取締役。
岐阜県出身。
2000年創業、2004年会社設立。
IT企業向け人材育成研修歴業界歴20年以上。
すべての無駄を省いた費用対効果の高い「筋肉質」な研修を提供します!
この記事に間違い等ありましたらぜひお知らせください。
学生時代は趣味と実益を兼ねてリゾートバイトにいそしむ。長野県白馬村に始まり、志賀高原でのスキーインストラクター、沖縄石垣島、北海道トマム。高じてオーストラリアのゴールドコーストでツアーガイドなど。現在は野菜作りにはまっている。