【確率分布入門】ベルヌーイ分布の期待値と分散をコイン投げでサクッと理解しよう

2026年1月7日 2026年1月7日山崎講師

山崎講師

こんにちは。ゆうせいです。

統計学や機械学習の参考書を開くと、最初の方に必ずベルヌーイ分布という言葉が出てきます。

名前だけ聞くと、なんだか難しそうな物理の法則か何かのようですよね。この時点でページを閉じたくなってしまう気持ち、よくわかります。

でも、安心してください。実はこれ、皆さんが子供の頃から慣れ親しんでいるコイン投げそのものなのです。

今回は、確率分布の最も基礎となるベルヌーイ分布について、その期待値と分散がなぜそのような式になるのか、高校生でもわかるように丁寧に解説していきます。

数式アレルギーの方も、コインを片手に持っているつもりで読んでみてください。きっと「なんだ、当たり前のことじゃないか」と思えるはずです。

ベルヌーイ分布：世界は「成功」か「失敗」か

まずは、ベルヌーイ分布とは何かをはっきりさせましょう。

これは、結果が 2つしかない試行（実験やギャンブル）の結果を表す確率分布です。

たとえば、次のような状況です。

コインを投げて、表が出るか、裏が出るか。
ガチャを引いて、当たりが出るか、ハズレが出るか。
メールの送信ボタンを押して、成功するか、失敗するか。

統計学の世界では、この2つの結果を数字の $1$ と $0$ で表します。

成功（表、当たり）： $1$
失敗（裏、ハズレ）： $0$

そして、成功する確率を $p$ とします。当然、失敗する確率は残りの分なので $1 - p$ となりますね。

たったこれだけです。「結果が0か1か」だけのシンプルな世界、それがベルヌーイ分布です。

期待値：平均するとどうなるの？

では、ここから少し計算に入りますが、身構えないでくださいね。まずは期待値からです。

期待値とは、簡単に言えば長い目で見れば平均してどれくらいの結果が得られるかという値です。宝くじで「平均いくら戻ってくるか」を計算するのと同じ感覚です。

ベルヌーイ分布の期待値 $E[X]$ を計算してみましょう。

期待値の計算ルールは、「値 $\times$ 確率」を全部足すだけでしたね。

$1$ （成功）になる確率は $p$
$0$ （失敗）になる確率は $1 - p$

これを式にします。

$E[X] = 1 \times p + 0 \times (1 - p)$

計算を進めましょう。後半部分は $0$ を掛けているので消えてしまいます。

$E[X] = p$

なんと、答えは $p$ そのままになりました。

これはどういうことでしょうか。

たとえば、コイン投げ（表が出る確率 $0.5$ ）で考えてみます。

1回投げると、結果は $1$ か $0$ ですが、何千回、何万回と投げ続けてその平均をとると、限りなく $0.5$ に近づいていきますよね。

つまり、成功確率 $p$ がそのまま期待値（平均）になるのです。直感的にも納得できる結果ではないでしょうか。

分散：結果はどれくらい予想しにくい？

次に、少しややこしい分散について考えましょう。

分散とは、データのばらつき具合を表す指標です。もっと噛み砕いて言うなら、結果の予想のしにくさと言ってもいいかもしれません。

分散の計算には、便利な公式があります。

「2乗の期待値」引く「期待値の2乗」というものです。

$V[X] = E[X^2] - (E[X])^2$

一つずつ部品を計算していきましょう。

1. 2乗の期待値

まず $E[X^2]$ です。これは結果を2乗してから期待値を求めるという意味です。

しかし、ベルヌーイ分布の値は $1$ か $0$ しかありません。

$1$ の2乗は $1$
$0$ の2乗は $0$

おや。2乗しても値が変わっていませんね。

つまり、計算式は普通の期待値と全く同じになります。

$E[X^2] = 1^2 \times p + 0^2 \times (1 - p) = p$

2. 公式に当てはめる

では、先ほどの公式に代入してみましょう。

$V[X] = p - p^2$

これで完成でもいいのですが、因数分解をしてもう少しきれいにします。共通している $p$ でくくってみましょう。

$V[X] = p(1 - p)$

これがベルヌーイ分布の分散の公式です。

この式が意味すること

数式が出たところで、この $p(1 - p)$ が何を意味しているのか、グラフのイメージで考えてみましょう。

この値が一番大きくなる（ばらつきが最大になる）のは、確率 $p$ がいくつの時だと思いますか。

答えは $0.5$ の時です。

$0.5 \times (1 - 0.5) = 0.25$ となります。

逆に、確率 $p$ が $0.1$ （めったに起きない）だったり、 $0.9$ （ほぼ確実に起きる）だったりすると、この値は小さくなります。

$p = 0.5$ の時：表か裏か全く読めない＝ ばらつき（不確実性）最大
$p = 1.0$ の時：必ず表が出る＝結果が決まっているので ばらつきゼロ

分散の式 $p(1 - p)$ は、「結果の読めなさ加減」を見事に数字で表していることがわかりますね。

まとめ

いかがでしたか。

今回は、確率分布の基礎であるベルヌーイ分布について解説しました。

ベルヌーイ分布： $0$ か $1$ の2択の世界
期待値： $p$ （確率そのもの）
分散： $p(1 - p)$ （確率 $0.5$ で最大になる）

数式で見ると難しそうに見えますが、意味を紐解けば、「当たり前のこと」を数学の言葉で書いているだけだと気づいたのではないでしょうか。

このベルヌーイ分布は、実はもっと複雑な「二項分布」などの基礎となる重要なパーツです。まずはこのシンプルな仕組みをしっかりと自分のものにしておいてください。

次は、このコイン投げを何回も繰り返したときに現れる「二項分布」について学んでみると、統計の世界がさらに広がりますよ。

セイ・コンサルティング・グループの新人エンジニア研修のメニューへのリンク

投稿者プロフィール

山崎講師代表取締役

セイ・コンサルティング・グループ株式会社代表取締役。
岐阜県出身。
2000年創業、2004年会社設立。
IT企業向け人材育成研修歴業界歴20年以上。
すべての無駄を省いた費用対効果の高い「筋肉質」な研修を提供します！
この記事に間違い等ありましたらぜひお知らせください。

学生時代は趣味と実益を兼ねてリゾートバイトにいそしむ。長野県白馬村に始まり、志賀高原でのスキーインストラクター、沖縄石垣島、北海道トマム。高じてオーストラリアのゴールドコーストでツアーガイドなど。現在は野菜作りにはまっている。