ベンフォードの法則とは?

こんにちは。ゆうせいです。

今日は少し不思議で面白い数学の話、「ベンフォードの法則」についてお話しします。この法則を知ると、数字の世界がぐっと身近に感じられるかもしれません。


ベンフォードの法則とは?

ベンフォードの法則は、ある特定の条件を満たしたデータセットでは、数字の最初の桁が「1」から始まるものが非常に多くなる、というものです。普通、数字の先頭が「1」でも「9」でも同じくらいの確率で現れると思いませんか?でも実際には違うのです!

この法則によると、先頭の数字が「1」である確率は約30.1%、一方で「9」である確率はたったの4.6%です。

ベンフォードの法則の確率分布

以下は各先頭数字の出現確率を示します:

先頭の数字出現確率 (%)
130.1
217.6
312.5
49.7
57.9
66.7
75.8
85.1
94.6

驚きませんか?「1」から始まる数字がこんなに多いなんて!


どうしてこうなるの?

では、なぜこんな現象が起きるのでしょうか?これはデータの「スケール不変性」や「対数分布」に関係があります。

スケール不変性とは?

ベンフォードの法則は、データがスケール(単位や範囲)が変わっても同じパターンを保つ特徴を持っています。例えば、人口データを考えてみましょう。国ごとの人口は百万単位でも億単位でも、最初の数字が「1」で始まる割合が高くなるのです。

対数分布の影響

この法則を数学的に説明するには、次の式を使います:

P(d) = log10(1 + 1/d)

  • P(d)(ピー・ディー)は、最初の数字が dd である確率
  • d は最初の数字(1~9)

例として「1」が先頭の場合の確率を計算してみます: P(1)=log⁡10(1+11)=log⁡10(2)≈0.301

これが「1」の確率が30.1%になる理由です!


どこで見られる?

ベンフォードの法則は、次のようなデータでよく見られます。

  • 国の人口や都市の面積
  • 企業の売上や利益
  • 河川の長さや山の高さ
  • 電気代の請求額

一方で、ロトの当選番号やランダムに作られたデータには当てはまりません。これは、ベンフォードの法則が自然や社会的な「累積的な成長」に関連しているためです。


実際に使われる場面

ベンフォードの法則は、統計分析やデータ検証で非常に役立ちます。特に以下の分野で注目されています。

不正検出

会計や経済の分野では、企業が不正を行った場合、数字の分布がベンフォードの法則から外れることがあります。この特徴を利用して、不正の痕跡を発見することが可能です。

科学研究

科学データの妥当性を確認するためにも使用されます。例えば、実験データが正当であるかを確認する手段として活用されています。


面白い例え

この法則を「数字のクセ」と考えてみましょう。友達とじゃんけんをするとき、なぜか最初に「グー」を出す人が多い、というようなものです。数字にも自然に「得意な動き」があると考えると親しみがわきますね!


今後の学び

ベンフォードの法則は、数学や統計に興味を持つ良いきっかけになります。次に、対数や確率分布について学ぶと、この法則がさらに深く理解できます。また、実際に手元のデータを分析して、ベンフォードの法則が当てはまるか試してみるのも面白いですよ!

ぜひ、数字の不思議な世界を探求してみてください!

セイ・コンサルティング・グループの統計学が学べる研修

投稿者プロフィール

山崎講師
山崎講師代表取締役
セイ・コンサルティング・グループ株式会社代表取締役。
岐阜県出身。
2000年創業、2004年会社設立。
IT企業向け人材育成研修歴業界歴20年以上。
すべての無駄を省いた費用対効果の高い「筋肉質」な研修を提供します!
この記事に間違い等ありましたらぜひお知らせください。