音の高さの不思議を解き明かす!メル尺度と人間の耳の驚くべき関係

こんにちは。ゆうせいです。

みなさんは、ピアノの鍵盤をイメージしたとき、ドから高いドへ移る感覚と、さらにその上のドへ移る感覚が同じだと感じませんか。しかし、物理的な数字の世界では、音の高さは一定の幅で増えているわけではないのです。今日は、私たちの耳がどのように音を捉えているのかを定義したメル尺度について、一緒に学んでいきましょう!

メル尺度とは何者か

音の高さを示す単位としてヘルツを思い浮かべる方が多いはずです。しかし、ヘルツはあくまで空気の振動数という物理的な量に過ぎません。これに対して、人間が主観的に感じる音の高さを尺度化したものがメル尺度です。

なぜこのようなものが必要なのでしょうか。実は、人間の耳は高い音になればなるほど、音の変化に対して鈍感になるという性質を持っているからです。

物理量と心理量の違いを例え話で理解する

ここで一つ想像してみてください。

真っ暗な部屋で1本のろうそくが灯っているとき、もう1本ろうそくを増やすと、部屋はとても明るくなったと感じますよね。では、100本のろうそくが灯っている部屋で、1本だけ増やしたらどうでしょうか。おそらく、明るさが変わったことに気づく人はほとんどいないでしょう。

音もこれと同じです。低い音の 100 Hz と 200 Hz の違いははっきりと分かりますが、高い音の 10000 Hz と 10100 Hz の違いを聴き分けるのは至難の業です。この感覚のズレを修正し、人間が 2倍高くなった と感じたら数値も 2倍 になるように定めたのがメル尺度なのです。

メル尺度の計算式を見てみよう

メル尺度を計算するためには、対数を用いた数式を使います。数式と聞くと身構えてしまうかもしれませんが、ゆっくり紐解いていきましょう。

一般的に使われる変換式は以下の通りです。

メル尺度 = 1127 \times \ln ( 1 + f / 700 )

ここで、 f は周波数を表します。この式に含まれる \ln は自然対数と呼ばれ、数値が大きくなるほど増え方が緩やかになる性質を持っています。この計算を通すことで、高い周波数の影響をギュッと圧縮し、人間の実感に近い数値へと変換しているのです。

メル尺度を利用するメリットとデメリット

この尺度を学ぶと、人工知能や音声認識の世界がぐっと身近になります。

メリット

  1. 音声認識の精度が上がるスマートスピーカーやスマートフォンの音声操作には、メル周波数ケプストラム係数という技術が使われています。人間が聞き取っている特徴を優先的に抽出するため、機械が言葉を理解しやすくなるのです。
  2. データの効率化人間には聞こえにくい高音域の細かい変化を無視できるため、処理するデータの量を賢く削ることができます。

デメリット

  1. 音楽的な正確さには欠けるメル尺度はあくまで平均的な人間の感覚に基づいています。楽器の調律や絶対的な音階を扱う場合には、ヘルツやセントといった別の単位の方が適していることがあります。
  2. 個人差を考慮しきれない人間の耳の聞こえ方は年齢や環境によって異なります。すべての人にとって完璧に一致する尺度を作るのは、非常に難しい課題です。

まとめと今後の学習指針

メル尺度は、物理の世界と人間の感覚の世界を繋ぐ架け橋のような存在です。私たちが普段何気なく聞いている音を、数字で表現しようとした先人の知恵には驚かされますね。

もっと深く知りたいと感じた方は、次は メルフィルターバンク というキーワードで調べてみてください。音がどのように分解されて機械に伝わるのか、その具体的な仕組みが見えてくるはずです。

セイ・コンサルティング・グループでは新人エンジニア研修のアシスタント講師を募集しています。

投稿者プロフィール

山崎講師
山崎講師代表取締役
セイ・コンサルティング・グループ株式会社代表取締役。
岐阜県出身。
2000年創業、2004年会社設立。
IT企業向け人材育成研修歴業界歴20年以上。
すべての無駄を省いた費用対効果の高い「筋肉質」な研修を提供します!
この記事に間違い等ありましたらぜひお知らせください。

学生時代は趣味と実益を兼ねてリゾートバイトにいそしむ。長野県白馬村に始まり、志賀高原でのスキーインストラクター、沖縄石垣島、北海道トマム。高じてオーストラリアのゴールドコーストでツアーガイドなど。現在は野菜作りにはまっている。