2008年10月26日日曜日

mp3 を高音質スピーカで聴くという矛盾。

ども。たです。

え~と、間違えていたらごめんなさいなんですけど、
世の中に MP3 プレイヤ用高音質スピーカってありますよね?

それって矛盾してね?って話ですw
つーか、そもそも音質にこだわる奴は、MP3 使っちゃダメだろ。

というのも、CD の音源は、44.1kHz でサンプリングされており、
そのデータ長は 16bit、さらに、L、R の 2ch 分あるので、
データ量としては、

    44.1k [Hz] × 16 [bit] × 2 [ch] = 1411.2 kbps
    (bps = bit per second)

つまり、1.4Mbps 程度のものを、重要度の低いデータを削って
128kbps 程度に圧縮しているのが MP3 という音声ファイルの特徴。

CD の 44.1kHz というサンプリングレートは、人の可聴範囲が
20 ~ 20kHz というところから来ており、聞こえる範囲の音は、
全て記録するというスタンスを取っています。

しかしながら、音楽という意味であれば、そんなに広い帯域は
必要ないじゃん、とサンプリングレートを下げて、20kHz 付近の
高い周波数を表現できない代わりに、データ容量を抑えたのが
MP3 という規格なワケです。

ただ、1411kbps -> 128kbps だからといって、サンプリングレート
も約 10 分の 1 になっているのかというと、そうでもない様子。
だって、サンプリングレート 1/10 にしたら、4kHz くらいになって、
2kHz 程度の音までしか、正確に表現できなくなっちゃう。

電話などの音声のサンプリングレートが 5kHz ってとこから考えても
音楽を表現するのに、4kHz なんてのはありえない。
ちなみに、電話を通した自分の声がなんか変に聞こえるのは、
サンプリングレートが 5kHz 程度と低いことが影響している。
つまり、声に含まれる周波数を全てとらえきれないのだ。
しかしながら、音声通話というものの機能を考えるに、
正確に声のトーンを伝える必要なんてなく、会話の内容さえ
伝えられれば良いじゃないか、、、ということで、こういう仕様
になっているのだと推測される。

ま、電話が使われ始めた当初、それ以上の帯域を持つシステム
を構築できなかっただけなのかもしれないが。。。
ちなみに、そういうことなので、携帯電話においてもサンプリング
レートが 5kHz という伝統的な値を引き継いでいるのかどうか、
自分は知らない。

話が凄い勢いで横道にそれたw
話を本筋に戻す。

MP3 の 128kbps という低いデータレートをどう実現するか?
という話であるが、Wiki によると、「変形離散コサイン変換」
なんてものを利用しているらしい、、、が、数学の専門家
でない自分にはさっぱりな話であるw

どういう理屈かは分からないが、基本的に FFT というか DFT
の仲間っぽく、音声データなり、画像データなりを周波数領域に
変換するものっぽいが、DFT と違う点は、どうも、それが
ベースバンド付近に来るらしいってこと。
そう考えると、低いサンプリングレートでも十分概形は捉えらえ
られそうであり、そのデータを受けて、逆変換を行うことにより
元の音声データを復元しているのかな?って感じ。。。

自分で書いてて分からなくなりますた orz
申し訳ねぇっすw

そんなこんなで。
では。

0 件のコメント: