「ほっ」と。キャンペーン

サンプリング周波数とかビットレートとか

自分の中でごっちゃになっていたので、まとめてみた。
[img:サンプリングレートとビット深度の絵]

用語


■サンプリングレート
(=サンプリング周波数)
44.1kHz ならば、44100回/秒でデータを取る
波の横幅(細かさ)=音の高さ

サンプリング定理(周波数の2倍でサンプリングすれば元を再現可能)より、
音声周波数22kHzまではサンプリングできる計算になる。
普通のCDは20kHzまでしか録らないのでこれで十分。

ところでサンプリング定理って、
よくわかってないんだけど、
1周期中2点をサンプリングして、
その間を再現するのは正弦波で近似ってまじすか?
追記:
サンプリング定理はフーリエ変換した結果についての定理なので、
そこで言う周波数とは自ずと正弦波に限定されます。
「サンプリング周波数(fs)の半分未満の正弦波しかサンプリングできない」
というのがサンプリング定理。
だそうです。

■量子化ビット
(=ビット深度)
16ビット ならば、波形の高さを2^16に分割する。
波の高さ=音の大きさ

ビットレートは転送(処理)速度で、単位bps。
量子化ビットとは全然別物。
ビットレートについては後述。

ちなみに量子化はクオンタイズと言うが、
クオンタイズビットとは言わないらしい。
クオンタイズというと、
DTMらへんでは音のタイミングを合わせる、とかそんな感じ。

追記:
縦軸の単位はdBではないらしい。
音を電圧に変換したときの波になるので、
音圧とは直接的にイコールではないようだ。
ここは電気の話になるのでまったくわからない。
難しい。

ビット深度とビットレート


wikipedia より。
ビットレート = (ビット深度)* (サンプリング周波数)* (チャンネル数)
例えば、サンプリング周波数 44.1kHz、ビット深度 16ビット、2チャンネル(ステレオ)の場合のビットレートは次のようになる:
   16 * 44100 * 2 = 1411200 ビット/秒 = 1411.2 kbps

ビットレートとは、単位時間に処理されるデータ量を意味する。


上記の例は CD の場合。
mp3 は、再生機の仕様が最大 320kbps となっていることが多い。
この数字と 1411.2kbps は大分違うように思うが、
この bps は圧縮後のデータ処理速度なので、
CD のビットレートと mp3 のビットレートを比較しても、音質とは無関係。
192kbps の mp3 でも、プロでも wav と聞き分けができないほど
音質は問題ないらしいという話も。
私個人は聞き比べたことがないのでわからない。
録音品質が相当悪くても気にならないタイプだからかも。

身近な仕様


■CD
サンプリング周波数 44.1kHz
音声周波数帯域 20Hz~20kHz
ダイナミックレンジ 96dB(=1ビット6dB * 16bit)

■DVD Audio
サンプリング周波数 48kHz,96kHz,192kHz
音声周波数帯域 ~88kHz(192kHz)
ダイナミックレンジ約146dB(量子化ビット 24bit)

レンジ 96db って、どこを中心にしているのだろう?
というのはおかしいかもしれないが、
0db は音がない状態ではない(私の左耳の聴力は 4kHz で -5db だ)ので、
極端な話 -96db ~ 0db ということもありうるんだよね?
そのあたりは、ミキサーとかプロデューサとかの好みなんだろうか。

あと、レンジが 96db あっても、
イヤホンあたりでは全部再現できないのではないか。
ちゃんとしたウーファーとか要りそう。

今後


ここまで調べて、ロスレスに興味出てきた!
よく見かけるのって、FLAC とか Apple Lossless あたりかな。
とうとうハフマン符号化をちゃんと理解せねばならん時が来たかも(笑

プログラミングできる天才ちょっとこい
ハフマン符号化ってなに?
http://nantara.blog73.fc2.com/blog-entry-461.html
[PR]
Commented by 抹茶あずき at 2014-08-25 19:51 x
すげー!!!
大変参考になりますた☆
Commented by xiaoxia at 2014-08-26 17:40
■抹茶あずきさま
きゃーお久しぶりですー!
お元気でしたかー?
ご参考になってうれしいですー(^-^)v
Commented by はじめまして at 2014-08-28 10:31 x
>1周期中2点をサンプリングして、
>その間を再現するのは正弦波で近似ってまじすか?

話の方向が逆で、
サンプリング定理はフーリエ変換した結果についての定理なので、
そこで言う周波数とは自ずと正弦波に限定されます。
「サンプリング周波数(fs)の半分未満の正弦波しかサンプリングできない」
というのがサンプリング定理。

ヴァイオリンは倍音が多いことで有名ですよね。
ヴァイオリンで 440Hz の音を鳴らすと、
440Hz の正弦波に加え、2*440Hz, 3*440Hz, ...
の正弦波が重なって鳴っていると考えられます。

CD の fs は 44.1kHz ですが、
これだと高々 50 倍の倍音 = 50 * 440Hz までしか拾えません。
もし現実のヴァイオリンが 51 倍以上の倍音を含む
(かつその振幅が 1LSB 以上ある)とすれば、
「CD では 440Hz のヴァイオリンの音すら正確には録音できない」
というのがサンプリング定理から証明されます。
Commented by 続き at 2014-08-28 10:32 x
ダイナミックレンジというのは単に
表現可能な電力振幅の最小と最大の比の常用対数*10なので、
16bit ならば 電圧振幅=1LSB と電圧振幅=32767LSB の比で
log_10((32767/1)^2)*10 = log_10(32767)*20 = 90 dB てことになります。
96dBてのは log_10(1^16)*20 という計算ですが、これは誤りだと思います。
電圧振幅=-32768LSB と電圧振幅=32767LSB てのは電力的には同じですからね。
まあ数値は多いほうが景気がよさそうだというカタログスペック的な話かもしれません。

Commented by xiaoxia at 2014-08-28 19:03
■はじめましてさま
ご教授有難うございました。
サンプリング定理の話は納得しました。

バイオリン弾きなので、倍音についてちょっと検索してみましたが、
E線開放弦(660Hz)では、少なくとも48kHzまでは出ているのですね。
人間の耳では感知できないことになっていますし、
モスキート音も聞こえないトシですが(笑)、
録音と生音は違うと常々思っているので、
耳に聞こえないにしても、何か違うのだろうなぁと思いますね。

ダイナミックレンジのほうは、(現在のところ)全然わかりませんです(苦笑
文系にはつらいですが、なんか…色々がんばります(^^;;
Commented by kototubo at 2014-09-03 00:02
本文に余り関係無いのですが、リンク先の高校生がかしこすぎて、
(゚д゚)←こんな顔になりやした……
Commented by xiaoxia at 2014-09-03 17:55
■kototuboさま
まったく同感ですー!
私も何度読んでも真ん中あたりで挫折しますorz
by xiaoxia | 2014-08-21 17:49 | | Comments(7)

ダメ女プログラマ&主婦&腐女子&バイオリン弾き


by 小霞