• 締切済み

MP3エンコードについて

MP3のエンコードについて、いくつか疑問点があります。 一度に多くの質問をして申し訳ございませんが、分かりやすく教えてください。 1)PCMについて WAV変換時のPCM出力とはどういうものなのでしょうか? 2)サンプリング周波数について CD→WAVに変換するときに設定しますが、サンプリング周波数というとA/D変換のイメージが有り、CD→WAVだとデジタル→デジタルなのでは??イメージがわきません。ここで言うサンプリング周波数とは何? 3)ビットレートについて ビットレートは1秒間の情報量だと考えています。MP3圧縮は、人間の耳に聞こえない領域をカットすることで圧縮していると思いますが、ビットレートが低くなればなるほど、情報量を減らす為に、人間の耳に聞こえる領域までカットされてしまうということなのでしょうか? 4)プリエンファシスとは何? 3種類ぐらい設定ができるみたいですが、それぞれどういうことなのでしょうか? 5)MPEG-2.5 Audio Layer-3について 入力PCM周波数:48-32kHz → MPEG1 入力PCM周波数:24-16kHz → MPEG2 となっているなら、MPEG2.5とは 入力PCM周波数16kHzより低い周波数の場合を言うのでしょうか?

みんなの回答

  • Naka
  • ベストアンサー率44% (527/1181)
回答No.2

◆Naka◆ 「お礼」を読ませていただきました。 どーもレスが遅くなり、申し訳ありません。 今一つ自信がなかったので様子を見ていたのですが、書き込みがないようなので、しゃしゃり出てきました。 m(_ _)m プリエンファシスについてですが、ご質問の「午後のコーダ」での設定は、私が[4]で説明させていただいた両方を表すものと思われます。 最近のデジタル入力に対応したサウンドカードの場合、ソースの音源にかけられているプリエンファシスコードは無視してしまいますので、プリエンファシスのかけられたソースをエンコードする際に、「午後のコーダ」側で処理してやるための設定なのです。(WAVファイルにはエンファシス情報の記録はできません) まず「エンファシスなし」は、そのまま高域補正を行わない設定ですね。 例えば今のオーディオCDはエンファシスをかけていません。 ですからCDをソースにする場合は、この設定で問題ありません。 次いで「50/15ms」は、一部のオーディオCD(古いものに多い)において扱われるプリエンファシスの規格に合わせたものだと思います。 昔のCDは今のものほど音質が良くなかったため、プリエンファシスコードのかけられたものが存在します。 そういう一部のCDからのキャプチャの場合、ここに設定してやります。 CCITT j.17は、CCITT(Consultative Committee for International Telephony and Telegraphy、国際電信電話諮問委員会、ITUの前身、Orange Booksなど有名ですね)によって勧告された通信規格です。いくつかのバリエーションがあるようです。 ここでは衛星放送(BSやCS)のデジタル音声にかけられているプリエンファシスと同じ種類のものではないかと思われます。 要するに、これらは元となるソースデータの状態によって切り替えてやることになるわけですね。 間違いがありましたら、ご指摘ください。

hir
質問者

お礼

丁寧に回答いただき、本当にありがとうございます。 よくわかりました。MP3の規格を勉強しようと思っても、なかなか調べることができなくて困っていたので、ここで教えていただいて助かります。また、何か不明点があれば、質問させてもらいます(まず、自分で調べてから来ますが)。そのときは、また助けてくださいね。(^^;

  • Naka
  • ベストアンサー率44% (527/1181)
回答No.1

◆Naka◆ 申し訳ありませんが、全部には答えられません。(^^;) [1] PCMはアナログをデジタル化するフォーマットの一つで、で、Pulse Code Modulationの略です。サンプリングレートやビット数、またモノラルかステレオ(バイノーラル)かの設定が可能です。 [2] サンプリングレートは、「1秒間に行う入力音声信号のA/D変換回数を、周波数で表したもの」ですよね。 一般にCDの音声信号をWAVに変換する際には、デジタルデータを直接に抽出するのでなければ、D/Aコンバータを通され一旦アナログ信号に変換されたものを、再度A/Dコンバータを通してデジタル化する、という行程を踏みます。 その際には、サンプリング周波数の設定ができる(必要)になるわけですが、hirさんのおっしゃる例は、おそらくデジタル信号の抽出時におけるサンプリング周波数のことだと思います。 これはデジタルデータをサンプリングする際に、取り出す段階で適用してやるものでしょう。 [3] それでよろしいと思います。 可聴領域の信号までカットすることによって、データ量を減らす処理を行うことになるわけです。 ですからビットレートを下げるほど、高域や微小な音はスポイルされ、詰まったような音質になってきます。 [4] プリエンファシスは高域信号の補正に使われます。 高域を強調して録音し、再生時には高域をカットする特性を持ったフィルターを通して(ディエンファシス)元通りの特性に戻してやる仕組みですね。 高い周波数の信号は、伝送される途中で品質が落ちるために考え出された手法です。 これが3種類あるということですが、どういう3種類なのでしょうか?? 「かける周波数」についての区別でしょうか。 それとも「ディエンファシスフィルタを適用するかどうか」といった区別でしょうか。 もし後者でしたら、そのデータにフィルタを適用しない(エンファシスのフラグをデータ中に打ち込まない)場合、プレーヤ側でディエンファシスを担当する、という意味です。 この場合は、ファイル名でプレーヤが区別できるようにされているはずです。 [5] これについては、勉強不足でよくわかりません。 詳しい人の回答を待ってみましょう。 私もヒマがあるときに調べてみたいと思います。 以上、あんまり答えになってなかったかもしれませんが… m(_ _)m

hir
質問者

お礼

回答ありがとうございます。 なかなか難しいですね。 プリエンファシスについてですが、 現在、エンコーダソフトとして「午後のこーだ」を参考にしているのですが、その設定で、 ・エンファシスなし ・50/15ms(CD-DA Emphasis) ・CCITT j.17 の3種類の設定ができるようです。この設定は、Nakaさんが言う、前者/後者のどちらになるのでしょうか?わかるようようでしたら、また教えてください。

関連するQ&A

専門家に質問してみよう