締切済み

MP3エンコードについて

2000/11/11 12:23

MP3のエンコードについて、いくつか疑問点があります。一度に多くの質問をして申し訳ございませんが、分かりやすく教えてください。１）ＰＣＭについてＷＡＶ変換時のＰＣＭ出力とはどういうものなのでしょうか？２)サンプリング周波数についてＣＤ→ＷＡＶに変換するときに設定しますが、サンプリング周波数というとＡ/Ｄ変換のイメージが有り、ＣＤ→ＷＡＶだとデジタル→デジタルなのでは？？イメージがわきません。ここで言うサンプリング周波数とは何？３)ビットレートについてビットレートは１秒間の情報量だと考えています。ＭＰ３圧縮は、人間の耳に聞こえない領域をカットすることで圧縮していると思いますが、ビットレートが低くなればなるほど、情報量を減らす為に、人間の耳に聞こえる領域までカットされてしまうということなのでしょうか？４)プリエンファシスとは何？３種類ぐらい設定ができるみたいですが、それぞれどういうことなのでしょうか？５)MPEG-2.5 Audio Layer-3について入力PCM周波数：48-32kHz →　MPEG1 入力PCM周波数：24-16kHz →　MPEG2 となっているなら、MPEG2.5とは入力PCM周波数16kHzより低い周波数の場合を言うのでしょうか？

hir
お礼率57% (16/28)

みんなの回答 （2）
専門家の回答

みんなの回答

Naka
ベストアンサー率44% (527/1181)

2000/11/13 05:28 回答No.2

◆Naka◆ 「お礼」を読ませていただきました。どーもレスが遅くなり、申し訳ありません。今一つ自信がなかったので様子を見ていたのですが、書き込みがないようなので、しゃしゃり出てきました。 m(_ _)m プリエンファシスについてですが、ご質問の「午後のコーダ」での設定は、私が[4]で説明させていただいた両方を表すものと思われます。最近のデジタル入力に対応したサウンドカードの場合、ソースの音源にかけられているプリエンファシスコードは無視してしまいますので、プリエンファシスのかけられたソースをエンコードする際に、「午後のコーダ」側で処理してやるための設定なのです。（ＷＡＶファイルにはエンファシス情報の記録はできません）まず「エンファシスなし」は、そのまま高域補正を行わない設定ですね。例えば今のオーディオＣＤはエンファシスをかけていません。ですからＣＤをソースにする場合は、この設定で問題ありません。次いで「50/15ms」は、一部のオーディオＣＤ（古いものに多い）において扱われるプリエンファシスの規格に合わせたものだと思います。昔のＣＤは今のものほど音質が良くなかったため、プリエンファシスコードのかけられたものが存在します。そういう一部のＣＤからのキャプチャの場合、ここに設定してやります。 CCITT j.17は、ＣＣＩＴＴ（Consultative Committee for International Telephony and Telegraphy、国際電信電話諮問委員会、ITUの前身、Orange Booksなど有名ですね）によって勧告された通信規格です。いくつかのバリエーションがあるようです。ここでは衛星放送（ＢＳやＣＳ）のデジタル音声にかけられているプリエンファシスと同じ種類のものではないかと思われます。要するに、これらは元となるソースデータの状態によって切り替えてやることになるわけですね。間違いがありましたら、ご指摘ください。

質問者

お礼

丁寧に回答いただき、本当にありがとうございます。よくわかりました。ＭＰ３の規格を勉強しようと思っても、なかなか調べることができなくて困っていたので、ここで教えていただいて助かります。また、何か不明点があれば、質問させてもらいます（まず、自分で調べてから来ますが）。そのときは、また助けてくださいね。(^^;

Naka
ベストアンサー率44% (527/1181)

2000/11/11 14:48 回答No.1

◆Naka◆ 申し訳ありませんが、全部には答えられません。(^^;) [1] ＰＣＭはアナログをデジタル化するフォーマットの一つで、で、Pulse Code Modulationの略です。サンプリングレートやビット数、またモノラルかステレオ（バイノーラル）かの設定が可能です。 [2] サンプリングレートは、「１秒間に行う入力音声信号のA/D変換回数を、周波数で表したもの」ですよね。一般にＣＤの音声信号をＷＡＶに変換する際には、デジタルデータを直接に抽出するのでなければ、Ｄ／Ａコンバータを通され一旦アナログ信号に変換されたものを、再度Ａ／Ｄコンバータを通してデジタル化する、という行程を踏みます。その際には、サンプリング周波数の設定ができる（必要）になるわけですが、hirさんのおっしゃる例は、おそらくデジタル信号の抽出時におけるサンプリング周波数のことだと思います。これはデジタルデータをサンプリングする際に、取り出す段階で適用してやるものでしょう。 [3] それでよろしいと思います。可聴領域の信号までカットすることによって、データ量を減らす処理を行うことになるわけです。ですからビットレートを下げるほど、高域や微小な音はスポイルされ、詰まったような音質になってきます。 [4] プリエンファシスは高域信号の補正に使われます。高域を強調して録音し、再生時には高域をカットする特性を持ったフィルターを通して（ディエンファシス）元通りの特性に戻してやる仕組みですね。高い周波数の信号は、伝送される途中で品質が落ちるために考え出された手法です。これが３種類あるということですが、どういう３種類なのでしょうか？？「かける周波数」についての区別でしょうか。それとも「ディエンファシスフィルタを適用するかどうか」といった区別でしょうか。もし後者でしたら、そのデータにフィルタを適用しない（エンファシスのフラグをデータ中に打ち込まない）場合、プレーヤ側でディエンファシスを担当する、という意味です。この場合は、ファイル名でプレーヤが区別できるようにされているはずです。 [5] これについては、勉強不足でよくわかりません。詳しい人の回答を待ってみましょう。私もヒマがあるときに調べてみたいと思います。以上、あんまり答えになってなかったかもしれませんが… m(_ _)m

質問者

お礼

回答ありがとうございます。なかなか難しいですね。プリエンファシスについてですが、現在、エンコーダソフトとして「午後のこーだ」を参考にしているのですが、その設定で、・エンファシスなし・50/15ms(CD-DA Emphasis) ・CCITT j.17 の３種類の設定ができるようです。この設定は、Nakaさんが言う、前者/後者のどちらになるのでしょうか？わかるようようでしたら、また教えてください。