• ベストアンサー

MDCT(Modified-DCT)は可逆ですか?

例えばwavファイルにDFTやDCTをかけて、IDFT・IDCTをかけると ほとんどもとの音に戻る(多少の誤差を除いて)のですが、 MDCT-IMDCTをかけると、もとに戻りません。 窓の幅を短くすればするほど、低音がなくなっていくような感じです。 MDCTは可逆変換ではないのでしょうか?

質問者が選んだベストアンサー

  • ベストアンサー
  • kumipapa
  • ベストアンサー率55% (246/440)
回答No.1

仕事でDFTはよく使用するのですが、DCTやMDCTはあまり馴染みがないので、本当に参考の参考までに思ったことを回答させていただきます。 DFTとDCTの違いはともかくとして、MDCTは、DCTの観測窓の境界で発生するノイズを抑えるため、サンプリング点数の半分(つまり観測窓の半分)のみをコサイン変換し、コサイン変換をする領域を徐々にずらしていくという手法を取っています。 DFTとDCTの場合、変換される基本周波数(最低周波数)は、観測窓の時間幅Tの逆数、即ちf0=1/Tで与えられ、その整数倍の周波数のパワーが求められます。また、どこまで高周波を検出できるかは、その時間窓を構成するサンプリングのポイント数により支配され、時間窓が1/T、その中のサンプリングポイントがN点ならば、f0=1/Tから、2f0, 3f0, ... ,(N/2)f0までの周波数のパワーが計測可能となります。 一方、MDCTの場合、先述したように、観測窓(計測ポイント)の半分しか利用されませんので、実効的な時間窓はT/2, 故に計測される基本周波数f0'はf0'=1/(T/2) = 2f0、そして、その整数倍の周波数が計測されますので、結局、計測可能な周波数は、(DFTやDCTと同じ時間窓で計測したとして)2f0, 4f0, 6f0, 8f0,....となってしまい、観測される基本周波数が2倍に上がってしまうとともに、低周波域で計測される周波数の間隔が2倍に粗くなってしまう(周波数の再現性が低下する)と思われます。 ご質問のように、「窓の幅を短くすればするほど、低音がなくなっていく」というのは当然で、窓を1/nにすれば(即ちT/nにすれば)、計測される基本周波数はf0' = 1/(T/2n) = 2n f0と2n倍も高周波になり、通常のDCTで測定できていた低周波域f0,f1,f2,...(2n-1)f0は観測できなくなります。また、計測される周波数は、2nf0, 4nf0, 8nf0,...と、通常のDCTの2n倍も粗い(飛び飛びの)周波数しか計測できないことになりますので、実際の時間窓によっては、極端に低音が消えてしまってもなんら不思議ではないと思われます。 MDCTで(一般的にはDFTやDCTでも)低周波領域を落とさずにきちんと計測したい場合には、時間窓を充分に広く取る必要があると思われます。 以上、とんちんかんな回答でしたらすみません。

ryopis
質問者

お礼

技術的ながら簡素で曖昧な質問に対して丁寧なご回答ありがとうございます。 MDCTはDCTに比べて周波数領域での観測できるスペクトルが2倍間隔に なるから、特に低音で音がなくなっているということなんですね。 確かに、DCTは例えば1024サンプル(時間領域)から1024スペクトルを 得られるのに対して、MDCTは1024サンプルから512のスペクトルしか 得られないため、そうなるんですね。 #しかも基本周波数が2倍になるため低周波が特に影響を受けると。 それでAACのコーデックでは、低音のことをかんがえて十分な窓幅をとっている (2048 or 256みたいですが)ということでしょうか。。。 ありがとうございました。

関連するQ&A

  • 音楽のファイル形式について

    いきなりの質問失礼します。 可逆、非可逆圧縮のことでCDのファイル形式はwma mp3 waveなどありますがファイル形式を変えて保存する際、変換しても音が悪くならず、軽くなるファイル教えて下さい(..) またビートレートとは、例えばもとがwmaの100ぐらいで300ぐらいに戻しても音質はよくなりませんよね?

  • iTunesの音質について質問です。

    iTunesの音質について質問です。 以前、ロスレスは再生時にロスレスからWAVの状態にもどして再生する。この過程があるからWAVより多少、音質が下がるということを教えていただいたんですが、これが本当ならロスレスで取り込んだ曲をWAV、AIFFに変換すればロスレスからWAVに戻すという作業がなくなるから多少、音質の向上があるのでしょうか? もしくは一度ロスレスで取り込むとどんなに変換しても非可逆圧縮のままなんでしょうか?

  • WMA→WAVに変換したときの音質は?

    おはようございます。 iTunesでWMA形式のファイルををWAV形式に変換したのですが、この場合、音質はどうなっているのでしょうか? WMAは不可逆圧縮で変換時に音質が劣化してしまうと思うのですが、変換したWAVはWMAよりも容量が格段に大きかったのです。高音質で取り込めるWAVといってもWMAから変換した場合にはこのようになるのはおかしいような・・。 お願いいたします。

  • 音声についての質問

    mp3をPC内に保存しておいてwavにデコードしてCDに焼いたりしています。 oggという形式のファイルをCDに焼くにはwavに変換すると思いますが、 フリーウェアでお勧めのソフトはありますか?? また、mp3をwavにデコードするとよく効きますが 不可逆圧縮のデータをwavにするのは『デコード』という言葉は正解なのでしょうか? 同じ不可逆圧縮のoggなどもwavにデコードするという表現は当てはまりますか?

  • WVファイルとは?

    WVファイルとはなんですか? どんな場面で使うことが多いのでしょうか。 WAVに変換できるというのは ググって分かったんです。 ということは可逆圧縮ですか? 大雑把な質問で申し訳ないですが、 どなたか詳しい回答お願いします。

  • Windows Media エンコーダの使い方が分かりません

    Windows Media エンコーダを使用して、15Gある可逆圧縮のWAVファイルをWMA(114kbps)に変換したいのですがやり方が分かりません。 どなたか詳しく教えて頂けないでしょうか?  

  • バイナリーデータをCSV変換して元に戻す方法?

    あるバイナリーデータ(.WAVファイル)があります。 このファイルをCSV変換することはできました。 その後、CSVデータ上で値を変換し、もとのWAVファイルに直したいのですが、そういった作業は簡単にできるのでしょうか? この作業の場合、fwrite関数を用いて、バイナリーデータとしてwavファイルに書き込んでいくだけで良いのでしょうか? わかるかたがいましたら教えていただけないでしょうか? よろしくお願いします。

  • 極窓

    極窓でMUSファイルをMIDIやWAVに変換できると聞きました。 本当なんですか?本当だったらどなたか極窓の使い方をじっくり教えてください。。。

  • WAVをFLACに変換(Media Monkey)

    FLACに興味を持って「Media Monkey4.1.3.1708」を使用しはじめた初心者です。 これまでiTunesで,WAVにリッピングした音楽データが4,000曲ほどあるのですが,これをMediaMonkeyでWAV→FLACに変換したいと考えております。 「ツール」→「形式の変換」で,形式を「FLAC」,「形式設定」をデフォルトの「圧縮レベル6」にしたところ,ビットレートが1411→829等になりました。 これは,FLACへの圧縮によりビットレートが低下したということでしょうか?可逆圧縮なので,あんまり気にする必要はないものなのでしょうか? 大量のWAVファイルをFLACにして,タグ付けをしてNASで再生しようと考えており,せっかくFLACにしたので音が劣化したら切ないなと思いまして‥。 よろしくお願いいたします。

  • MP3→WAV→MP3にした場合の音質の劣化

    いつもお世話になっております。 早速ですが、どうしてもWAVにする必要がある場合、MP3→WAVに変換して作業をし、保存時にWAV→MP3という事をします。例えば、SoundEngineはMP3に非対応ですから、このような工程がどうしても必要です。その際、MP3(320kbps)→WAVにて変換されたファイルは320kbps相当の音質のWAVになっており、その後MP3に変換されたファイルは320kbpsのファイルを再び320kbpsにて圧縮したものになっているはずです。聞き分けられるかどうかは別として、これは音質劣化を引き起こしていますでしょうか? また、別のパターンとしてMP3から他の非可逆圧縮形式に変換する場合はどうでしょうか?例えば、MP3→ATRAC3などです。ATRACエンコーダー側はMP3と同ビットレートあるいは近いビットレートに設定しているとします。