• ベストアンサー

音量、音圧、振幅、定義式、matlabについて よろしくお願いします。

はじめまして 音楽家(作曲、アレンジ)をやりながら大学の修士課程で信号処理(音声)の研究をおこなっています。 曲のミックス、マスタリング時において 各パートまたは2ミックスされたものに聴感上、音を前に出したり、迫力を出したりする時にコンプを使って音圧をあげます。 一般的には、このときにコンプを使うことによりデコボコだった時間軸波形を平らになるようにします。波形が変わるので若干音質も変化をします。 音量の上げ下げをするときは、ボリュームボタンを操作することにより音質を変えることなく音量を変えることが出来ます。 ここで質問なんですが 音量と音圧の定義(式)または違いは何でしょう? 次に matlabを使って音声信号処理シミュレーションを行っているときに 音声をmatlabに読み込み、音声の音量を変化させたいと思って、音声信号を定数倍することにより音量の変化を試みました。 ここで、音声を定数倍することにより音量を上げようとしたときに音質が変わる気がするのですが気のせいでしょうか?(音量の変化=振幅の変化?) 気のせいではないとしたら この理由として、自分なりの考えは matlabで扱える振幅の範囲を超えてしまい自動的にコンプがかかったような状態になったのではないか と思っています。 どうなんでしょうか? また、matlabのコマンドとして、取り込んだ音声データのボリュームを操作できる関数はないのでしょうか? さらに 音の音色を決めるのは「波形」だと言われていますが 市販されている各アーティストのCDをPCに取り込み波形を見ると、当然ですがミックスやマスタリングを行っていることによりほぼ平らになってます。 大体どんなアーティストのCDの波形を見ても同じ様な波形をしていると思いますが、 聞いてみると当然、それぞれのアーティストの曲が聞こえますね どうゆうことなんでしょうか? よろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • cqw32653
  • ベストアンサー率50% (121/239)
回答No.3

> >波形を短い時間軸(例えば数msec.)で拡大して見てみれば、著しく > >異なる波形をしています。 > >ですから、違う曲に聴こえるのは当然です。 > 私が聞きたかったのはそういうことではありません。 > たしかに波形を拡大してみれば異なっています。 これは、 > 大体どんなアーティストのCDの波形を見ても同じ様な波形をしていると思いますが、 > 聞いてみると当然、それぞれのアーティストの曲が聞こえますね とのご質問に対し、「いいえ、大体どんなアーティストの波形も同じような波形ではありません」「だから音が違うのは当然です」という意味の回答になります。 > 質問の意図は > 波形から音を見分けることが出来るのかということです。 波形を見れば形ですから「形が違う」というのは分かりますが、音ではありませんので「音を見分ける」というのは無理ですね。音の場合は聴覚を使って「聞き分ける」という作業になりますね。 いずれにせよ、どんな音量調整の作業でも、それが「整数倍」のゲインアップでない限り、必ず大なり小なり波形は「変質」します。それが聴覚で聞き分けできるかはまた別の話ですが。 波形から「音が見えた!」という人がいたら、ほとんど神の領域ですね。我々にわかるのはせいぜい、編集により「源波形から、相似形が崩れた」ということが形から分かるのみです。 > >もしも「整数倍」という意味であれば、原理的には音質劣化は生じて > >いません。 > 「整数倍」ではなくて1以上の実数ではないでしょうか? 定数は「1以上の実数」という意味でしたか?もしそうであれば音量調整の編集作業により、「音質劣化します」。音質劣化しないと言えるのは、上に書いたとおり「整数倍」の場合に限られます。ただし、クリッピングが生じた場合は話が別ですが。 上記、「定数」は「整数倍」ではないと分かったので、再回答します。 > ここで、音声を定数倍することにより音量を上げようとしたときに音質が変わる気がするのですが気のせいでしょうか?(音量の変化=振幅の変化?) 上記の「定数倍」が「整数倍」でない限り、編集によって音質(というより応答波形)は変化します。ですから気のせいではないかも知れません。 例えばある時間軸の中で、3点だけ離散サンプル点の数値を切り抜いて見てみましょう。かんたんのため、値を10進数の0~65535で扱います。    37785, 37789, 37924... これを電圧比で約+4dB、つまり約1.6倍にしてみます。すると、    40795.2, 40801.6, 41017.6... LPFで周波数制限された波形が完全に一致するためにはこのような数値にならなければいけないはずです。しかし悲しいかな、16bit信号ではこの小数点が扱えないため、    40795, 40802, 41018... となります。つまり、「波形の形が微妙に変わります」。 この数値丸めの悪影響は、信号のレベルが低い微弱音で、より深刻になります。この数値丸めの悪影響が出ないのは、「整数倍だけだ」というのは直感的にお解りいただけると思います。 波形を厳密に重ね合わせて比較すれば分かることですが、明らかに源波形と相似形ではなくなります。 以上から、ディジタル信号は、やたらとディジタル信号のままで音量編集してよいものではありません。それだけで音質は変化しますので。 …と、過去からもさんざん言われていることですね。

kamarcho
質問者

お礼

御丁寧にありがとうございました。

kamarcho
質問者

補足

ありがとうございます。 まだ研究を始めて日が浅く、無知なもので ためになりました

その他の回答 (2)

  • nokata
  • ベストアンサー率27% (134/493)
回答No.2

ほぼcqw32653さんが回答していますので補足的に少し。 音量を上げるためにレベルを上げ下げすれば音質は変わりませんが音色が変わります。デジタルでもアナログでも同じです。波形の変化量は一定の倍率なので変化無しと見るところですが、音色として違いが出てしまいます。しかし人の耳はそれを自動補正してしまうのであたかも同じであると錯覚するわけです。また波形をデスプレ-で見ても細かな違いはわかりません。音色に繋がる違いを見つけることは不可能だと思います。

kamarcho
質問者

補足

なるほど やはり波形を見て音色に繋がる違いを見つけることは不可能なんですね ありがとうございます

  • cqw32653
  • ベストアンサー率50% (121/239)
回答No.1

> 音量の上げ下げをするときは、ボリュームボタンを操作することにより > 音質を変えることなく音量を変えることが出来ます。 ボリュームボタンと仰っているその装置に内蔵されている機構は、ディジタルボリュームですか?それともアナログボリュームですか? > ここで質問なんですが > 音量と音圧の定義(式)または違いは何でしょう? 「音の大きさ」「音圧」「音圧レベル」には明解な定義があります。 しかしながら「音量」は定義がない感覚的な用語だと思われます。   cf. 「音量を上げてください」     「もうすこしボリュームを下げてよ」 定義については下記が良いですね。(Editorさんありがとう) http://ja.wikipedia.org/wiki/%E9%9F%B3 http://ja.wikipedia.org/wiki/%E9%9F%B3%E3%81%AE%E5%A4%A7%E3%81%8D%E3%81%95 よく混同されている方を見かけるのですが、学術的な意味での「音の大きさ」「音圧」「音圧レベル」は本来違うものですから、意識して使い分けるようにした方がモアベターです。 以下、matlabを直接使ったことが無いので想像半分で回答します。 > matlabを使って音声信号処理シミュレーションを行っているときに > 音声をmatlabに読み込み、音声の音量を変化させたいと思って、音声信 > 号を定数倍することにより音量の変化を試みました。 > ここで、音声を定数倍することにより音量を上げようとしたときに音質 > が変わる気がするのですが気のせいでしょうか?(音量の変化=振幅の > 変化?) 「定数倍」とおっしゃっているのは「整数倍」の意味でしょうか? もしも「整数倍」という意味であれば、原理的には音質劣化は生じていません。「整数分の1」であれば音質劣化が生じます。 ただし、音質劣化していないことを聴感のみで証明するには個人の環境では難しいです。編集前と編集後の聴取音圧レベルを厳密に揃えることができれば、聞き比べが可能です。音量が変化すれば感覚的な音質も変化するのがヒト聴覚の特徴ですから、私感に頼った「変わる/変わらない」の議論はあまり意味がありません。 > 気のせいではないとしたら > この理由として、自分なりの考えは > matlabで扱える振幅の範囲を超えてしまい自動的にコンプがかかったよ > うな状態になったのではないか と思っています。 > どうなんでしょうか? 元波形と、編集完了後の波形の同一箇所を見比べてみればハッキリします。見比べてみましょう。 ただ、「定数倍」とおっしゃっていることから、レベルを上げているのですよね。一般のパッケージコンテンツ音楽ソフトはほぼ波形が上下フルスゥイングしているものですから、それのレベルを「倍」になんてしてしまったら、当然レベルオーバーを起こします。 編集ソフトウェアが優れていれば、そのオーバーレベル部分に折り返し歪みが生じないよう、波形コンプレッサーの動作が入り、波形の尖塔部が丸まります。 matlabもライブラリを拡張すれば何でもできるはずですから、自作すれば各種の編集も半自動化が可能と想像します。 > さらに > 音の音色を決めるのは「波形」だと言われていますが > 市販されている各アーティストのCDをPCに取り込み波形を見ると、当 > 然ですがミックスやマスタリングを行っていることによりほぼ平らにな > ってます。 > 大体どんなアーティストのCDの波形を見ても同じ様な波形をしている > と思いますが、 「ほぼ平ら」の意味が分かりませんが、ようするに振幅が常時高いレベルを保持している、つまりダイナミックレンジが狭いという意味でしょうか? それは楽曲にもよります。例えば、良く売れるポピュラー音楽であればご指摘どおりかも知れませんが、一部の現代音楽や環境音楽では弱奏部と強奏部でかなり波形(のレベル)が違います。 > 聞いてみると当然、それぞれのアーティストの曲が聞こえますね > どうゆうことなんでしょうか? 波形を短い時間軸(例えば数msec.)で拡大して見てみれば、著しく異なる波形をしています。 ですから、違う曲に聴こえるのは当然です。 こういうものを使って音楽波形を眺めてみてください↓ http://www.cycleof5th.com/products/soundengine/

kamarcho
質問者

補足

回答ありがとうございます >波形を短い時間軸(例えば数msec.)で拡大して見てみれば、著しく >異なる波形をしています。 >ですから、違う曲に聴こえるのは当然です。 私が聞きたかったのはそういうことではありません。 たしかに波形を拡大してみれば異なっています。 質問の意図は 波形から音を見分けることが出来るのかということです。 >もしも「整数倍」という意味であれば、原理的には音質劣化は生じて >いません。 「整数倍」ではなくて1以上の実数ではないでしょうか? >「整数分の1」であれば音質劣化が生じます。 「整数分の1」ではなくて [-1<0,0<1] の範囲でということではないでしょうか? 私の勘違いですか? ちなみに 一般的に「定数」というのは「整数」とは意味が異なります。 定数とは任意の実数か任意の複素数のことです まあ、「音量をコントロールしよう」ってときに複素数や負の実数は使いませんが

関連するQ&A

  • マスタリング時の波形の振幅について。

    初心者ですが、マスタリングに挑戦しています。 cubase 5にてミックスの時点で「聴感上の音量をある程度そろえて書き出し」をしました。(音量揃えはmaximaizerで) その後wavelab 7にて全曲を読み込んでみました。 音量は揃って聴こえるのですが「波形の振幅が狭く圧縮されている曲」があります。 これは問題ないのでしょうか? ご教授ください。 ちなみにマキシマイズはwaves L3-LL Multi Stereo とPSP Vintage Warmer 2を使用しています。

  • オーディオデータの音圧を上げる方法

    Macintoshにデジタルパフォーマーを入れて、 音源を制作しています。 ミックスしたデータが、ノーマライズしても 音圧がとても小さくて、聞こえにくいです。 どうずれば、市販のCDのような音圧になるでしょうか?? マスタートラックと、AUXトラックに コンプやリミッターをかけてみましたが、 聞こえる音は変化しても、 録音してみると、 コンプをかける前と変わっていません。 教えてください!

  • マスタリングしても自分の曲に音圧がでません

    マスタリングをしても自分の曲に音圧がでません 最近DAWで作曲をはじめた初心者ですが、最近マスタリングをしても自分の曲に音圧がでなくてこまっています。 ギター一本の曲の時は音圧がそれなりにでるんですが、ギターを左右に振った曲だと音圧がまるででないです。 ミックス時のEQの削りなどが足らないからでしょうか? 他の曲をきいたあと自分の時だけ音量のつまみをあげなくてはなりません ギター1本の曲 http://www1.axfc.net/uploader/Sc/so/335749 ギター2本の曲 http://www1.axfc.net/uploader/He/so/359467 が楽曲のファイルになります

  • CD並の音量にしたいのですが

    CDは結構音がデカイですよね。 EQやトータルコンプ等を使って音圧レベルを上げてみても、0dbピークギリギリに上げてみてもまだCDの方がかなり音量が大きいです。 CDからリッピングしたデータを波形編集ソフトで開いてみた所、0dbを超えてしまっています。 これは超えてもいいと言う事なんでしょうか? とにかくCD並に音量を大きくしたいです。

  • tranceを作っています!音圧の稼ぎ方を教えてください!

    今SONAR8power stuidoを使用してtranceを作っています クラブでDJをしながら自作曲も織り交ぜたいのでアーティストの方の曲に負けないくらい音圧を出すにはどうすればいいでしょうか? 今は作ったプロジェクトの各トラックを大体ボリュームを調節して、マスターバスにboost11を入れてwav化、wav化したものに最後にマルチバンドコンプをかけて調節してというような感じでやってます

  • HRHMのミックス、マスタリングの方法

    作曲をしていてミックスマスタリングの勉強もしています。 HRHMのミックスについてですが、どうすれば近年のバンドの音源 のように音圧がでるか、悩んでいます。 以前この手のジャンルはすべてのパーツにコンプを深めにかけるのがコ ツをいうことをきいたことがあるのですが。試してみても音がゆれてし まいう~んという感じです。 皆さんはこの手のジャンルはのミックスはどうしているのか気になりま す。 またミックスマスタリングの参考になる文献等がなかなかなく、苦労し ています。 この分野は若干秘匿される傾向にあるのでしょうか。 特にHRHMのミックスは雑誌で特集を組んでいても、どの雑誌も触れてい ない、といった印象を受けます。 既存曲を参考にしてみたりするのですが、聴いただけでは 他の音も同時に鳴っているのがほとんどなので、コンプ等も含め、ディ レイリバーブがどのくらいかかっているかなど全く検討がつかない状態 です。周りが静かなら多少はわかるのですが。。 続けていればわかるようになるものでしょうか? 公式を知らずに数学の問題を解かされているようです。 よろしくお願いします。

  • CUBASE LE5でマスタリング

    バンドでCUBASE LE5を使用しております。 先日、全てのパートを録音し終わりましてミックス作業も終わりました。 CUBASEを使うのは今回が初めてでしてわからないのですが、CUBASEでマスタリングの仕方がわからないので教えてください。 現在ミックス作業まで終了の状態ですが、そのまま書き出しても、市販のCDと比べるとだいぶ音圧、音量が少なくなっています。マスタリング作業で少しは近づけられるのでしょうか? よろしくお願いいたします

  • ビブラートをかけたときの音量の変化について

    弦楽器の音源を聴いていると、ビブラートを下にかけているときに音量が少し下がり、上にかけているときに音量が少し上がる、ということがあります。 最初は気のせいかと思ったのですが、波形解析ソフトで調べたところ、ビブラートをかける前後で明らかに波の振幅が変化しているので、気のせいではなさそうです。 これはビブラートをかける上でよくあることでしょうか? ビブラートは音量ではなく音程を変化させる技術ですから音量が変化するはずはないのですが、実際には振動している弦に指を置いているわけですから、指が振動を吸収して音量が下がる、といったこともありうるのでしょうか(ただ、これだと上にかけたときに音量が上がる理由が説明できません)。

  • ミックスダウンしたら音量が小さかった場合

    打ちこみで曲を作ろうとしている者です ソフトはSONAR X1 LEを使っていて 他のソフトでMIDI音源を作り インポートしたものをプラグインシンセで鳴らしています。 トラックをバウンズしてノーマライズをかけてからミックスダウンしても、他の曲と比べると音量が明らかに半分くらいしかありません。 トラック1つ1つの音量を上げるとクリッピングを起こしてしまいます。 MIDI音源を作る時点で問題があるのでしょうか それとも何か波形処理をしたり音圧を上げたりすることが必要なのでしょうか また、する必要がある場合やり方も教えていただけると嬉しいです。 まだ初心者なのでわからないことが多いのですがよろしくお願いします。

  • TMPGEnc4の音量調節のやり方について教えて下さい!!

    動画編集の際、音声ボリューム調整を行う場合あの小さな波形で一番ピーク時を探し出し 波形枠内限界までボリュームを上げて調節するしかないのでしょうか? もっとわかりやすく簡単に、適度な音量で出力する方法ってありますか? ここで言う適度とはコンポに繋げたときに出るLとRの波形のオーバーラインの一つ手前の事です。 また出力設定で、aviでは音声を非圧縮設定で出来ますがmpegでは非圧縮の設定が出来ず、 ”MPEG1 audio layerIIとIII”でビットレートは”64~384”までしか設定出来ません。 という事はmpegで出力するには圧縮されるため、元の音声より悪くなるという事でしょうか? ”MPEG1 audio layerIIとIII”ビットレートは”64~384”とはどのくらいのものなのでしょうか?

専門家に質問してみよう