• 締切済み

音声解析について

LabVIEWを用いて波形解析を行っているのですが、窓関数の種類で ハニング、ハミング、ブラックマンの三種類を使用しています。 教授にどの窓関数が音声解析に適しているか、と質問され困っています どの関数が適しているか教えてください。できれば理由も・・・ サンプリングした時間は1秒で母音のみです

みんなの回答

  • sinisorsa
  • ベストアンサー率44% (76/170)
回答No.1

これらの窓関数の周波数特性の特徴を調べなさい。 メインローブの幅、サイドローブの減衰量の 2つが特に重要です。 実際に3つとも試して、結果を見れば何かわかるでしょう。 scilabには、窓関数の周波数特性のグラフを表示する ツールもありますよ。

関連するQ&A

  • フーリエ変換による周波数解析について

    フーリエ変換による周波数解析について 窓関数とは一体どのようにして選べばよいのですか? 一般的にはハニングが用いられているようなのですが、一般的に使われているからといった理由で ハニングを窓関数として用いてもよいものなのか困っています。 加えて質問なのですが サンプリング周期を1μsとした際に、ノイズの影響と思われる変動が波形にみられました。 つまりノイズはとても速い振動している、周波数が高いということでしょうか? もしそうであるならば フーリエ変換を行って際、ノイズの影響によるパワースペクトルは高周波数側にでてくると思うのですが 結果としてホワイトノイズのようになっています。これはノイズは低周波数側にも存在しているということですか? 最後に、フーリエ変換を行う際の設定についてなのですが データ数(サンプリング数)を25000個とすると積算回数は20000回でいいのでしょうか? ※ソフトの設定で選択できる積算回数は1000,2000.5000.10000,20000.50000です。

  • FFTを使って異なるサンプリング周波数での周波数強度について

    100Hzのsin波に対してFFTを行い周波数スペクトルを出したときのことです。 解析条件 サンプリング周波数・・・・44.1kHz , 22.1kHz FFTの点数・・・32768点 窓関数・・・ハニング窓関数 まず、サンプリング周波数44.1kHzで解析を行い、100Hzにメインローブが現れていました。 次に、サンプリング周波数22.1kHz以外は同様の解析条件で解析を行ったのですが、サンプリング周波数44.1kHzに比べて、100Hzのスペクトル強度が下がっていました。また、サイドローブは44.1kHzに比べて上がっていました。 スペクトル強度がサンプリング周波数によって変化するというのはありえるのでしょうか? それとも、私の組んでいるプログラムが間違っているという事なのでしょうか?どなたかご教授下さい。よろしくお願いします。

  • 音声解析ソフトについて

    音声解析ソフトについての質問です。 アンフェアの第4話・1/31放送で、 犯人の電話を分析 していた検視官の三上(加藤雅也)が、犯人の声の裏で聞こえる高速道路の音、その下で流れる川の音を音源分離して波形に表記し、この音声解析の結果、発信エリアの特定に成功するというシーンがありました。 その時に使用されていた音声解析が出来て、分析した音源ごとに波形で表示されるソフトは一体何というソフトなのでしょうか? 衝撃を受けてネットで検索したのですが、未だに何のソフトか分からないで質問させていただきたいのです。 ご存じの方、またMacに対応するソフトがあるのかご存じの方、ご教授下 さい。よろしくお願いします。

  • 音声解析ソフトについて

    音声解析ソフトについての質問です。 アンフェアの第4話・1/31放送で、 犯人の電話を分析 していた検視官の三上(加藤雅也)が、犯人の声の裏で聞こえる高速道路の音、その下で流れる川の音を音源分離して波形に表記し、この音声解析の結果、発信エリアの特定に成功するというシーンがありました。 その時に使用されていた音声解析が出来て、分析した音源ごとに波形で表示されるソフトは一体何というソフトなのでしょうか? 衝撃を受けてネットで検索したのですが、未だに何のソフトか分からないで質問させていただきたいのです。 ご存じの方、またMacに対応するソフトがあるのかご存じの方、ご教授下さい。よろしくお願いします。

    • 締切済み
    • Mac
  • 周波数解析のスペクトルについて

    waveファイルで取り込んだ音響データを、FFTを用いて周波数解析を行っています。 元のwaveファイルのデータは、ピーク値で20000示す時があるデータが入っているのですが、 そのFFTの結果が5000000など元の値とは桁違いの数字が出てしまいます。 これはなぜなのでしょうか? よろしくお願いします。 元データ サンプリング周波数:44.1kHz FFT解析条件 サンプル数:2048 窓:ハニング

  • ハミング窓関数とFFT(高速フーリエ変換)を用いて音(WAVE)ファイルを周波数解析したいのですが

    FFTを用いてドレミの周波数解析のプログラムを作ろうと勉強しています。 そこで理論的にわかっていないため質問させていただきました。 ハミング窓の使い方についてです。 ドレミファソラシドと1secごとに変化していくWAVEファイルがあった場合。(0-1秒=ド 1-2秒=レ) 1:0~50msハミング窓を与えてやる 2:その区間をFFTする。(データ数は512で考える) 3:求まった基本周波数からドレミの判定を行う 4:50msずらす 5:1に戻る ※汚いですが手書きで自分の↑のイメージを書いて見ました。http://www.jpdo.com/link/1/img/49864.jpg このようにして9秒まで分割して計算すればドレミの解析が出来るはずだと思っているのですが、どうやってハミング窓を0~50msなどという風に使えばいいのかがわかりません。 このあたりの概念がさっぱりなので、 どうすれば0~50msの区間をハミング窓で得られるのか。 ハミング窓で得た区間をFFTするにはどう考えるのか。 を是非教えてください。

  • フーリエ変換を用いた波形の特徴抽出

    波形の特徴抽出について以前質問をさせていただいたものです。 その後、試行錯誤してフーリエ変換を用いてみたのですがフーリエ変換がよくわかりません。 まず、波形に対しハミング窓を掛けて、それをフーリエ変換してグラフを出してみたのですが、3種類違う波形に対して同じ処理を行ってみたところ最終的に出てくるグラフは同じようなものになってしまいます。 これがなぜだかわからないのですがどなたか、わかる方がいらっしゃいましたらご教授ください。 加えて、フーリエ変換を用いて波形の特徴を抽出したい場合にどのような処理をどのような手順で行えばいいのか、わかる方がいらっしゃいましたら教えてください。 よろしくお願いします。

  • 音声の周波数ごとの位相を変調したい

    音声の音源について、聞いたときの音は変えず(振幅情報は変えず)、位相情報のみを、指定した周波数帯域ごとに指定した位相差分変調したいと考えています。 たとえば1kHzから2kHzの周波数帯はpi/3、 2kHzから4kHzの周波数帯はpi/2分、位相のみずらしたいといった感じです。 とりあえずハニング窓で1/2シフトで短時間フーリエ変換した後、指定した周波数帯域の位相成分にずらしたい位相差を加え、逆フーリエ変換して時間波形に戻し、足し合わせるといった処理をやってみましたが、窓で切った間隔ごとにノイズの入った音声になってしまいます。 どのようにしたらいいでしょうか?それともそんなことはできないんでしょうか? 初歩的な質問でお恥ずかしいですが、どうぞよろしくお願いします。

  • フーリエ変換について

    これから、FFTのプログラムを組んでみようと思います。 音楽ファイルを読み込もうと思いますが、 音楽ファイルは、不連続信号だと思うのですが、 音声は、44100Hzだから、必要な区間は、44100*2=88200点で、 0-88199,88200-176399,176400-264599,... という区間ごとに読み込んでいけばいいのでしょうか? その際は、窓関数の、ハニング窓:Wk=0.5-0.5*cos(2πk/L)を(最初は、方形窓でするつもりですが、)データに掛けて、 その値をFFTしてやればいいのでしょうか? 88200点の近似点は、2の16乗(65536)か2の17乗(131072)なので、 こちらのデータ区間を使えばいいのでしょうか? それとも、実際は、20000Hzしか使っていないので、44100点近くで、サンプリングす ればいいのでしょうか? また、区間ごとに得られた周波数を、区間ごとに処理していけばいいのでしょうか? すみませんが、よろしくお願いします。

  • フーリエ解析における位相のズレについて。

    フーリエ解析における位相のズレについて。 フーリエ解析に関して、わからない点がいくつかあります。 実験として用意したいくつかの周期関数を(デジタイザで)なぞって座標を読み取っていき、コンピュータが解析してくれたデータと理論値を比べた考察をするのですが、第n周波数の位相φnの理論値が0のところで、実験値がπに近い値がでることがたまにあります。 この理由がわからないので教えていただきたいです。 また、波形をなぞる際に始点と終点を違う場所に取ったときに(当たり前ですが)違うデータが得られます。 しかしどういった法則で違いがでているのか分かりません。 説明のしかたが悪く分かりづらいかもしれませんが宜しくお願いします。