音声の分析合成について

このQ&Aのポイント
  • 心理学の分野で音声の分析合成が行われています。
  • 音声の分析合成では、刺激音を男性日本語話者の単一発話から生成します。
  • 具体的な手順として、サンプリングレートや再サンプリング、低域濾波などの処理が行われます。
回答を見る
  • ベストアンサー

音声の分析合成について

心理学の分野の聴覚実験で音声を分析合成したことを記述している論文の一部ですがなぜこのようなことをするのか意味がわかりません。 刺激音は男性日本語話者の単一発話から分析合成した2単語。 「刺激各音は、サンプリングレート10kHz、12bitで分析合成されたものを4.5kHzで低域濾波し、22.05 kHz、16bitで再サンプリングして用いた」 (1)サンプリングレートとはどういう意味? (2)10kHz、12bitで分析合成されたものを22.05kHz、16bitで再サンプリングしたらどうなるのですか? (3)4.5kHzで低域濾波したらどうなるですか? (4)再サンプリングとはどういうことですか? まったく基礎知識がないのでわかりやすく教えてください。おねがいいたします。

  • M1343
  • お礼率84% (308/364)

質問者が選んだベストアンサー

  • ベストアンサー
  • gamebakari
  • ベストアンサー率60% (699/1147)
回答No.1

心理学はわかりませんが・・・ 1)音声=空気の振動をデジタルデータとして取り込むときの「標本化」における帯域の数値。 http://illustrator-ok.com/illustrator_koza/digital/contents/digital3.html 2)おそらく資料としての統一フォーマットへリサンプルしたのだと思われますが、その際に折り返しノイズが発生するために4.5kHzのHPF(ハイパスフィルター)を通すのでしょう。 3)一般的には48db/oct以上のスロープを持つハイパスフィルターを使うと思われます。そのカットオフ(切捨て)の基準点を4.5kHzにして処理した、という意味でしょう。その処理により標本には無用の歪や雑音を切り捨てることができます。 4)デジタル音声は様々なサンプリング周波数や量子化ビット数でデータを変換できます。 たとえばCDのサンプリングレートは44.1kHz、DVDは48kHzというふうに。2)に述べたように、統一資料としての汎用性と音響設備コスト等の兼ね合いで22.05kHz、16bitというフォーマットへ再変換したのでしょう。様々なフォーマットの原サンプルのままでは評価の基準が見出せないでしょうから。 つまり原音からはフィルタリングされた標本ではあるが、そのことで評価のブレを収束できる、と理解でき、そのために再標本化をしてあると考えます。

関連するQ&A

  • 音声ビットレートについての疑問です

    MP3で圧縮する際の設定で、同じ48KHzのサンプリングでも、320Kbpsや224Kbpsなどいくつか選択できます。 これは、量子ビットでbpsに違いがでているのでしょうか? また、音声エンコード方式?にはMP3、WMA、AAC等いくつか種類がありますが サンプリングレートと量子ビットが同じ組み合わせなら、各エンコード毎にビットレートが違っても同じくらいの音質なのでしょうか? 例:MP3→48KHz 16bit 320Kbps WMA→48KHz 16bit 480Kbps ※数値はでたらめです。 上記二つは、ビットレートに違いがありますが、同じ48KHz 16bitなので音質は同じなのでしょうか? よろしくお願いします。

  • 音声のビットレートについての疑問

    人間の耳は良くて20KHz程度の音声しか聞き取れないと読みました。 たとえばサンプリングレートが22.05KHz(ステレオとしては44.1KHz)の場合、人間の聞き取れる全ての高さをカバーしていると考えてよいのでしょうか? つまりサンプリングレートのみとしては人間の耳には最高音質に聞こえるのでしょうか? もし上記でカバーできているのなら、105.8Mのステレオ音声(各スピカーが44.1KHzで16bitの音声)では、人間の聞ける音をはるかに超えており、人間の耳にとっては、22.05KHzも44.1KHzも同じ音に聞こえるのではないのでしょうか? もし同じに聞こえるなら、音声圧縮ソフトのビットレート設定で最大320Kbs等があるのはなぜでしょうか? 素人の考えた意見で、おかしいことを言ってると思いますが、ご指摘お願いします。

  • 動画の音声を合成する

    2本の動画があります。  A)ビデオ 1080P/29.970fps 音声 128kbps/48.0KHZ/2CH AC-3 B)ビデオ 1080P/23.976fps 音声 640kbps/48.0KHZ/5.1CH(6CH) AC-3 B)動画の音声を削除してA)のビデオの音声のみをB)動画に付加したいのですが、 両動画のはサンプリングレートが違うので単純にA)の音声をB)に移しても 音が少しづつズレて最後の方では大きく違ってしまいます。 手順としては、 基本的には、動画サンプリンググレード(レート)に同一にするために片方の動画を変換し その後に音声が不要なB)動画から映像のみを抜き出して別途保存、 音声のみが必要なA)動画から音声のみを抜き出して別途保存、 音声のないB)動画にA)動画の音声を合成するようなになると思うのですが? 思う処理を効率良く行うツールがあれば紹介下さい。 有料でもかまいませんが、できれば無料のツール(アプリ)を紹介下さい。 ツールでなくても上の手順を具体的に教えてもらえれば幸いです。

  • 音声のビットレートについて

    音声のビットレートについての疑問なのですが、 サンプリングレートを44.1kHz 量子ビットを16bitとした場合 ビットレートは44.1×1024×16=722534.4bps (705.6kbps=88.2kBps) つまり一秒毎に88.2KBのデータ量。 10分間の音声(音楽)では 88.2×60秒×10分=52920MB (51.6GB) 10分の音声で51.6GBの用量の音楽は見たことがありません・・・ どこで計算間違えをしているのでしょうか? そもそも計算方法はあっているのでしょうか・・ よろしくお願いします。

  • DVD音声データを小さくするには?

    数年前にバンドルされていたDVDit!2.5LEを使ってDVD-videoを作っているのですが、 VHSからキャプチャーボードで取り込んで 作成したMPEG2を圧縮するといつもサイズがオーバーしてしまいます。 4.3Gなのでいけるかと思うんですが大概アウト・・・。 Q1.LEの制限上、音声がこのバージョンでは変換させるとか聞きましたが、   変換されなければ収まるのでしょうか? Q2.メニューを特に設けずDVD-videoとして焼くだけであれば現在はどのソフトがいいのでしょうか。 Q3.音声はどの形式で保存すれば音質をそこそこ損なわず小さくできるのでしょうか? Q4.48KHzなどのサンプリングレートと16bitなどの KHzとbitでどう音声に違いが出るのかわかりません 質問多くてすいません。

  • Rubix22の音が出なくなる現象について

    質問させて下さい。 Rubix22を使用しているのですが、DAWソフトでサンプリングレートとビットレートをそれぞれ96kHzと32bitに変更して作業した後にDAWを終了させてSkypeで通話しようとすると音が出ません。 コントロールパネルの設定でサンプリングレートとビットレートを確認すると44,1kHzと16bitになっています。 USBケーブルを抜いて再度差すと音が出るのですがケーブルの抜き差しをせずにSkypeで通話出来るようにするにはどうすれば良いでしょうか? ご回答お願い致します。 ※OKWAVEより補足:「電子楽器メーカーローランド製品、ボス製品」についての質問です。

  • 【オーディオインターフェイス】0202USBについて

    今宅録でボーカル録りをしているものですが、0202USBにマイクをさして録っています。 0202USBを買った当初は問題なかったですが最近サンプルレート(サンプリング周波数ともいうのでしょうか)が 44.1kHzでしか録音できません。 以前は96kHzで録音できたのですが。 ドライバのアプリケーションでPC上で96kHzに設定しても録音ソフトでサンプリング周波数を見ると44.1kHzに戻っています。 使っているソフトが悪いのかなと思い REAPER CubaseLE soundit3.0 の3つのソフトで確かめたところやはりどれも戻っていました。 当然アプリケーション側も44.1kHzにもどっていました。 0202USBにはサンプルレートを変えるダイヤルなんてないと思うのですが・・ 今日とりあえずOSを再インストールしてドライバも全て入れなおしてみましたがやっぱり戻ったままです。 これって表示は44.1kHzになってるけどじつは96kHzで録音できてるなんてことではないかと少し思ったんですが耳が悪いためか音での識別はできませんでした。 ちなみにbit数も24だったのが16になっています。 皆さんの知恵をお貸しくださいお願いいたしますm(_ _)m

  • サンプリングレートについて

    ハイレゾ音源は1曲も持っていません。CD音源そのままのファイルで音楽を聴いています。 そこで疑問に感じるのですが、CD音源そのままの44.1kHzの16bitの音楽ファイルを、プレイヤー側やDACで88.2kHzの24bitや96kHzの24bitで再生するのは意味があるんでしょうか?    例えばというか、実際、PS3に入れてあるCD音源そのままのファイルを再生させるとハイレゾファイルではないのにDACが自動で88.2kHzに切り替わるので 実は少しだけ綺麗に鳴らしてくれてるのかなとか思っちゃったりして…ww (PCもDACもアンプもサンプリングレートを上げれるので96kHzに合わせて聴いてるのですが…)

  • 3000サンプル以内のWavの作り方&測定法

    皆様よろしくお願い致します。 クライアントから8秒間の、44.1kHz、16bitの、3000サンプル以内のWavで送ってくれと言われています。 「44.1kHz、16bit」は良いとして、この「3000サンプル以内」というのがイマイチ良く分かりません。Cubase SX3を使っていますが、サンプル回数を指定、もしくはコントロールする方法なんてあるのでしょうか?仮にサンプリングレートを8KHzにしても、8秒間だと64000回のサンプルになるはずです。そもそも、そのオーディオが何サンプルか、どうやって測定すれば良いのかもわからないのです。 イメージが悪くなるのでヘタにクライアントに効けないですし、どなたかご存知ありませんでしょうか?

  • 用語の使い方について(サンプリング周波数、ビットレートなど)

    例えば音声データを録音装置にマイク入力で取り込む際に「サンプリング周波数」や「量子化ビット」が○○KHz、○○bitというふうに使いますが、スピーカーに出力する際にも「サンプリング周波数」や「量子化ビット」「ビットレート」という用語は使われますか?(おかしくない使い方ですか?) よろしくお願いします。

専門家に質問してみよう