• 締切済み

音声認識について

こんにちわ 初めて利用させていただきます。 不手際などありましたら申し訳ございません。 標題の件、 マイクから入力した声を認識して人物名をモニタに出力するようなシステム を作ろうと考えています。(思いつきなので内容は全く決まっておりません) 質問なのですが、認識する際に入力する言葉は例えば 「おはよう(全員同じ言葉を使う)」 と 「山田 太郎(各自個人名を使う)」  どちらが難しいでしょうか? 皆が同じ言葉を発すると似たような周波数になり分析が難しくなるような気もしますし、 違う言葉を発すると色々な言葉のデータを集めないといけない気がして大変な気がします。 以上宜しくお願いします。

  • 科学
  • 回答数2
  • ありがとう数2

みんなの回答

回答No.2

つまり「声質」を認識するか「言葉」を認識するかの違いということでしょうか。 声質の方が楽かなと思います。 言葉を認識するなら、まず音素ごとに分けてから各音素を認識するという手順になると思いますが、声質の方なら時間の要素は考えず周波数成分のパターンを比べるだけでも個人の識別は可能だと思います。

aru333333
質問者

お礼

回答ありがとうございます。 御察しの通りです。表現が旨くできませんでした^^;

回答No.1

 こんにちは。 >どちらが難しいでしょうか?  どちらも難しいですが、難易度は一緒と思います。  違うとすれば、「誰が話しているか?、人物を特定するとき」になります。  個人がこれからシステムを構築するのは現実的とは思えないので、以下のシステムを提案します。  まずはWEBページです。 Julius http://sourceforge.jp/projects/julius/  本体のダウンロードはこちらから可能のようです。 http://sourceforge.jp/projects/julius/releases/?package_id=497  とはいえ、これだけでは勉強が不可能と思います。  入門書を紹介します。 フリーソフトでつくる音声認識システム - パターン認識・機械学習の初歩から対話システムまで [単行本(ソフトカバー)] http://www.amazon.co.jp/%E3%83%95%E3%83%AA%E3%83%BC%E3%82%BD%E3%83%95%E3%83%88%E3%81%A7%E3%81%A4%E3%81%8F%E3%82%8B%E9%9F%B3%E5%A3%B0%E8%AA%8D%E8%AD%98%E3%82%B7%E3%82%B9%E3%83%86%E3%83%A0-%E3%83%91%E3%82%BF%E3%83%BC%E3%83%B3%E8%AA%8D%E8%AD%98%E3%83%BB%E6%A9%9F%E6%A2%B0%E5%AD%A6%E7%BF%92%E3%81%AE%E5%88%9D%E6%AD%A9%E3%81%8B%E3%82%89%E5%AF%BE%E8%A9%B1%E3%82%B7%E3%82%B9%E3%83%86%E3%83%A0%E3%81%BE%E3%81%A7-%E8%8D%92%E6%9C%A8-%E9%9B%85%E5%BC%98/dp/4627847114/ref=sr_1_1?s=books&ie=UTF8&qid=1298443462&sr=1-1 IT Text 音声認識システム [単行本] http://www.amazon.co.jp/Text-%E9%9F%B3%E5%A3%B0%E8%AA%8D%E8%AD%98%E3%82%B7%E3%82%B9%E3%83%86%E3%83%A0-%E9%B9%BF%E9%87%8E-%E6%B8%85%E5%AE%8F/dp/4274132285/ref=sr_1_3?s=books&ie=UTF8&qid=1298443462&sr=1-3  今となってはちょっとだけ古いかもしれませんがお薦めの本です。  CD-ROMが付属するのですが、使いこなすのが難しい気がします。  先のサイトから最新版ソフトを導入してください。  いろいろと音声認識は大変なのですが、頑張ってください。

aru333333
質問者

お礼

回答ありがとうございます。 教えていただいたサイトを参考にさせて頂きます。 ありがとうございました

関連するQ&A

  • 音声解析

    Visual C# 2005 Express Editionを使っています。 マイクから入力された音声を、リアルタイムで 周波数分析するプログラムのソースコードは どのように記述すればよいのでしょうか? また、周波数分析した結果から、音程を導きだすには どうすればよいのでしょうか?

  • ノイズと音声の識別方法について教えてください

    音声認識についての質問です。 趣味でロボットに音声認識をさせたいと思っています。オンマイクは用いず、ロボット自身にマイクをつけています。そこで、動作中のロボット自身が発するノイズが問題になっています。 命令を正しく認識させるため、人間の言葉が発せられていると感知すると動作をいったん止めて、その後命令を聞かせるようにしたいです。 1.ノイズの中で人間の言葉が発せられていることを、どのような方法で感知させられますか? 2.周波数分析等を行うと人間の言葉とノイズとの間にはどのような違いがあるのですか? 教えてください。よろしくお願いします。

  • コンデンサマイクによる音声認識

     今、小さなコンデンサマイク(ECMと呼ばれるもの)を使って、音声認識の回路を作りたいと思っています。 また、この音声認識の回路では、コンデンサマイクに入力された音を識別して、音ごとに違う動作をさせるような回路にしたいと考えています。 そして、音声認識はパソコンを使ってではなく、トランジスタや抵抗やICなどの普通の電子部品だけを使って行うようにしたいです。  ですが、電子工作に関する知識があまりないため、どのようにしてコンデンサマイクに入力された音声が送られるのか、 どのようにして音声を識別するのか(周波数の違いを検出するのでしょうか?)、といったことがよく分かりません。  そこで、電子工作の分野にお詳しい方、どのようにしてコンデンサマイクを使った音声認識の回路を作ればいいでしょうか? 音声を識別するまでの過程の回路の説明、音声の送られる仕組み、音声の識別の仕方などを教えていただきたいです。 できれば参考になるホームページなどもありましたらよろしくお願いします。

  • マイクの音声入力が認識できません

    Skypeをやろうと思い、ヘッドセットを購入したのですが、音声入力が全く認識されません。 マイクはミュートになってないし、サウンドカードの再インストールもしたのですが…。 気になるのはサウンドデバイスはSoundMAXです。これでマイクのセットアップをしようとすると、(何度も確認して)正しくマイクとスピーカーの位置に刺さっているにも関わらず、正しく接続されていません、とでます。 ちなみに購入したヘッドセットはMHM-S06です。 どなたかお願いします。

  • エクセル:複数行のセル値を、対応した項目に従って一つのセルにまとめたい

    いつもお世話になっています。 早速ですが、下記のようなことをしたいのですが、 関数でできるでしょうか?  │ A     │ B ----------------------- 1│日本太郎 │ ばら ----------------------- 2│日本太郎 │ さば ----------------------- 3│山田花子 │ キリン ----------------------- 4│山田花子 │ 米 ----------------------- 5│日本太郎 │ イス ----------------------- 6│山田花子 │ インク ----------------------- ↓  │  A   │ B -----------------------  │       │ ばら 1 │日本太郎│ さば  │       │ イス -----------------------  │       │ キリン 2 │山田花子│ 米  │       │ インク ----------------------- A列に人物名、B列に品物を入力します。 誰かが何かを入手した際、その順に入力していきますので、 同一の人物が複数の行に亘って入力された表(上の表)があります。 これを基に「誰が何を持っているか」をまとめる表(下の表)を作りたいのですが、 上の表を基に下の表が自動的に出来上がるような関数はあるでしょうか? VLOOKUPを使っても上手く出来ず、しかし他に思い浮かびません。 何か良い知恵がございましたら、お教え下さい。

  • クッキーからわかる事

    クッキーからわかる事 アクセス解析をつけていれば、自分のHPにアクセスした人間のクッキーから、その人物のPCのユーザー名ってわかるものなのでしょうか? 仮に、ある人のPCのユーザー名を、山田太郎だとします 山田太郎は、特定のHPをよく見ています。 そうすると、IPアドレスが毎回変わっても、HPの管理人からは、ユーザー名山田太郎から同一人物だとバレバレという事ですか? またクッキーの食べ残しがあれば、直前に見ていたサイト以外の閲覧サイトなどもわかるのでしょうか?

  • NOの自動入力がわからない。

    初めてここで聞くので緊張です。 まだ初心者何ですが、勉強中です! 今作っている顧客管理データベースで、 T管理(テーブル名) シリアルNO サブNO 姓 名 画像 日付 とあります。で、シリアルNOは顧客ごとに違うのですが、同じ人物を入力したときは同じシリアルNOです。そこで2回目同じ人を入力した際に同じシリアルNO を入力 そのときにサブNOに02と自動入力されるようにしたい。新規のときは01と入力されるという (例) シリアルNO  00001 サブNO    01 姓    山田 名    太郎 画像     日付  2003/10/21 シリアルNO  00002 サブNO    01 姓    山田 名    花子 画像 日付  2003/10/21 シリアルNO  00001 サブNO    02 姓    山田 名    太郎 画像    日付   2003/10/22 上記のように山田太郎さんが2回目に来たときに、シリアルNOは同じ00001を入力サブNOが02と自動入力されるようにしたいのですが やり方がわからなくて。。。 教えてください! イロイロ関数とか試してみましたけど、やり方使い方が良くわからないのでお願いします。

  • iPodのアーティスト名にスペースが表示されない。

    CDをインポートして、楽曲名やアーティスト名を訳あって、自ら入力しました。 例えばアーティスト名で「山田 太郎」とスペースを入力しても、iPodには「山田太郎」と表示されてしまいます。 インターネットからコピーしてペーストしても、スペースが表示されません。 これを改善するには、どうしたら良いのでしょうか。

  • エクセルでアドレス帳を製作しているのですが・・・

    エクセルでアドレス帳を作成しているのですが、 A1セル:氏名 B1セル:フリガナ C1セル:姓 D1セル:名 の項目名を入れてA2~100をアドレス帳として登録 【C2:姓】【D2:名】に入力した文字を【A2:氏名】の列に結合反映するようにA2~100に関数を=C2&D2&E2と登録しています。 例えば C2には 山田 D2には太郎 と入れたら A2には 山田太郎 と入力されます これをA2の姓と名の間に半角スペースを自動で入れてC2とD2に入力した文字のフリガナもB2に自動で入力させる方法を探しています A2       B2        C2     D2 山田太郎  ヤマダタロウ  山田   太郎 ↓ A2       B2        C2     D2 山田 太郎  ヤマダタロウ  山田   太郎 解かりずらい説明ですいませんが、アドバイスよろしくお願い致しますm(__)m

  • MacOS上で、オーダーフォームに勝手に名前が。。

    ネットショップをやっています。 ショッピングサイトやカートもオリジナルのものです。 MacOSを使用しているお客様からのご注文に限定されるのですが、 注文者の氏名が「名字+名前 名前」になってしまいます。 「山田太郎」という人がわたしのネットショップで買い物したとします。 オーダーフォームは「姓」と「名」の入力欄がそれぞれあり、名字と名前を分けて入力するようになっています。 ところが、CookieなのかMacOSだけの話なのかわかりませんが、「姓」欄に『山田』と入力した後、 勝手に『山田太郎』と表示されます。(Macの初期設定で入力した姓名です) 「名」欄は名前を入力しますが、こちらは名前だけがそのまま表示されますので問題ないです。 このためそのまま注文をすると、姓名欄は『山田太郎 山田』となってオーダーが入ってきます。 「姓」の欄に名前が入ってしまったことにお客さんが気づいて消してくれればいいのですが、多くの人はもう次の入力欄を見ているので、気がつきません。 このせいで、MacOSからオーダーをしてくれるお客さんの名前はほとんどが、『山田太郎 山田』のような表示のされ方でオーダーが入ってきます。 オーダーフォーム側で何かコントロールはできないのでしょうか?