• ベストアンサー

音声認識について

音声認識に興味があるのですが・・・・・ 音声認識のプログラムってどんな言語を用いて書いているのでしょうか? あと、音声認識のプログラムを書く上で、参考書的なもの(独習Cのような本のことです)を教えてください。 ご協力お願いしますm(_ _)m

noname#45110
noname#45110

質問者が選んだベストアンサー

  • ベストアンサー
  • tatsumi01
  • ベストアンサー率30% (976/3185)
回答No.2

同じ質問を2回されていますね。重複質問は歓迎されません。 No. 1 の方と同じで、言語は関係ありません。ただ、音声認識に先立って音声分析を行う必要があり、音声分析プログラムパッケージを利用するにはC,C++が便利でしょう。 これも No. 1 の方と同じですが、プログラムよりはまず音声分析システムを理解するのが最初です。その次に音声認識アルゴリズムの理解が来ます。hu_hu さんの技術レベルがわからないので、参考書といっても推薦は困難ですが、次のようなものを見て理解できなかったらチャレンジするのは無謀です。 確率モデルによる音声認識(中川 聖一) 音声認識(今井 聖) 音声認識の基礎 (上下)(古井 貞煕、Lawrence Rabiner、Biing‐Hwang Juang)

noname#45110
質問者

お礼

この分野は自分でも出来るかどうかわかっていませんが、tatsumi01のリストアップしていただいた本を頑張ってみます

その他の回答 (1)

noname#43437
noname#43437
回答No.1

まず・・・・ アルゴリズムを実装するのに、言語の選択はそれほど重要ではありません。 (もっとも、図形を描く機能しかないLogoなんかでは実装できないですが・・) 問題は、アルゴリズムですね。 参考書があって、これを見ればばっちりできる、なんて生やさしいものではなく、 今現在研究が進んでいる分野です。 このあたりは、最新の技術は各学会の論文を探したりするとよいと思いますが・・ 趣味でやってみるには、敷居が高いですね。 また、特許などで守られていることもしばしばなので、要注意です。 試しに、Amazonで「音声認識」で検索したら何冊かヒットしました。 内容はわかりませんが・・・参考にはなるかと思います。

noname#45110
質問者

お礼

アルゴリズムですか・・・今、勉強中です. 頑張ってみます.

関連するQ&A

  • 音声認識ができないで困っています

    音声認識をしようと思い、あれこれ設定を繰り返していますが、どうもうまくいきません。 「言語設定がサポートされていないため、音声認識を起動できませんでした。 音声認識言語はユーザーインターフェイス言語と一致している必要があります。[音声認識]コントロールパネルの[詳細]オプションで、音声認識言語を変更してください。」 と出てそこから進みません。 高度な音声オプション-音声認識-ではWindows 用 Microsoft 音声認識エンジン8.0(日本語) です。 コンパネ-時計、言語、地域-地域と言語 では日本を選択しています。 まず、[音声認識]コントロールパネルの[詳細]オプション がどこにあるのかわかりません。 使用環境 OS=Windows7 マイク=サンワサプライのUSBマイクロホン どうすればいいでしょうか?

  • [Visual C#] 音声認識について

    VB.NETで音声認識(その1:音声認識ライブラリを作る) http://kilala.mydns.jp/def/VBTIPS/005/ マイクにしゃべるとテキスト変換されるプログラムです。 これはVB.NETで作られています。これのVisual C#版の サンプルプログラムがある場所を知りませんか?また 書き方を知りませんか? 色々な検索ワードをgoogleで探して見たのですが全然ヒット しませんでした。 SpeechLib(音声認識ライブラリ)はインポート可能でしたので 出来ると思うのですが、書き方が分かりません。 よろしくお願いします。

  • 音声信号のスペクトラムを元に音声出力する事は可能なのでしょうか?

    音声信号の周波数成分(スペクトラム)を元にした 音声出力プログラムを作ってみたいと思ったのですが、 そもそもスペクトラムから音声に戻すなどということが物理的に可能なのでしょうか? 技術的な問題を考える以前に私はスペクトラム自体 「スペクトラム=波形パターン」ぐらいにしか考えていませんし 音声ファイルさえ中身はどのようになっているかなどカケラも知りません、ようは何も分かっていないのです。 本質的にやりたい事は音声を入力した時、波形パターンを記録して その記録した波形パターンから音声に戻したいと思ってます。 何故波形パターンかと言うと、波形なら音声認識において 高い「あ」も、低い「あ」も共通する部分があるだろうから そこを比較することにより「あ」を「あ」と認識し、 出力時にその波形を変えて声自体の高低を変えてみたいと考えています。 正直自分としては実際こんな事できないんじゃないかと思っていますが、 出来るようでしたら参考になるサイトや本などを教えて頂けると助かります。 言語はJAVAやVC、C++等を考えていますが、別段出来れば何でも構いません。

  • ワードの音声認識を切りたい

     ワード使用中に「音声認識が云々、メモリが足りなくなっています。使用しないときはOFFにしましょう」的な内容が表示されます。切りたいのですが、ヘルプを見てもわかりません。言語バーには音声認識システムを切るようなところは見当たりません。教えてください。

  • 超恥愚問ですが、CとC++の間に単なるC+っていうのもあったんですか

    無料のBCCで、最近C言語に興味を持って独習をはじめたばかりの者です。 大変ばかばかしくて申し訳ないのですが、きわめて素朴に、CとC++の間に単なるC+っていう言語もあったんでしょうか? 困ってる訳でもなんでもなくて申し訳ないのですが、いろんな初心者用の言語の本を読んでみても載っていないので、こちらで投稿してみました。 よろしくおねがいします!

  • Windws10 21h2で音声認識を使うには

    マイク(裏面MICジャックに接続。電源はボタン型電池)を繋いで設定やコンパネでセットアップして、セットアップのウィーザードでは動作、設定のシステム、サウンドのマイクでは認識しメーターが振れるのですが、音声認識をオンにすると画面上に表示されるダイアログでオンオフが出来ず、キーでも不可、アプリのコルタナを起動すると「コルタナがオフになっている」と出ます。そして少しするとオンオフのダイアログに対するエラーに「システムの言語設定と音声認識の言語設定があっていない、設定(音声認識)-詳細設定で言語を合わせる」と出ますが、設定の音声認識には詳細設定は見当らず、コンパネの音声認識にも、詳細設定は見つかりません。 コンパネの音声認識にある「高度な設定」で開く音声認識のプロパティにある「プロファイルのトレーニング」では、まるで音声を拾いません。 USB接続のマイクを取り付けて設定しても、状況は変わりません。 使用しているPCは2019年に購入した本体で、コアi5-9700搭載、16GBのメモリーを搭載しています。購入時のBuildは1903か1909でした。購入時はコルタナも標準で入っていて音声入力が出来たので、最初のマイクを買って設置したものです。当時は、設定のいずれかの項目に、「コルタナ」関係の項目があったと記憶していますが、現在のBuildでは見当らず、コルタナをオンにする手順も分かりません。 どなたか、21h2で音声認識をオンにする手順と、コルタナをオンにし、「プロファイルのトレーニング」で音声がキチンと認識できるように出来るのか、お教え下さい。

  • 音声認識 アウト((

    WindowsXPではOS標準の付属ソフトでトレーニングの結果、音声認識率はほぼ95%以上に達し、手放せないものとなっていました。 ところがWindows7で同機能の使用を試み、マイクのセットアップは正常に完了、音声認識チュートリアルではほぼ完ぺきに私の音声を認識したにも関わらず、トレーニングの段階で当方の音声を受け付けず、入力の試行に対し10回に1回程度しか認識しません。その結果によるものか?ワードパッド等の標準的なエディターソフトで入力を試みても、音声は感知しているものの、でたらめな文章の羅列ばかりで、認識率は10%にも及びません。マイクに異常は見つからず、Skypeによる通話も良好。原因がかわからず途方にくれています。どなたか改善のためのアドバイスをよろしくお願い致します。  またコントロールパネル→音声認識の言語の選択で日本語しか選択肢が見当たりませんが、English Recognizerを利用し英語入力を可能にする手順をご教示下さい。

  • 言語バーの音声認識、手書き認識サービス

    音声認識、手書き認識サービスについて 言語バーのサービスから音声認識、手書き認識を削除しても次のメッセージが表示されるのは何故でしょうか? "文書は保存されましたが、音声認識データを保存する十分な空き領域がないため、データは失われました。録音していないときは、必ずマイクをオフにし、ディスクで利用できる記憶域を確認してください。"

  • 点字本などから画像認識プログラムにより、点字を認識し その点字を文字と

    点字本などから画像認識プログラムにより、点字を認識し その点字を文字として表示するプログラムを組みたいと思っています。 このようなプログラムを組むには、どのような言語を使ったほうがいいですか? また、どのようなプログラムを組めばいいのか、流れを教えていただけると助かります。

  • 音声データのリアルタイム処理

    「マイクなどからPCに音声データを入力し そのデータにハイパスフィルタをかけ、リアルタイムでスピーカに出力する」 という課題をC言語かC++を使ってやらなくてはならないのですが、 音声データのCやC++での扱い方といいますか、音声データをどうCやC++に組み込むのかがわかりません。 音声データに何らかの処理をして出力する、というプログラムをCやC++で書くということはできるのでしょうか?何か特別なソフトが必要になってくるのでしょうか?

専門家に質問してみよう