• 締切済み

性能の良い「漢字かな交じり文」はありませんか?

http://www.geocities.co.jp/ymcc0000/ http://www.kawa.net/works/ajax/romanize/japanese.html などweb上で漢字から仮名に変換するサイトがありますが 形態素解析などを使って以下のような文章を正確に仮名に変換できるサービスなどありませんか? 出力は、仮名でもローマ字などでも構いません。 期待する性能  ・行った演技 =おこなったえんぎ  ・行った場所 =いったばしょ

みんなの回答

  • mtaka2
  • ベストアンサー率73% (867/1179)
回答No.1

質問者さんが礼に挙げられている後者のページでは「MeCab」が使われていますが、MeCab は日本でもトップレベルの「形態素解析エンジン」です。 ですが、質問者さんが求めるものは「形態素解析」ではなく「意味解析」のレベルになります。 「行った演技」でも、前後の文脈では「いったえんぎ」の方が正しい場合もあるでしょうし、 逆に「行った場所」でも、前後の文脈によっては、「おこなった場所」の方が正しい場合もあるでしょう。 そういった文脈を解析する「意味解析」が出来るものでないとお望みの結果が得られませんが、 意味解析技術では、未だに満足できるレベルの成果は得られていません。 ちなみに、MeCabの場合は、複数の「候補」を出力することができて、 それを使えば > % echo '行った場所' | mecab -O yomi -N 2 > イッタバショ > オコナッタバショ と、両方の読みを出すことは可能です。

takao541
質問者

お礼

ご意見ありがとうございます。 いままで違和感があったのは、意味解析までのレベルを求めていたからのようですね。 高速なコンピュータと良質なアルゴリズムと膨大な用例辞書が出来上がる日を待っています(笑)

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • なぜローマ字から直接かな漢字変換しないのでしょう?

    現在主流の環境では、ローマ字入力はいずれの環境でも、一度ローマ字をひらがなに置き換えた後、それをかな漢字変換するという方式をとっています。 なぜ、ローマ字から直接かな漢字変換するようにしなかったのでしょうか? たとえば、「お元気ですか」と入力したい場合、現在の仕組みではまずogenkidesukaと入力し、それが逐一ひらがなに置き換えられ、「おげんきですか」と表示された上で、変換ボタンを押すと「お元気ですか」に変換されるようになっています。 しかし、次のような方式も可能なはずです。ogenkidesukaと入力したら、それがひらがなに変換されることなく、変換ボタンを押すと直に「お元気ですか」に置き換わる。 現に中国語のローマ字入力(拼音入力)はローマ字から直接変換する方式が取られています。わたしにはローマ字から直接かな漢字変換する方がシンプルで使いやすくなるように思えます。どのような理由で今のような仕組みになったのでしょうか?

  • ATOK7においてカナ漢字変換をローマ字変換に変更するには?

    未だにDOSでATOK7を使っています。 マシンを起動して、ctrl+XFERを押すと、すでに カナ漢字変換になっています。 最初からローマ字変換にするには、CONFIG.SYSをどのように 編集したらよいのですか。 SHIFT押しながらF10を押すと入力モードの選択でき、 カナ漢字変換からローマ字変換に変えられます。 しかし、入力後、再びカナ漢字変換に戻ります。

  • かな入力が解除されてしまいます。

    かな入力が解除されてしまいます。 私は、かな入力で文字を打っています。ローマ字入力はややこしいので。 しかしかな入力に設定しておいてかな入力して漢字に変換するときに変換ボタンを押して入力したい漢字にあわせると かな入力が解除されてしまい ます。 なぜですか。漢字に変換して入力したい漢字にあわせるたびにAltとカタカナひらがなローマ字の気を2回押してかな入力にしなければなりません。 IMEのどこかおかしいの?

  • かな変換について

    かな、漢字変換について質問します。 ヤフーの検索入力で、かな、漢字変換ができません。 半角/全角キーをおし、ローマ字入力をすると、かな変換できたのですが、 変換機能が働かず、ローマ字のまま入力されてしまいます。 この文章はワードで作成しました。原因がわかる方教えてくださるようよろしくお願いします。

  • 「かな入力」が突然「ローマ字入力」になる

    IE7.0をダウンロードしてからなのですが、インターネットを使用中に限り、かな入力をしていて文字を変換しサブ画面(というのかな、漢字変換の候補一覧)が出てくると次からローマ字変換になってしまいます。 通常のかなとローマ字変換の切り替えは「Alt+カタカナ」を一度すると切り替わりますよね。 でも、二度しないと切り替わらないのです。 入力中に漢字変換は何度もしますので、その度にかな→ローマ字になってしまうととてもイライラします。 Outlookやワード等ではこの現象は起こりません。漢字変換してもずっと「かな入力」のままです。 とても困っています。どなたか修正方法をよろしくお願いします。

  • C#で漢字→ローマ字を変換

    C#で漢字→かなはImmGetConversionListで変換できるのですが、 漢字→ローマ字を変換することは可能でょうか? (およそで変換できればOKです)

  • カナ変換について

    EXCELVBAでテキストボックスを2つ用意して1つには 普通にローマ字入力し漢字変換をして、もう1つのテ キストボックスにはその入力した文字を自動カナ変換 してそのままカタカナ表示させたいのですが出来ません。 教えて下さい。

  • 日本語の音声入力とかな漢字変換はなぜ難しいのか?(2)

    (1)最近のパソコンは、CPUの性能、メモリ容量、ディスク容量ともに、一昔前の大型コンピュータをしのぐほどに高性能になっている。それなのに、日本語を入力するための「かな(ローマ字)変換」は完全にはできるようになっていない。それはなぜか? (2)将来的に、人間の介在なしに、自動的な「かな(ローマ字)変換」がほぼ完全にできる時代はくると思うか?くるとすれば、そのかなめとなる技術は何か? 逆に、ほぼ完全で自動的な「かな(ローマ字)変換」が近い将来には無理だと考える場合には、その理由をのべよ。 こちらもよろしければ、考えを教えてください。

  • 郵便番号でのローマ字住所自動出力

    はじめまして、 Ajaxを使った郵便番号から住所を自動入力するツール www.kawa.net/works/ajax/ajaxzip2/ajaxzip2.html を利用しているのですが、 これとまったく同じ要領で住所をローマ字で出力ツールをご存知でしょうか? asp.netで作っているフォームに使いたいのですが、郵便局で提供されている郵便番号のデータベースには住所が漢字とカタカナで登録されているだけで、ローマ字はデータベース化されていないので、こういうツールはないのですかね? ローマ字で住所を出力する方法ご存知の方、ご教授ください!

  • ブラウザを2個以上立ち上げると「かな入力」ができない

    ブラウザを2個以上立ち上げると「かな入力」ができない 最近、ブラウザを2個以上立ち上げてしまうと、2つ目以降のカーソル部分の「かな入力」ができなくなります。 「かな入力」をオンにすると何も入力されなくなるのです。 ローマ字になるとかいうのではありません。 「かな入力」をオフにすれば英数字はうてます。 ブラウザはIE7です。 かな漢字変換ソフトはMSのIMEです。 なぜだかわかる方、よろしくお願いします。