• 締切済み

日本語を形態素解析したいのですが..(jj)

今,JAVAで日本語の形態素解析できるプログラムを探しています. jumanやchasenなどサイトを見つけたのですが,具体的にどのような手順を踏み,どのようなプログラムを書けばいいか分からずに困っています(つへj) 無知で本当に申し訳ないのですが教えていただけないでしょうか?? 入力文→私は昨日,学校に行きました. 出力文→私 は 昨日 学校 に 行き ました このように形態素解析できるようにしたいと思っています☆

  • Java
  • 回答数2
  • ありがとう数1

みんなの回答

回答No.2

茶筅をJavaで使おうと思ったらたぶんJNIを使わないといけないかと…。要は面倒だということです。 MecabというツールもあってそちらはJava用のバインディングが用意されているそうです。"mecab java"なカンジで検索をかけると詳しくのってるページが見つかるかと。 一番お勧めなのはYahoo!のAPI。ネットに接続が必要なものの、辞書とか必要ないしREST形式だから結構簡単にできるかと思います。 サンプルコード付きのページはリンクで。

参考URL:
http://www.powerbeans.co.jp/modules/wssamples/index.php?id=4
  • thamansa
  • ベストアンサー率40% (95/232)
回答No.1

複雑な処理ですので、このサイトで教えてもらって 解決するような課題ではないように思いますが・・・ >具体的にどのような手順を踏み,どのようなプログラムを書けばいいか 手順としてはプログラムの前に、解析の手順(これをアルゴリズムといいます)を明確化することが必要です。 たとえば、 「行きました」を「行き」「ました」に分けていますが、 なぜ「行きま」「した」ではなく、「行」「きました」でもなく、 「行き」「ました」になるのでしょうか?その判断基準(分割のルール)を明確化することが第一歩です。 もしすべての日本語の分割ルールが明確化できたら、そのルールをアルバイトさんに教えれば、アルバイトさんが分割処理をできるようになりますね。 実は「プログラム」というのは、人間のアルバイトさんの代わりにコンピュータを使うときに指示を与えることなのです。つまり人間のアルバイトさんを使う場合と同じだけの指示が必要ということです。

関連するQ&A

  • 【形態素解析】Chasenを使いたい!

    形態素解析ソフトChasenをCのプログラムに組み込んで、 テキストの解析を行いたいと思っているのですが、 ネットの情報だけではどのようにしたらよいのか さっぱりわかりません。 chasen.exeとかlibchasen.dllとかは入手したのですが、 これらをどのようにCプログラムに埋め込んだらよいのか… ライブラリーとかその辺かなしか思いつかず、 困っています。 誰かご教授ください。

  • 英語の形態素解析

    日本語の形態素解析を行うソフトにchasenがあります。英語の形態素解析が行えるフリーソフトをご存知の方教えてください。

  • JAVAをつかった形態素解析

    今卒業研究で前段階として Javaを利用して文書ファイルを形態素解析をする方法がわかりません すいませんが 形態素解析用のソフトおよびプログラムの書き方を教えてください

  • 英文の形態素解析

    Javaのクライアントアプリで、英文の形態素解析を実装しようとしているのですが、適当なライブラリを探しています。 日本語ではSenという解析システムがあるようなのですが、英語辞書が見つからず使えないようです。 Yahoo!のAPIのように、WebAPIのものでもかまわないのですが、ご存知の方がいらっしゃいましたらご教授いただければ幸いです。 よろしくお願いいたします。

  • JUMAN(日本語形態素解析システム)の使い方

    Windowsで日本語形態素解析システムであるJUMANを使いたいと思っています。 インストールは出来ました。 しかし、その後、何をどうすればJUMANを使えるのかが分かりません。 付属のマニュアルを読んだのですが、それでもよくわかりません。 何かすべき設定などもあるのでしょうか。 とにかく、何もかもわかりません。 インストール後、JUMANを使うにあたって必要な手順が分かる方、お手数をおかけしますが、詳しくお教えいただけないでしょうか。 手も足も出せず困っております。

  • Perlによる形態素解析について

    こんにちは。 いつもお世話になっております。 早速ですが表題にもあるように、Perlを用いて形態素解析ツールを作成することは可能でしょうか? 質問文が簡潔すぎるので経緯を。 複数の文字列から自動的に意味のある単語を抽出したい考えたときに、形態素解析というものに辿り着きました。 これを使って文字列の処理が出来ないかと考えました。 マッシュアップも検討中ですが、まずは自らが組めるプログラムなのかどうかをお尋ねしたいと思います。 何か不明な点がございましたら、随時対応致します。 宜しくお願いします。

    • ベストアンサー
    • Perl
  • 形態素解析Senについて

    javaで形態素解析ツールを使っています。 Senのホームページを見て設定しています。Senでの辞書の作成まではうまくいったのですがサンプルプログラムの表示がうまくできません。コマンドとエラーを載せますと $ sh sen.sh Exception in thread "main" java.lang.NoClassDefFoundError: and と出ます。 windows2000上で起動し、javaのバージョンはSE v1.4.2です、ちなみにcygwinを使って起動しています。どうしても解決できないのでよろしくお願いします

    • ベストアンサー
    • Java
  • 形態素解析ツール「茶筌(ChaSen)」について

    品詞分解の質問に対して、形態素解析ツール「茶筌(ChaSen)」という ものを使って回答されている方がいらっしゃいます。 その結果を見ると、いわゆる学校文法による分類法とは、かなり懸隔が あるようです。 「茶筅」は、いったいどんな文法学説に基づいて品詞分解をしているの でしょうか。 機械のすることだから間違いがある、ともいえるでしょうが、「2年間」 を「2」と「年間」に分けるとか、サ変の複合動詞を語幹と「する」に 分けるとか、「の」を名詞(自立語)とするとかいったことは、単なる 間違いとするには程度が低すぎるようです。 開発者が何らかの学説に基づき、確信犯的に上記のような分類をするよ うソフトを作っているのなら、それはそれで構わないのですが。 どなたかお詳しい方がいらっしゃったらお教えください。

  • 日本語入力ができません

    昨日PCを起動してから、日本語入力ができなくなってしまいました。 LOCKもかかっていませんし、言語変更も試みましたが、全く関係がありませんでした。 言語バーで、入力形式を確認したところ直接入力が選択されていました。 ひらがなにしようと思ったのですが、変更できません。 http://ajaxime.chasen.org/ こちらのサイトで今は入力することができているのですが... どうしたらいいのでしょうか?

  • 英文解析プログラム

    英文の構文解析をできるプログラムを探しています・・。 日本語の構文解析は結構多くみつける事が出来たのですが、英文解析ができるプログラムが少なくて 困っています・・・。 英文解析を出来るプログラムを知っている方いれば教えていただけないでしょうか?? JAVAで書けるものを探しています。 もし、知っているという方がいらっしゃったら、出来れば使用方法も教えてください(;へ;)