• ベストアンサー

MeCabの文字化け

FedoraにMeCabと辞書をインストールしたのですが、 実行すると文字化けします。 結果の左側も文字化けしますが、 右側も、 「名詞,一般,*,*,*,*,」 となる所が、 「?サ・クヌヘュフセサ・チネソ・,*,*,*,*,」 こんな風になってしまいます。 utf-8の環境なのが原因でしょうか。 また、どのように直してあげればいいのでしょうか。 ご存知の方がいらっしゃれば、 ご解答お願い致します。

質問者が選んだベストアンサー

  • ベストアンサー
  • D-Matsu
  • ベストアンサー率45% (1080/2394)
回答No.1

結果をnkf -wに投げてみたらどうなりますか?

tk1114x
質問者

お礼

やはり文字コードの問題でした。 変換してやれば直りました。 ありがとう御座いました。

関連するQ&A

  • どうしてもMeCabの辞書をUTF-8で作ることができません。

    どうしてもMeCabの辞書をUTF-8で作ることができません。 さくらインターネットでMecabを構築中です。 ローカルエリアに、MeCabと辞書をインストールして、 動作確認したところ、動作上は問題が無いのですが表示がEUCで表示されます。 色々とネットで調べて、UTF-8で辞書を構築しようとパラメータ指定を 行っているのですが、全く改善されません。 どこが間違っているのでしょうか。。。 ●Mecab本体のインストール(mecab-0.98.tar.gz) % ./configure --prefix=$HOME/local --with-charset=utf8 --enable-utf8-only % make % make install ●辞書のインストール(mecab-ipadic-2.7.0-20070801) %./configure --with-charset=utf-8 --with-dicdir=/home/mirailink/local/lib/mecab/dic/ipadic (with-charsetを、utf8 にしてもダメ。また、下記コマンドで強制的?にUTFにしてもダメ  $HOME/local/libexec/mecab/mecab-dict-index -f euc-jp -t utf-8 ) % make % make install ●結果確認 (teratermでssh接続し、表示コードはUTF-8に設定しています) %mecab 今日は良い天気です。 莉 ?サ・ー・フ,*,*,*,*,莉,・ソ・ォ・爭・・ソ・ォ・爭・ オュケ・ー・フ,*,*,*,*,* 日 ?サ・クヌヘュフセサ・チネソ・,*,*,*,* は ?サ・ー・フ,*,*,*,*,* 良 ?サ・ー・フ,*,*,*,*,* い ?サ・ー・フ,*,*,*,*,* 天気 ?サ・ー・フ,*,*,*,*,* です ?サ・ー・フ,*,*,*,*,* 。 ?サ・・オハムタワツウ,*,*,*,*,* ●不明 インストールパラメータでwith-charset=utf-8を指定しているにも関わらず、 辞書設定ファイル(dicrc)を見ると、下記のようにECUで作られています・・・。 config-charset = EUC-JP

  • PHPで辞書をutf-8でMeCabを利用する方法

    MeCabを利用していますが、どうしても文字化けしてしまいます。 私は現在、さくらインターネットのレンタルサーバーを借りており、 さくらのレンタルサーバーには既にMeCabと辞書がインストールされています。 しかし、その辞書の文字コードはeuc-jpです。 なので、辞書だけ別にホームディレクトリにインストールし、そのインストールした 辞書を使用したいです。 phpで、辞書へのパスを指定してMeCabを使用したいのですが、その場合どうすれば 良いですか?

    • ベストアンサー
    • PHP
  • 【MeCab】解析結果が出力できません

    急に仕事でテキストマイニングが必要になり、 なんとかmecabにトライしているものの、現在つまづいております。 mecabにてテキストを解析したあと、 その結果を出力したいので出力コマンドを入力しましたが、 コマンドと認識されずコマンド自体が解析されてしまいます。 ※出力コマンドに限らず他のコマンドもそうです。 初歩的な質問で申し訳ございませんが、 どなたかお知恵を貸して頂ければと思います。 下記がコマンド実行後の状況です。 ============================ % mecab -0dump % 名詞,サ変接続,*,*,*,*,* mecab 名詞,一般,*,*,*,*,* - 名詞,サ変接続,*,*,*,*,* 0 名詞,数,*,*,*,*,* dump 名詞,固有名詞,組織,*,*,*,* EOS ============================ ※KHcorderもエラーが発生し対応できませんでした。  他にテキストマイニングができるフリーソフトなどご存知でしたら  合わせて教えて頂ければと思います。  分析対象はTwitterでの投稿内容です。 宜しくお願いします。

  • Latexの文字化けについて教えてください!

    Windows 環境で Terapadを使ってtexファイルを書いたのですがlinuxで開けてみると文字化けが見られました。texファイルの文字化けはファイルの文字コード指定保存でUTF-8にて保存することでtexファイルの文字化けは治ったのですが、linux環境下で platex sample.tex と実行してdvioutで見るために xdvi sample.dvi とすると日本語が全て文字化けしています。 どうすれば文字化けが解消されるでしょうか?

  • WinXPにおいてText::MeCabの導入方法

    一週間ぐらいこの作業で潰れており、疲弊しております。 先ずは稚拙で文章力の低い質問となっておりますことをお詫び致します。 単刀直入に申し上げますと、Text::MeCabがCPANからインストールできません。 環境はWinXP(SP3)、StrawberryPerl(5.8.8)、mecab(win32)(0.97)です。 mecabはCドライブ直下に置き、perl、mecabにもpathを通しております。辞書はshift_jis・utf-8、両方試しております。 CPANに入力した際に表示される質問には 0.97 -DWIN32 -Ic:\MeCab\sdk -lc:\MeCab\sdk\libmecab.lib c:\MeCab\sdk utf-8 or shift-jis の順で答えております。 以下の画像はCPAN結果です。 http://files.uploadr.net/3625661caf/WS000113_BFRUC.png 色々心労も重なっており、大変抽象的な質問で申し訳ございませんが、 もしご助力して下さる御方が居られましたら嬉しいです。 些細なアドバイス、「こうしたらどうだろう」程度でも構いませんので、宜しくお願い致します。

    • ベストアンサー
    • Perl
  • Eclipseの文字化けについて

    Eclipseからプロジェクトをインポートすると下記画像のように 文字化けしてしまいます。 何とか対処したいのですが どのようにやれば良いでしょうか? 教えて頂けると助かります。 ※ 秀丸でUTF-8で表示すると正常に日本語表示されます。 [環境] ・Windows8 ・Eclipse 4.4.0 Luna ルナ for Windows ベース [試した事] ・メニューバー → ウィンドウ → 設定 → 一般 → ワークスペース → テキスト・ファイルのエンコード → MS932をUTF-8にする。 結果:文字化けする。 ・パッケージエクスプローラー → 目的のファイル → 右クリック → プロパティ →  リソース → その他 → UTF-8 結果:文字化けする。 ・eclipseのエディタで直接日本語入力。 結果:日本語は打てる。 ・インポートする予定のファイルをカットアンドペーストでパッケージエクスプローラーに  直接貼り付け 結果:日本語で表示する。 なんとなくですが、インポートでおかしくなってるようなイメージです。

    • ベストアンサー
    • Java
  • ビットマップフォントをやめると文字化けしてしまう

    デスクトップやブラウザの文字などなんか微妙にカクカクしていて dpkg-reconfigure fontconfig-fontを実行し、ビットマップフォントをやめ、字はきれいになったのですが日本語が文字化けしてしまいます。 文字化けしたものは正方形よりちょっと縦長な線の中に 16進数が入っている状態で中の数字を調べたところutf-8の 16進数表示になっているの(「あ」と打つとutf-8の「あ」に対応した16真数の数字が入っているということです)ですがブラウザはutf-8になっているのになぜか文字化けしてます。 dpkg-reconfigure localesでjp_JP.UTF-8を選んでも文字化けは直りませんでした。どうすれば文字化けを直せるのでしょうか。

  • php 文字化け

    MAMPをインストールして、統合開発環境であるAptanaを使用してphpのプログラミンを行いたいのですが、 日本語を出力すると文字化けしてしまいます。 このページ http://sevenbluesea.blog101.fc2.com/blog-entry-19.html を参考にして、php.iniを書き換えて保存し直し、AptanaとMAMPを再起動をしても文字化けは直りませんでした。 実行したいソースのテキスト・ファイル・エンコードはSJISで、 これをUTF-8にすると、ソース自体が文字化けを起こしてしまいます。 ソース自体の記述をUTF-8にしないといけないのでしょうか? 何か解決案や参考ページなどを教えていただけると嬉しいです。 よろしくお願いします。

    • ベストアンサー
    • PHP
  • Latexの文字化けについて教えてください!

    windowsでlatexを使って日本語の含まれたtexファイルを作ったのですが、仮想環境のubuntu10.04でtexファイルを開くと文字化けが起こったので、 iconv -f EUC -t UTF-8 ファイル名.tex > 新しいファイル名.tex platex 新しいファイル名.tex で文字コードをEUCからUTF-8に変換することで、texファイルの文字化けは無くなったのですがxdviを使ってdviファイルを開くと文字化けしています。このような場合はどうすれば解消できますか?わかる方詳しく教えてください! EUSとUTF-8の変換前と変換後の文字コードは、 nkf -g ファイル名 で確認しました。 出来れば、他のubuntuの環境でも文字化けしないようにしたいので、環境設定を変えない方法があれば教えてください!

  • mysqlの文字化けについて

    さくらサーバーのプレミアムプランで、MYSQLが文字化けを起こして困っています。 MYSQL5.1、データベースの文字コードはUTF8です。 UTF8でエンコードされたPHPプログラムからデータをINSERTすると文字化けを起こします。 ハッスルサーバーで同じ環境を再現すると、文字化けは起こしません。 違いは、ハッスルサーバーでは、「character_set_server utf8」になっているのに対して、 さくらサーバーでは、「character_set_server ujis 」となっています。 この、ujisをutf8に変更すれば解決しそうに思うのですが、変更の仕方がわかりません。 アドバイス頂けましたら、幸いです。