MeCabの辞書をUTF-8で作ることができない理由とは?

このQ&Aのポイント
  • MeCabの辞書をUTF-8で作ることができない理由を解説します。
  • さくらインターネットでMeCabを構築している場合、辞書の表示がEUCで表示される問題が発生します。
  • インストールパラメータでwith-charset=utf-8を指定しているにも関わらず、辞書設定ファイル(dicrc)がEUCで作られる原因となっています。
回答を見る
  • ベストアンサー

どうしてもMeCabの辞書をUTF-8で作ることができません。

どうしてもMeCabの辞書をUTF-8で作ることができません。 さくらインターネットでMecabを構築中です。 ローカルエリアに、MeCabと辞書をインストールして、 動作確認したところ、動作上は問題が無いのですが表示がEUCで表示されます。 色々とネットで調べて、UTF-8で辞書を構築しようとパラメータ指定を 行っているのですが、全く改善されません。 どこが間違っているのでしょうか。。。 ●Mecab本体のインストール(mecab-0.98.tar.gz) % ./configure --prefix=$HOME/local --with-charset=utf8 --enable-utf8-only % make % make install ●辞書のインストール(mecab-ipadic-2.7.0-20070801) %./configure --with-charset=utf-8 --with-dicdir=/home/mirailink/local/lib/mecab/dic/ipadic (with-charsetを、utf8 にしてもダメ。また、下記コマンドで強制的?にUTFにしてもダメ  $HOME/local/libexec/mecab/mecab-dict-index -f euc-jp -t utf-8 ) % make % make install ●結果確認 (teratermでssh接続し、表示コードはUTF-8に設定しています) %mecab 今日は良い天気です。 莉 ?サ・ー・フ,*,*,*,*,莉,・ソ・ォ・爭・・ソ・ォ・爭・ オュケ・ー・フ,*,*,*,*,* 日 ?サ・クヌヘュフセサ・チネソ・,*,*,*,* は ?サ・ー・フ,*,*,*,*,* 良 ?サ・ー・フ,*,*,*,*,* い ?サ・ー・フ,*,*,*,*,* 天気 ?サ・ー・フ,*,*,*,*,* です ?サ・ー・フ,*,*,*,*,* 。 ?サ・・オハムタワツウ,*,*,*,*,* ●不明 インストールパラメータでwith-charset=utf-8を指定しているにも関わらず、 辞書設定ファイル(dicrc)を見ると、下記のようにECUで作られています・・・。 config-charset = EUC-JP

  • mmei
  • お礼率74% (120/161)

質問者が選んだベストアンサー

  • ベストアンサー
noname#111181
noname#111181
回答No.1

MeCab利用者です。 オプション --enable-utf8-only を指定してみてください。

mmei
質問者

お礼

早々のご回答ありがとうございます。 オプション --enable-utf8-only ですが、既にmecabインストール時に使用していますが、結果変わらずです。 なお、which mecab で調べると、確かにインストールしたmecabが起動していることも確認しています。 お手数おかけいたしますが、引き続きご支援お願いいたします。

関連するQ&A

  • PHPで辞書をutf-8でMeCabを利用する方法

    MeCabを利用していますが、どうしても文字化けしてしまいます。 私は現在、さくらインターネットのレンタルサーバーを借りており、 さくらのレンタルサーバーには既にMeCabと辞書がインストールされています。 しかし、その辞書の文字コードはeuc-jpです。 なので、辞書だけ別にホームディレクトリにインストールし、そのインストールした 辞書を使用したいです。 phpで、辞書へのパスを指定してMeCabを使用したいのですが、その場合どうすれば 良いですか?

    • ベストアンサー
    • PHP
  • MeCab(和布蕪)をWindows XPにインストール

    MeCabをWindows XPにインストールしようとして、cygwinで以下のように実行しました。 > tar zxfv mecab-0.81.tar.gz > cd mecab-0.81 > ./configure > cd src > make -f Makefile.bcc32 しかし、 > make -f Makefile.bcc32 を実行すると、 make: *** No rule to make target `dictionary_maker.obj', needed by `libmecab'. Stop. と表示されて、インストールできません。 何をどうすればいいのか、まったく分かりません。どなたか、対処法をお教えいただけないでしょうか。

  • MeCabの文字化け

    FedoraにMeCabと辞書をインストールしたのですが、 実行すると文字化けします。 結果の左側も文字化けしますが、 右側も、 「名詞,一般,*,*,*,*,」 となる所が、 「?サ・クヌヘュフセサ・チネソ・,*,*,*,*,」 こんな風になってしまいます。 utf-8の環境なのが原因でしょうか。 また、どのように直してあげればいいのでしょうか。 ご存知の方がいらっしゃれば、 ご解答お願い致します。

  • WinXPにおいてText::MeCabの導入方法

    一週間ぐらいこの作業で潰れており、疲弊しております。 先ずは稚拙で文章力の低い質問となっておりますことをお詫び致します。 単刀直入に申し上げますと、Text::MeCabがCPANからインストールできません。 環境はWinXP(SP3)、StrawberryPerl(5.8.8)、mecab(win32)(0.97)です。 mecabはCドライブ直下に置き、perl、mecabにもpathを通しております。辞書はshift_jis・utf-8、両方試しております。 CPANに入力した際に表示される質問には 0.97 -DWIN32 -Ic:\MeCab\sdk -lc:\MeCab\sdk\libmecab.lib c:\MeCab\sdk utf-8 or shift-jis の順で答えております。 以下の画像はCPAN結果です。 http://files.uploadr.net/3625661caf/WS000113_BFRUC.png 色々心労も重なっており、大変抽象的な質問で申し訳ございませんが、 もしご助力して下さる御方が居られましたら嬉しいです。 些細なアドバイス、「こうしたらどうだろう」程度でも構いませんので、宜しくお願い致します。

    • ベストアンサー
    • Perl
  • UNIX版インストール時のポート指定について

    サーバで7.4.8が動いている状態で、8.4.1をインストールしたいと思っています。 ./configure --prefix=/usr/local/postgres-8.4.10/ make make install といった形でインストールを行ないましたが、 --with-pgport=5433 とポートの指定忘れてしまいポートが被ってしまっているようで、うまく動きません。 そこで、「--with-pgport=5433」のオプションを付け足したいのですが、どのように行なえばよいでしょうか? (DB、TABLEなどは一切作っていません) もし、後で付け足すことができないのであれば、再インストールを行ないたいのですが、 ./configure --prefix=/usr/local/postgres-8.4.10/ --with-pgport=5433 make make install といったように、行なえば上書きインストールしてくれるのでしょうか? よろしくお願い致します。

  • linuxにPostgreSQL8.3インストールについて

    CentOS5にpostgreSQL8.3をtarからインストールしようとしているのですが、"./configure --enable-multibyte=EUC_JP"とすると "configure: error: readline library not found"となるので、 readlineを # ./configure # make # make install # ldconfig としたのですが、再び同じエラーとなります。 ld.so.confにも"/usr/local/lib"と加えてあらためてldconfigとしてもダメでした… readlineインストール時に "install: you may need to run ldconfig"と出るのでreadlineはちゃんとインストールできていると思っているのですが、無理やり"./configure --enable-multibyte=EUC_JP --without-readline"として通してもやっぱり納得がいきません・・・ いったいまず何を見たらいいのでしょうか?

  • UTF8環境下で外部CSSの挙動がおかしい

    外部CSSの挙動で非常に困っています。 このたびサーバーを移設することになり、新しく借りたサーバーに既存のソースを移動して動作確認を行っていたところ外部CSSの挙動がおかしく、原因もわからなく困っています。 どなたかご教授いただけますでしょうか。 詳しい環境は下記のとおりです。 --引っ越し前------------------- ホスト文字コード:EUC-JP ローカル文字コード:EUC-JP FTP時には無変換でアップロード --引っ越し後------------------- ホスト文字コード:UTF-8 ローカル文字コード:EUC-JP アップロード時にEUC-JP⇒UTF8変換でアップロード どちらもPHPファイルから**.cssというファイルを外部参照してスタイルを読み込んでいます。現象としては、CSSファイルのすべてが読み込めないのではなく部分的に読み込めない状況です。 しかも再読み込みするとスタイルが効いたり効かなかったりと挙動もまちまちで、おかしい部分が特定できません。 CSSファイルの先頭に「@charset "UTF-8";」をつけてみたり、「@charset "EUC-JP";」をつけてEUCでアップロードしたりしてみましたが何も変わりませんでした。 CSSの最初に出現するのはbody{}ですので、先頭がクラスによっておこされる現象でもないようです。 前サーバーの使用期限が迫っており、このままでは現状での引っ越しとなってしまい大変困っています。 どなたか回答よろしくお願いいたします。

    • 締切済み
    • PHP
  • Linux へのセットアップ

    Fedora Core2 を利用しているのですが、PRM版のMYSQLをバージョンアップしたくて、rpm -e でmysql関連を削除してから。 MySQL(mysql-5.1.30.tar.gz)をソースから下記方法でインストールしました。 ./configure --with-charset=utf8 \ --with-extra-charsets=all \ --with-mysqld-user=mysql \ --with-innodb \ --enable-local-infile \ --prefix=/usr/local/mysql \ --with-unix-socket-path=/tmp/mysql.sock make make install ./scripts/mysql_install_db --user=mysql chown -R mysql /usr/local/mysql/ chgrp -R mysql /usr/local/mysql/ /usr/local/mysql/bin/mysqld_safe & しかし最後の起動のところでエラーが出てしまいます。 エラーログには 081218 16:30:33 [ERROR] /usr/local/mysql/libexec/mysqld: unknown option '--skip-federated' 081218 16:30:33 [ERROR] Aborting って書いてました。何故なんでしょうか。。。

  • phpMyAdminのLanguage選択でUTF-8のものしかリストにない?

    phpMyAdmin2.6.2-pl1をインストール後、起動させてみたところ、「Language」選択メニューに「UTF-8」のものしかありません。 これは正常なのでしょうか? レンタルサーバなどは、バージョンが違いますが「EUC-JP」などが選択できたのですが、自分のローカルにインストールしたら、「UTF-8」のものしか出てきません。 OSはCentOS4で、PHPは4.3.9、MySQLは4.1.10aです。 アドバイスをいただければと思っています。 よろしくお願いします。

    • ベストアンサー
    • PHP
  • php5.0.5 について

    apache2+php5.0.5で、 ./configure ./configure --with-apxs2=/usr/local/apache2/bin/apxs --enable-mbstring makeすると、 configure:error: libxml2 version 2.5.0 or greater required. となるのですが、どうしてでしょうか? このままインストールしていいのでしょうか? 教えてください。宜しくお願いします。

    • ベストアンサー
    • PHP

専門家に質問してみよう