• ベストアンサー

文字コードを確認するには(64bitRedhat)

あるテキストファイルの日本語が文字化けしてしまったので、 試しにwindowsのクライアントにダウンロードしてIEで開いて確かめたところ、 ユニコード(UTF-8)にて正常に見ることができました。 しかし、Linuxに戻って、ロケールを ja_JP.utf8にしてみてもいぜんとして化けたままです。 どのようにして、Linuxでの文字コードを確認することができるのでしょうか?

質問者が選んだベストアンサー

  • ベストアンサー
  • mech32
  • ベストアンサー率57% (23/40)
回答No.3

もしもコマンドラインから > setenv LANG ja_JP.utf8 などのように入力したなら、場合によって、「ja_JP.utf8」の部分が違っているかもしれません。私の環境では、「ja_JP.utf8」ではなく、「ja_JP.UTF-8」になっていました。このあたりは、localeファイルを確認すれば分かると思います。 一応、「env」などのコマンド(csh系)でロケールの設定を表示させることができますが、これは、存在しないロケールを指定しても、そのまま、その文字列を返すだけなので、あまり意味がないようです。 また、仮に正しくロケールの設定が出来たとしても、例えばktermなどのシェルはUTFコードに対応していないので、表示できないようです。やはり、UTFコード対応のエディタなどで開くか、nkfを通すのが良いのではないかと思います。

その他の回答 (2)

回答No.2

nkf 通して見るとか。 あるいは more や less の代わりに lv で見るとか。 それでも化ける場合は、端末の文字セットが utf8 になっていない可能性があると思います。(たとえば Windows マシンから TeraTerm で telnet ログインした場合、日本語EUCかシフトJISしか設定できないので LANG を ja_JP.UTF8 などにすると化けます)。

azicyan
質問者

お礼

nkfがよくわからないのですが、 ちょっと調べてみます。 ありがとうございました

回答No.1

いま、手元にLinux環境がないので検証できませんが、fileコマンドで文字コードが判別できませんでしたっけ。 $ file filename.txt filename.txt: UTF-8 Unicode text のようにして利用します。

azicyan
質問者

お礼

残念ながらだめみたいです・・・

関連するQ&A

  • 文字コード【utf-8】のHTMLを

    charset=utf-8で作成されているHTMLをDreamweaverで開くと テキストが文字化けしてしまいます。 他のテキストエディタで文字コードをUnicodeに設定して開いた場合も Web上で「ソースコードの表示」でソース表示してもやはり同じく文字化けしてしまいます。 この場合、どうしたら文字化けせずにソースを表示することができますか? できればDreamweaverで開けるとありがたいのですが・・・ アドバイスいただけると助かります。 どうぞ宜しくお願い致します。

    • ベストアンサー
    • HTML
  • 文字コードが知りたい

    既存のテキストファイル(メモ帳)があるのですが このファイルの文字コードが ANSIなのかUnicodeなのかUTF-8なのかってどうやったらわかりますか? プロパティを見てもわかりませんでした。

  • Solarisの文字コードについて

    Solaris8をインストールしました。 文字コードはEUCになっていると思いますが、テキストファイルを EUCでSolaris8サーバにアップロードしてもviで参照すると文字化けしてしまいます。 (1)システムの文字コードの確認方法を教えて下さい。 (2)文字コードをSJISからEUCに変換する方法を教えて下さい。 (nkfコマンドを打ってもcommand not foundになります。。標準ではインストールされないのでしょうか?) p.s OSのインストール時、下記のように入力しました。 ・Select a Locale →0.Japanese EUC(ja) ・ソフトウェアの対応地域 →アジア・Japanese EUC(ja)、Japanese PC Kanji(ja_JP.PCK)、Japanese UTF-8(ja_JP.UTF-8)

  • 文字コードに関することです

    こんばんは。 社会人1年目でSEをやっております。 来週文字コードについて、発表することになっています。 発表内容として 文字コードの種類としてsjis.unicode.EUCなどがあり、これらの文字コードについて説明します。 しかし、どの程度のレベルまで説明すればいいのか悩んでいます。 私の考えとしては、unicodeを例にあげさせていただきますが、 unicodeとは、世界の言語を1文字2バイトを用いて表現できる文字コードです。unicodeの中でも大きく分けて2種類utf-8、utf-16に分けられます。 次に各utfの詳細な説明に入ります。 こんな具合にそれぞれの文字コードについて、説明していってもよろしいですか?? あと、utf-8がなぜ必要になったのか、教えていただけますでしょうか?? よろしくお願いします。

  • コピーすると文字コードが変わっちゃう

    プログラムを(ちなみにPHP)エディター(ちなみに秀丸)で入力して保存時にエンコードの種類を「Unicode(UTF-8)」で保存 もちろんプログラム(HTML/PHP記述)では <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> を指定しています 実行すると文字化けも起こらず正常にホームページが完成しました それをコピーして別のサーバーにアップすると正常にホームページが開かないんです 文字化けだけでなくソースが画面に表示されました そのソースも文字化けです コピー先をエディターで開くと「日本語(Shift-JIS)」になっていました コピー元は「Unicode(UTF-8)」です なぜでしょう? そもそも「Unicode(UTF-8)」をコピーするには単純にコピーしてはいけないのでしょうか? プログラムの量が結構あるのでこの「日本語(Shift-JIS)」を一括して「Unicode(UTF-8)」に保存できるようなツールはないのでしょうか?

  • 2つの文字コードの文字化けについて

    こんばんわ。 Linux使ってます。 わかりにくいかも知れませんが・・・ とあるHP更新ソフトを使ってるのですが、 そのHP更新ソフトが2つあり、 一つはShift_JISで自動でソースが書き出されます。 もう一つのソフトは自動でutf-8で書き出されます。 この時、バーチャルホストなので、 Apacheの設定は、noneにしてるので、 それぞれソフトで吐かれる文字コードに依存するようにしてます。 ですが、どうも、 cgiを使ってる所が文字化けしてしまいます。 utfで指定しないとダメなのかな・・・? 何か文字化けせず、 正常に表示させる方法はありますか? .htaccessなど使用も可能です。

  • mysqlのデータベースの文字コードの変換について

    mysqlのデータベースの文字コードの変換について教えてください。 テストサーバー環境で誤って文字コードUTF-8のデータベースを作成し、文字コードEUC-JPのデータを投入してしまいました。 それでもテストサーバー環境では文字化けせずにウェブアプリを表示できていましたが、テストサーバーのデータをエクスポートすると、テキストエディタで開いた時点で文字化けしています。 (文字コードはUTF-8、EUC-JPのいずれでも) もちろんそのデータを本番サーバーにインポートしても文字化けしてしまいます。 (データベース文字コードはUTF-8、EUC-JPのいずれでも) テストサーバーからデータをエクスポートする前に文字コードを変換することは可能でしょうか? もしくは他に問題を解決する方法はありますでしょうか? ご存知の方がいらっしゃいましたら教えてください。

    • ベストアンサー
    • MySQL
  • テキストファイルが文字化けし、エンコード不能に

     システムロケールを英語(英国)に変更したら、デスクトップ上に保存していたテキストファイルが文字化けしました。日本語に戻してもそのままの状態です。  IEでファイルを開き、右クリックでエンコードを選択して日本語(シフトJIS、EUC)に変換してもうまくいきません。  Web上の複数の変換ツール(UnicodeUTF-16やUTF-8を日本語に変換)にテキストを張り付けて変換しても同様です。  大切なファイルの2つが文字化けしたのですが、バックアップしておらず非常に困っています。  どなたか、元の文章を復元する知恵を貸していただけませんか?  一例として、1行目はこのようになっています。数字だけは、残っています。 「@ƒPƒ“ƒR[ƒRƒ€@@@2,205@‰»Ï•i 」  【備考】 ・ロケール変更は、BattleField4というゲームをする際に出るエラーを回避するために行いました。 ・IEでテキストファイルを開き、エンコードにカーソルをあわせると、「Unicode」に丸がついてグレーアウト表示されます。※Unicode(UTF-8)ではありません。

  • リダイレクトする時の文字コードをUnicodeに

    現在、VisualStudioで、システムコールの標準出力結果をリダイレクトしてファイルに保存する プログラムを書いています。 _tsystem(command); のような感じで、commandには "hogehoge > hoge.txt"のように入ります。 ※command はTCHAR この出力結果が、Shift-Jisになっているようで、Shift-Jisだと日本語が文字化けせずに表示されるのですが、Unicode UTF-16にすると文字化けしてしまいます。 Unicode UTF-16とかUnicode UTF-8など文字コードを指定してリダイレクトできないのでしょうか。 ちょっと調べてみましたがうまく見つかりませんでした。

  • 文字コードについて

    仕事場のワークステーションがUNIX→Linuxに移行することが決まりました。 そこで現在使用しているUNIXのプログラムをLinuxにコピーしたのですが、文字コードがおかしいのか文字化けして動作しません。 動作としては プログラムを立ち上げる    ↓ 環境設定ファイルを読み込む    ↓ 上手く起動する 正常なら上記の動作ですが、環境設定ファイルが読み込めず停止してしまいます。 そこで環境設定ファイルを開くと文字化けしてました。 その後、今までのUNIX上での環境設定ファイルをlessで表示させ、 新たなLinuxマシンにviでコピー・ぺ-ストして保存したところ 正常に動作しました。 操作は別端末のTeraTaermで行っています。 これはLinuxマシンの文字コードがUTF-8のためEUCが認識できないからでしょうか? 行き詰ってますので、どうかお願いいたします。 Linuxの環境は Red Hat 8.0のエンタープライズ版です。