• ベストアンサー

ファイルの日本語コードの調べ方

2つの同じようなファイルがあり、あるアプリからファイルをインポートしますが、1つはOKですが、1つはNGです。エラーの発生は//の間の日本語の部分で、2つめの/がどうも認識されていないようです。日本語部分は完全に文字化けしていました。 おそらくUTF-8のユニコードであれば正しく認識されると思うのですが、2つのファイルは見た目は日本語部分は同じですが、日本語のコードが現在何か調べる方法はありますか。

質問者が選んだベストアンサー

  • ベストアンサー
回答No.1
tach_ei
質問者

補足

参考にはなりますが、具体的に理解するのにちょっとむづかしい感じです。VBの関数として遣う方法はありますか。コードを判定する際に今の環境ではVBで実現しないとできないと思いますが、・・・

その他の回答 (3)

回答No.4

#1 です。 > VBの関数として遣う方法はありますか。 そのつもりで URL を紹介しました。 VB のバージョンが書かれていないので、Visual Basic 2005 と判断してますが、2002 でも 2003 でも大丈夫でしょう。 Visual Basic 6.0 の場合はそのまま使えるコードは載ってませんけどね。 ズバリ言っちゃえば、6.0, 2002, 2003, 2005 どのバージョンを使うにしても文字コード判断の部分は自力で実装するか、外部 DLL などの手を借りるかしないといけないって事だけは事実です。

  • SUPER-NEO
  • ベストアンサー率38% (706/1857)
回答No.3

シェアウェアの秀丸エディタを使っています。 文字コードの自動認識で開く方法もありますし、 手動で文字コードを決めることも出来ます。

  • palmmy
  • ベストアンサー率38% (841/2170)
回答No.2

手っ取り早い方法なら textファイルであれば、IEを開いてドラッグ& ドロップで掘り込んだら、中身が表示される と思います。 そして、エンコードをみるとコードがわかります。 (unicode、UTF-8、EUC、シフトJIS)

tach_ei
質問者

補足

IEを開いてソースを表示にしてからですね。 操作しましたが、正常なファイルはそのままでした。 問題のファイルはやはり文字化けしました。 問題のファイルの日本語コードを変換できるようトライしてみます。ありがとうございます。

関連するQ&A

  • 文字コードの違うファイルインポート

    こんにちわ。 いつもお世話になっています。 文字コードの違うcsvファイルをTransferTextでインポートしたいのですが いい方法がなく困っています。 ご存知の方、ご教示下さい。 【経緯】 csvファイルはインターフェイス上では文字コードが「unicode」 で設定されているとの事でした。 mdbにてファイルのインポートを行うと文字化けするのでインポート定義を 設定してみた所、「UTF-8」だけが日本語にできたました。 しかし、インポートしてみるとカラム数が12個あったのに対して9個しか 取込できませんでした。 そこでそのcsvをエディタにて「名前を付けて保存」→文字コードを「SJIS」に変更して 保存し直しました。 その保存し直したcsvを読込するとカラム数も12個で文字も日本語でインポート できました。 どうしてもVBAでコマンドボタンを押下してインポートしたいのですが いい方法が見つかりません。 お知恵をお貸し下さい。 よろしくお願い致します。

  • プロパティファイルで日本語を扱う

    プロパティファイルに日本語をいくつか定義しておきます。(例えばmessage=あいうえお など)これをResourceBundleでgetStringして表示すると、文字化けしてしまいます。コマンドプロンプトからプロパティファイルをUnicodeエスケープすれば、文字化けしないで表示できるのですが、プログラム上でUnicodeエスケープとかってできるのでしょうか?それともプロパティファイルで日本語を取得する場合は必ずコマンドプロンプトからUnicodeエスケープするしかないのでしょうか?また、他にプロパティファイルでの日本語の取得の仕方がありましたらご教授願います。

    • ベストアンサー
    • Java
  • エンコード 日本語(JIS)が選べない

    教えてください。 Internet Explorer 9 を使用しています。 エンコード  Unicode(UTF-8)が選ばれており、 支障をきたしています。 http://okwave.jp/qa/q8078148.html 上記で支障をきたす理由記載。 日本語(シフト JIS)を選びたいのですが チェックを変えると文字化けしてしまい、 ホームに戻ってみると文字化けが解消されるとともに Unicode(UTF-8)にもどってしまいます。 自動選択にチェックいれてみたりためしましたが どうしてもUnicode(UTF-8)に勝手に戻ってしまいます。 日本語(シフト JIS)を設定するにはどうすればいいでしょうか? ヒントでも結構です! 宜しくお願い致します。

  • 文字コードを確認するには(64bitRedhat)

    あるテキストファイルの日本語が文字化けしてしまったので、 試しにwindowsのクライアントにダウンロードしてIEで開いて確かめたところ、 ユニコード(UTF-8)にて正常に見ることができました。 しかし、Linuxに戻って、ロケールを ja_JP.utf8にしてみてもいぜんとして化けたままです。 どのようにして、Linuxでの文字コードを確認することができるのでしょうか?

  • リダイレクトする時の文字コードをUnicodeに

    現在、VisualStudioで、システムコールの標準出力結果をリダイレクトしてファイルに保存する プログラムを書いています。 _tsystem(command); のような感じで、commandには "hogehoge > hoge.txt"のように入ります。 ※command はTCHAR この出力結果が、Shift-Jisになっているようで、Shift-Jisだと日本語が文字化けせずに表示されるのですが、Unicode UTF-16にすると文字化けしてしまいます。 Unicode UTF-16とかUnicode UTF-8など文字コードを指定してリダイレクトできないのでしょうか。 ちょっと調べてみましたがうまく見つかりませんでした。

  • ファイル名のコード変換

    vinelinux3.2から無線LANカードの関係で、kernel2.6をどうしても使いたく、fedra core5に変えました。 快適に動作するのですが、過去作成したファイルが、EUCからunicodeに変わった結果、ファイル名が文字化けしてしまい、読めなくなってしまいました。 ファイルの中身は、nkf等の変換ツールで変換できますが、ファイル名をEUCからunicode(UTF-8)に変換する方法はないでしょか? 日本語のファイル名を使うほうが悪いという、ご指摘は重々にわかりますが、ワークステーションとして利用していたので、日本語のファイル名も使います。 また、unicodeからEUCに変更すれば?と言われそうですが、この機会に、unicodeに変更したいと思います。 よろしくお願いいたします。

  • メモ帳で保存した日本語テキストや日本語XMLをJavaで読込、保存。メモ帳での保存文字コードはなにが推奨されるでしょうか?

     Windows9x系ではないWindowsVistaやXP、NT、2000のメモ帳(Unicodeのbig endianは保存できるがおそらくUnicodeのbig endianでのBOMなし保存不可。UTF-8は保存できるがUTF-8でのBOMなし(UTF-8N)の保存不可。Unicodeのlittle endianは保存できるが仕様なので言うまでもないがUnicodeのlittle endianでのBOMなし保存不可。)で保存した日本語テキストや日本語XMLをJavaで読込、保存。メモ帳での保存文字コードはなにが推奨されるでしょうか? やはりJavaのString型に近いUnicode big endianがよいのでしょうか? それともJava側で自動認識してくれるのでしょうか? XMLの場合は1行目でそのXMLファイルが使用している文字コードが何か宣言しますよね。 でもテキストファイルだと文字コードを宣言する場所がないみたいですし・・・(ここでの文字コードを宣言する場所としてはBOMは例外ですよ 念のため) 補足:メモ帳だとUnicode big endianで保存すると必ずBOMが付くみたいです。 メモ帳はLF改行が使えません。CR+LF改行のみ対応です。

    • ベストアンサー
    • Java
  • テキストファイル(英語&日本語)を読む時に文字化けいたします

     今晩は,いつも勉強させていただいております. 質問させていただきます.どうぞよろしくお願いいたします.  テキストファイル(ほとんどが自作のFortranコードで,英語と日本語のみで ございます)を読み込みたいのですが,全角文字の読み込み (下記コードになります)で文字化けいたします..  Dim SR As New System.IO.StreamReader(FileName, System.Text.Encoding.GetEncoding(51932))   '↑ここのエンコード(?)が怪しいのでは,などと考えている次第です.  Dim text As String = SR.ReadToEnd()  MsgBox("/" & text & "/")    '↑「text」が化けます...  エンコード(?いまいち理解しておりませんorz)の種類がおかしいのでは, というところまでなんとか行き着きまして,色々と検索いたしておりますと  http://www.atmarkit.co.jp/fdotnet/dotnettips/013enumenc/enumenc.html にまとめてくださっておりましたので,思いつく数字を「51932」の代わりに 入れてみましたが,どれも全角文字が文字化けいたします.. 「0 shift_jis 日本語 (シフト JIS) 」 「932 shift_jis 日本語 (シフト JIS) 」 「1200 utf-16 Unicode 」 「51932 euc-jp 日本語 (EUC) 」「1200 utf-16 Unicode 」  もしかすると別の部分に問題があるのかもしれませんが.. 調べておりますと, http://dobon.net/vb/bbs/log3-25/15325.html などよく似た症状なのですが,真似いたしましても解決いたしませんでした・・  もし,日本語と英語のテキストファイルすべてに通用するようなお勧め エンコード方法のようなものがございましたら,ご紹介いただきたくお願い申し上げます.  お詳しい方がいらっしゃいましたら,是非ともアドバイスいただきたく どうぞよろしくお願いいたします

  • バイナリファイル中の日本語文字列の取り出し

    C++にて,バイナリファイル中から日本語の文字列を取り出す処理に苦心しています. 具体的にはPDFファイルのXMPの記述部のXMLに日本語が含まれる場合なのですが,日本語(この場合はUTF-8ですね)の部分が含まれる部分をfread()で読み出してchar[]型の配列に入れて,printfで表示する(漢字コードの変換処理はとりあえずnkf等でUTF-8→SJISに変換)と文字化けします. Javaで同じような処理をしたときは,String の変数にUTF-8で日本語の文字列が挿入され,その文字列を扱うことができたのですが,C++での扱いがわかりません. ご教授よろしくおねがいします.

  • wordpressがMySQLに日本語データを格納する際の文字コード

    初めまして、satsukimaと申します。 現在他のブログからの引越し作業を行うべく、wordpressのインストールを終えました。 そして別のブログサイトからのテキストデータをMySQLに流し込もうとしています。 ところが日本語の部分にのみ文字化けが発生してしまいます。 wordpressではMySQLに日本語データを格納する際、どのような文字コードを使っているのでしょうか? 以下の5点を試しました。 1.utf8の端末でMySQLのCLI(mysql client)から"insert into"コマンドを使ってデータを追加しましたが、CLIのselect文とブラウザの両方で確認したところ日本語部分で文字化けが発生します。 2.ブラウザから通常通りに管理画面より日本語の入力を行うと文字化けせずに正常にブラウザに表示されます。 3.しかし正常にブラウザに表示されるデータをCLIのselect文にて確認すると文字化けが発生します。CLI端末の文字コードをutf8、euc、shift-jis、iso-2022-jpで試しましたが、やはり「?????」といったような文字列が表示され、文字化けします。 4.MySQL Query Browserからselect文を実行すると、ブラウザ上で正しく表示されているデータは正常に表示されます。 5.自分で書いたPHPスクリプトでselectを実行しブラウザから表示させると、文字化けします。ブラウザの文字コードをutf8、euc、shift-jis、iso-2022-jpで試しましたが、文字化けします。 どなたかヒントでも頂けないでしょうか。 ぜひ宜しくお願い致します。

    • ベストアンサー
    • PHP

専門家に質問してみよう