- ベストアンサー
テキストファイル(英語&日本語)を読む時に文字化けいたします
今晩は,いつも勉強させていただいております. 質問させていただきます.どうぞよろしくお願いいたします. テキストファイル(ほとんどが自作のFortranコードで,英語と日本語のみで ございます)を読み込みたいのですが,全角文字の読み込み (下記コードになります)で文字化けいたします.. Dim SR As New System.IO.StreamReader(FileName, System.Text.Encoding.GetEncoding(51932)) '↑ここのエンコード(?)が怪しいのでは,などと考えている次第です. Dim text As String = SR.ReadToEnd() MsgBox("/" & text & "/") '↑「text」が化けます... エンコード(?いまいち理解しておりませんorz)の種類がおかしいのでは, というところまでなんとか行き着きまして,色々と検索いたしておりますと http://www.atmarkit.co.jp/fdotnet/dotnettips/013enumenc/enumenc.html にまとめてくださっておりましたので,思いつく数字を「51932」の代わりに 入れてみましたが,どれも全角文字が文字化けいたします.. 「0 shift_jis 日本語 (シフト JIS) 」 「932 shift_jis 日本語 (シフト JIS) 」 「1200 utf-16 Unicode 」 「51932 euc-jp 日本語 (EUC) 」「1200 utf-16 Unicode 」 もしかすると別の部分に問題があるのかもしれませんが.. 調べておりますと, http://dobon.net/vb/bbs/log3-25/15325.html などよく似た症状なのですが,真似いたしましても解決いたしませんでした・・ もし,日本語と英語のテキストファイルすべてに通用するようなお勧め エンコード方法のようなものがございましたら,ご紹介いただきたくお願い申し上げます. お詳しい方がいらっしゃいましたら,是非ともアドバイスいただきたく どうぞよろしくお願いいたします
- MKT_
- お礼率99% (329/330)
- Visual Basic
- 回答数2
- ありがとう数4
- みんなの回答 (2)
- 専門家の回答
質問者が選んだベストアンサー
試していないエンコードのうち、可能性が高そうな順で。。。 65001 utf-8 Unicode (UTF-8) 1201 unicodeFFFE Unicode (Big-Endian) 50220 iso-2022-jp 日本語 (JIS) 20932 EUC-JP 日本語 (JIS 0208-1990 and 0212-1990) 10001 x-mac-japanese 日本語 (Mac) エンコードが分からなくなった時の我流の調べ方 1. バイナリを見て判断。 2. ブラウザで開いて正しく表示されるエンコードを探す。 3. メモ帳で開いて文字化けしなければ「名前を付けて保存」の文字コードを確認。 あと、お気づきかもしれませんが、コードページ 0 は、システムの既定のエンコードです。Windowsが日本語版だからこそshift_jisになっているだけですので 0 = shift_jis と覚えないようにご注意を。 おすすめのエンコード。。。 私がよく使うのは、Unicode(UTF-16), UTF-8, Shift_JISあたりですかね。XMLやHTMLはUTF-8で書くことがほとんどです。 どーでもいい話ですが、気になったのでVisual Studio 2005のコードを見てみたらVB(*.vb)はShift_JIS、C#(*.cs)はUTF-8でした。 なぜ違うのだろう。。。(?_?)
その他の回答 (1)
- akanekor
- ベストアンサー率52% (102/194)
とりあえず、今のテキストファイルのエンコードの種類見てみれば よろしいかと。 自分がよくやるのは エディタ(秀丸等)で開いて「エンコードの種類」を見て判断しています。 エディタ(秀丸等)で開いたとき、エンコード失敗のエラーが出たら、 ファイルのフォーマット異常の可能性も判断できますし。 ただ、あらかた、試しているようなので、 残りの可能性は utf-8 くらいしかない気がする。
お礼
どうもありがとうございます!! 秀丸で確認してみましたところ,utf-8でございました. No.2氏からもutf-8の番号をご紹介いただけておりましたので 試してみましたところ,読めるようになりました^^ ・・しかしFortlanコード以外の普通の文書が読めなくなりました orz この続きはまた検索して頑張ってみます. >エディタ(秀丸等)で開いたとき、エンコード失敗のエラーが出たら、 >ファイルのフォーマット異常の可能性も判断できますし。 存じませんでしたm(_ _)m 勉強になります.どうもありがとうございます! この度はご閲覧・アドバイスいただきましてどうもありがとうございました. ありがとうポイントですが,No.2氏からお勧めエンコードも詳しく ご紹介いただけましたのでNo.2氏に優先して付けさせていただきます. また見かけたらどうぞ助けてやってくださいm(_ _)m この度はおかげで助かりました.^^どうもありがとうございました!!
関連するQ&A
- 日本語と韓国語の混在入力と文字化けについて
ホームページ上の掲示板で、韓国語を入力したとき、 Windows98SE IE6.0 エンコードがShift-JISでは韓国語入力ができ Windows2000 IE6.0 エンコードがShift-JISでは書き込んだときは 韓国語がの日本語EUCコードの文字に化けしてしまいます。 この掲示板はUNICODEでないため、韓国語が入力できること自体 不思議なのですが、どうしたら、文字化けせず韓国語と日本語の 混在が可能でしょうか?
- 締切済み
- Windows NT・2000
- テキストファイルが文字化けし、エンコード不能に
システムロケールを英語(英国)に変更したら、デスクトップ上に保存していたテキストファイルが文字化けしました。日本語に戻してもそのままの状態です。 IEでファイルを開き、右クリックでエンコードを選択して日本語(シフトJIS、EUC)に変換してもうまくいきません。 Web上の複数の変換ツール(UnicodeUTF-16やUTF-8を日本語に変換)にテキストを張り付けて変換しても同様です。 大切なファイルの2つが文字化けしたのですが、バックアップしておらず非常に困っています。 どなたか、元の文章を復元する知恵を貸していただけませんか? 一例として、1行目はこのようになっています。数字だけは、残っています。 「@ƒPƒ“ƒR[ƒRƒ€@@@2,205@‰»Ï•i 」 【備考】 ・ロケール変更は、BattleField4というゲームをする際に出るエラーを回避するために行いました。 ・IEでテキストファイルを開き、エンコードにカーソルをあわせると、「Unicode」に丸がついてグレーアウト表示されます。※Unicode(UTF-8)ではありません。
- ベストアンサー
- その他(Windows)
- Outlook Express6のメールを印刷時、文字化けが起こります
Outlook Express6のメールを印刷時、文字化けが起こります。 印刷したいメールは、 「jpgの画像」が本文に埋め込まれているもので「G-mail」から送られてくるものです。 メールを開いたときは文字化けせずに読めるのですが、 印刷をすると文字化けします。 [表示] - [エンコード]で 日本語(EUC)、日本語(シフトJIS)、Unicode(UTF-8)を それぞれ試しましたが解決しませんでした。 対策をご存知の方いらっしゃいましたら、 アドバイス宜しくお願いします。
- ベストアンサー
- その他(メールサービス・ソフト)
- 文字コードでなる文字化けの直し方お願いします。
海外のWEBHOSTサーバーの WE○NGというところを使っているのですが。 HTMLの記述で charset="Shift_JIS" とすると日本語が文字化けします。 Shift_JIS を EUC-JP iso2022-jp UTF-8 ASCII と色々変えてみても、全部日本語が文字化けしました;; 文字化けにならない、日本語が表示されるにはどうしたらよいでしょうか。 お知りの方 よろしくお願いします。
- ベストアンサー
- ブログ
- IE8の文字化け。
IE8の文字化け。 Windows7のIE8を使っています。 文字が少し小さくなったなと少し気になりましたが、しばらくそのままで使っていました。 ニコニコ動画を久しぶりに見たらコメント欄が半分切れて表示されておらず、コメントも書き込めません。 それ以外は問題なく使えていますが、少々見にくいのと、ニコニコ動画以外のサイトでもこういう問題が起こったら大変なので、なんとか修復したく質問をしました。 右クリ、エンコードから「自動選択」のチェックを外しています。 「Unicode(UTF-8)」となっているのを、 「日本語(自動選択)」 「日本語(EUC)」 「日本語(JIS)」 これらに変えてみましたが、すべて文字化けします。 「Unicode(UTF-8)」しか日本語表示できていない状態です。 ドキュメントの方向、左から右となっています。 なお、システムの復元は使えません。 宜しくお願いします。
- ベストアンサー
- ネットトラブル
- 文字化けについて
送ったメールがたまに文字化けします。 文字化けするときは全部がすると思います。 そこで、テキスト形式で送る。文字コードを日本語にするとしてみたんですが直りませんでした。Microsoft Outlookを使ってるんですが、「エンコードオプション」というのに日本語が4つありEUC,JIS 1バイト カタカナ可,JIS,ソフトJISとあります。 どれにしたらいいんでしょうか?ちなみに今はソフトJISになっています。 それと、「送信メッセージのエンコード方法を自動選択する」というのはチェックを入れたほうがいいんでしょうか? 携帯やフリーメールに送ったら文字化けする気がするのですが、それらに送っても文字化けしないときやそれら以外に送っても文字化けするときがあります。 特に特殊な記号も使っていません。?や!ぐらいです。 よければアドバイスください。よろしくお願いします。
- ベストアンサー
- その他(メールサービス・ソフト)
- エンコード 日本語(JIS)が選べない
教えてください。 Internet Explorer 9 を使用しています。 エンコード Unicode(UTF-8)が選ばれており、 支障をきたしています。 http://okwave.jp/qa/q8078148.html 上記で支障をきたす理由記載。 日本語(シフト JIS)を選びたいのですが チェックを変えると文字化けしてしまい、 ホームに戻ってみると文字化けが解消されるとともに Unicode(UTF-8)にもどってしまいます。 自動選択にチェックいれてみたりためしましたが どうしてもUnicode(UTF-8)に勝手に戻ってしまいます。 日本語(シフト JIS)を設定するにはどうすればいいでしょうか? ヒントでも結構です! 宜しくお願い致します。
- ベストアンサー
- SE・インフラ・Webエンジニア
- EUCのテキストファイルを読み込むと「文字化け」してしまいます
ネットワーク上からテキストファイルを読み込むiアプリを作っています。 Shift-JISのテキストファイルは正しく表示されるんですが、 EUCのテキストファイルを読み込むと文字化けしてしまいます。 具体的にいうと,「重奏」という文字列は「スナチユ」と表示されてしまいます。 元のテキストファイルのエンコード方式をShift-JISにすれば直るんですが、テキストファイルはEUCのまま読み込みたいのです。 どうすればよいでしょうか…。
- ベストアンサー
- Java
- 日本語部分のみ文字化けしています。
ヤフーの受信メールが文字化けして読めません。 化け方は☆、難しい漢字、、@、・、√等です。 英文の部分は文字化けしていないのですが、日本語で書いたと思われるブ部分のみ文字化けしています。 詳細ヘッダのContent-Typeはtext/plain;charset="UTF-8"となっているのでエンコードをUTF-8にして表示させようとするのですが画面が真っ白になってしまいます。他のエンコードで試しても文字化けしたままです。 ド素人ですので分かりやすく教えて頂けると嬉しいです。 よろしくお願いします。
- 締切済み
- その他(メールサービス・ソフト)
お礼
どうもありがとうございます!!m(_ _)m >可能性が高そうな順で。。。 >65001 utf-8 Unicode (UTF-8) ビンゴでございます^^b >2. ブラウザで開いて正しく表示されるエンコードを探す。 あ.確かにMsgBoxの表示と同じ化け方になりました. >3. メモ帳で開いて文字化けしなければ「名前を付けて保存」の文字コードを確認。 なんとメモ帳の保存時に出ていたんですね.今まで気付きませんでした^^; どうもありがとうございます! >あと、お気づきかもしれませんが~ > 0 = shift_jis と覚えないようにご注意を。 今知りました!w 覚えます!(`-´ゞ >よく使うのは、Unicode(UTF-16), UTF-8, Shift_JIS どうもありがとうございます!!助かります! >VB(*.vb)はShift_JIS、C#(*.cs)はUTF-8でした と併せて考えても,今後読み込むソースファイルに応じてエンコード方法を 変える必要があるということですね・・実際,UTF-8にしてから 他のファイル(日本語文書)が読めなくなりました・・orz 今後のためにプログラム側からエンコードを知る方法が何かあれば良いのですが・・ 色々とアドバイスいただきまして,どうもありがとうございました!! とりあえず今からFormの上にエンコード種類のコンボボックスを追加します^^; どうもありがとうございました!!!!