• 締切済み

:HTMLを取得すると文字化けしてしまう・・・

ASP.NET C#.NETにて「URL」を入れ実行すると そのHPのHTMLを取得してブラウザ内テキストボックスに表示するPGM なのですが、2バイト文字部分が化けて仕舞います。 エンコードの問題だと思うのですが、ご存じの方御願いします。

みんなの回答

  • bikkuri
  • ベストアンサー率33% (23/68)
回答No.2

日本語部分の文字コードがsjisじゃないので化けていると思います。 日本語のWEPページは、通常sjis,euc,jisなどの文字コードが使われています。 これらはWEBサーバーのOSによる傾向がありますが、 文字コードはページの作成者が自由に決められますから、 あてにできません(というかOSはわからないと思う) HTML内に、文字コードを指定する記述があるのもありますが、 基本的に文字コードの自動判定と変換が必要でしょう。 文字コードの判定と変換をするモジュールやライブラリ を探しましょう WEBブラウザも自動判定していますが、たまに間違うので 完全に判定するのは難しいです。

全文を見る
すると、全ての回答が全文表示されます。
  • honnsuki
  • ベストアンサー率18% (62/329)
回答No.1

リナックス、UNIXはEUCにしないと、うまく行かないと聞いたことがありますが、あまり詳しくないので。

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • WebページHTMLをテキストファイルとして取得する方法

    今、WebページのHTMLで 例えば、ADDと言う文字があれば、削除するような 処理をしようと考えているのですが、 C/C++なら文字検索を行い、削除することはできるのですが、 WebブラウザからHTMLソースを取得したあとテキストベースで削除処理をすると考えています。 (1) C/C++でHTMLソースを取得するにはどうしたらいいのでしょうか? (2) HTMLソースをテキストファイルにして文字検索後削除という処理を考えていますが、もっと簡単な方法はありますか? よろしくお願い致します。

  • ASPでHTMLの内容を取得するには??

    HTMLのテキスト1のテキストボックスはOnClickイベントで文字列を取得し表示させてます。 テキスト2のテキストボックスに文字列を入れてその文字列をtest.aspで取得させてます。 test.aspでもテキスト1の内容を取得する方法はありますでしょうか?? formの入れ子はできないし、1つのform内でテキスト1、テキスト2を入れると OnClickイベントがきかなくなります。 わかる方おりましたらご教示ください>< 宜しくお願い致します。 ------ aa.html ---------------- <html> <head> <title>ASP TEST </title> </head> <body> <form name="fm1"> <td> <p>テキスト1:<input type="text" name="pathTXT" size="40"> <input type="button" name="fileBT" value="選択"> </p> </td> </form> <form action="test.asp" method="post"> <td> <p>テキスト2:<input type="text" name="keyTXT" size="40"> <input type="submit" value="実行"> </p> </td> </form> </body> </html> <SCRIPT LANGUAGE="vbscript"> Sub fileBT_OnClick() Document.fm1.pathTXT.value = "aaaaaaaa" End sub </SCRIPT> ------ test.asp ---------------- <%@LANGUAGE="VBSCRIPT"> <% Response.Write(Request.Form(keyTXT)) '''↓↓↓↓↓↓↓↓↓ aa.htmlのpathTXTを取得したい。。。 Response.Write(Request.Form(pathTXT)) >%

    • ベストアンサー
    • HTML
  • 文字化けしていたHTMLファイル

    Windows 8.1 秀丸 8.34 HTML 4.01のコードです。 ある日秀丸でHTMLファイルを開いてみたら、日本語の部分が文字化けしてしまっていました。 どの文字タイプを指定しても解消しません。 今思えば、以前ファイルを保存する時に変な保存の仕方をしたかもしれません。 (もしかしたら文字化けさせたまま保存させてしまったかも) HTMLファイルの時点で文字化けしているファイルを元に戻す方法は有りませんか? どのブラウザのエンコードも全く意味ないです。 いくつかのエディタでも駄目でした。 文字タイプに影響していそうなHTMLコードを引用しておきます。 ---------------------------------------------------------------------------------- <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/Transitional.dtd"> <html lang="ja"> <head> <meta http-equiv="Content-Type" Content="text/html;charset=Shift_JIS"> css側 charset "Shift_Jis"; -----------------------------------------------------------------------------------

  • 海外サーバ(ASP.NET利用)での文字化け

    海外のレンタルサーバ(英語)をレンタルしたのですが、ASP.NETを利用すると文字化けを起こしてしまって困っています。色々と試してみたのですが、どうしてもうまく行きません。ASPやHTMLでは文字化けしないのですがなぜかASP.NET(aspxファイル)を実行する時だけなのです。TRYした内容で、まともに表示された例を挙げます。 まず、aspxファイルに<%@ CodePage ="1252" %>を指定し、実行する。 次に表示された結果をブラウザ(IE)の「表示」→「エンコード」を「日本語(Shift JIS)」にすると、うまく表示されます。 ただ、これではクライアントにいちいちエンコードしてもらわないといけないので非現実的です。 コード内で、 Session.codepage = 932 等にも変換してみたのですが、うまくいきませんでした。 尚、<%@ CodePage ="***" %>の部分の殆どの日本語コードを試してみましたがこれも駄目でした。(↓試したコード) http://msdn2.microsoft.com/ja-jp/library/system.text.encoding.windowscodepage.aspx どなたか同じような症状を経験した方がいらっしゃれば、ご教授願えませんでしょうか? ちなみに、サーバは WIN2003 ASP2.0です。 よろしくお願いいたします。

  • メール送信後のHTMLが文字化けします

    FORMからsendmailを利用してメールを送信し、その結果を「送信できた」、「未入力項目がある」などを出力するHTMLとして出力するcgiを作ったのですがHTML出力が文字化けします。 メールのsubjectやbodyは文字化けせず正常に送信できます。HTMLにはMETAタグでeuc-jpやshift_jisと色々とトライしました。cgiもshift_jisとeuc-jp両方で試しましたがどちらも文字化けします。文字化けしているときにブラウザのエンコードで自動選択すると、ブラウザがcgiの使用コードに自動的に合わせてくれて正常に表示してくれますがこれがcgiを起動するたびで面倒です。エンコードを自動選択しないと文字化けしてそのときのブラウザが選択している文字コードは「西ヨーロッパ言語(ISO)です。 どうしたらブラウザに使用している文字コードを認識させるられるでしょうか?

    • ベストアンサー
    • CGI
  • 文字化け

    perl初心者です。 テキストボックスに入力した数値を計算して表示するCGIを作っています、(cgi-lib.plを使ってます。) 計算ボタンをクリックして表示される文字全てが文字化けしてしまうのですがブラウザソフトの表示→エンコード→日本語にするとキチンと表示されます、 これはブラウザソフトの設定がいけないのか、プログラムに何か手を加えると解決するのでしょうか? 宜しくお願い致します。

    • ベストアンサー
    • Perl
  • HTMLから自動的に文章取得

    HTMLデータの中から、狙った文章をPerlで抜き出すプログラムを書こうとしています。 (1)urlが並んでいるテキストファイルから、1番上を$urlに入れる (2)urlからHTMLを取得する (3)HTMLを解析、文字列の取得 (4)「author: title: 」のように、形を変えて、新たなテキストファイルに1行printする。 (5)すべてのurlに繰り返す と動くプログラムです。 LWP::Simpleのget関数を使うか、wgetを使うかも考えています。 ここでの質問は、(1)の、URLを上から順に引っ張ってくるプログラムの作り方を聞きたいです。 $i行目の改行までを取得、という考えでいいでしょうか? ベターな方法や、少しでも参考になる情報がありましたら教えていただけると嬉しいです。

    • ベストアンサー
    • Perl
  • HTMLのtextbox類に文字を残す

    HTMLでテキストエリアに書かれた文字を記入し、次ページ進み、ブラウザの戻る押下するとテキストエリアの文字が消えてしまいます。 この文字を残すにはどうすればよろしいでしょうか? よろしくお願いします。

    • ベストアンサー
    • HTML
  • 文字化けを直すには?

    文字化け http://www.ocn.ne.jp/c-navi/index4.htmlのHPで文字化けが起こります。エンコードを替えてもうまくいきません。Windows7です。教えて下さい。

  • HTMLの文字化け

    自分で立ち上げたサーバへWindoswで作成したHTMLをアップしてブラウザから表示の確認をしてみたところ、日本語が文字化けてしまいました。 ヘッダーには <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> として、文字コードをUTF-8にしてあるのですが、この部分を <meta http-equiv="Content-Type" content="text/html; charset=Shift-JIS" /> とShift-JISにしてみると、日本語の文字化けが解消します。 できればcharset=UTF-8の状態で文字化けせずに表示してくれるようにしたいのですが・・・ どなたか原因がお分かりになる方いらっしゃいましたら、ご教授のほどお願い致します。 テキストエディタはK2Editorを使用しており、「保存時の文字コードと改行種類の変更」でHTMLファイル自体の文字コードは「Shift-JIS」、改行コードは「CRLF」としております。 サーバは、CentOS5.4を使用しており、 コマンドで # printenv | grep LANG の結果は、 LANG=ja_JP.UTF-8 となっております。

    • ベストアンサー
    • HTML