• ベストアンサー

「"」、「&」が文字化けしてしまいます

「"」が&quot、「&」が&ampに文字化けしてしまいます。 ネットの小説をテキストファイル(UTF-8)に変換してダウンロードしたのですが、ファイルを開くと上記のような状態になってしまいました。 HTMLのことや文字コードのこと、メタ文字やエスケープのことも調べたのですが、いまひとつ理解できません。他の部分は普通に読めるので、「"」、「&」だけを変換したいのですが、そういうことができるソフトや方法はないでしょうか。 アドバイスよろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
回答No.1

これを文字化けと言っていいものかどうかの問題はありますが、 UTF-8とアスキーコード(ASCIIコード)の関係を調べると 何故そのようなことになったのかが分かると思います。 ここで説明を始めるととんでもない文字数になってしまいそうなので、 時間のある時にご自分で調べてみてください。 ところで、ダウンロードしたファイルがテキストファイルなのですから、 そのファイルはワードパッドのようなソフトで開くことができますよね。 であれば、そのソフトの置換機能を使って置き換えてしまえばよいの ではないでしょうか。 ワードパッドを例にとりますと、 メニューの〔編集〕→〔置換〕で、検索する文字列に「&quot」を、 置換後の文字列に「&」を入れて〔すべて置換〕にします。 もう1つのほうも同様に処理すれば簡単に修正できるでしょう。 これはワープロソフトでの基本的な編集方法です。 以上、ご参考になれば幸いです。

その他の回答 (1)

  • bardfish
  • ベストアンサー率28% (5029/17765)
回答No.2

ダウンロードしたテキストはエンコード前のソース。UTF-8とかS-JISとかの文字コードとは基本的に無関係です。 HTMLでは使えない文字が幾つかあり、そのひとつが「~」や「&」です。 構文や文法などの解釈の都合ですから&ampという代替え単語をHTMLの予約語として使用しています。 で、&quotを~に、&ampを&に変換するにはテキストエディタの置き換え機能を使います。 Windowsなら最初から入っているメモ帳でもできますよ。 メモ帳じゃなくてもワープロソフトでも可能です。

関連するQ&A

  • HTMLの文字化け

    自分で立ち上げたサーバへWindoswで作成したHTMLをアップしてブラウザから表示の確認をしてみたところ、日本語が文字化けてしまいました。 ヘッダーには <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> として、文字コードをUTF-8にしてあるのですが、この部分を <meta http-equiv="Content-Type" content="text/html; charset=Shift-JIS" /> とShift-JISにしてみると、日本語の文字化けが解消します。 できればcharset=UTF-8の状態で文字化けせずに表示してくれるようにしたいのですが・・・ どなたか原因がお分かりになる方いらっしゃいましたら、ご教授のほどお願い致します。 テキストエディタはK2Editorを使用しており、「保存時の文字コードと改行種類の変更」でHTMLファイル自体の文字コードは「Shift-JIS」、改行コードは「CRLF」としております。 サーバは、CentOS5.4を使用しており、 コマンドで # printenv | grep LANG の結果は、 LANG=ja_JP.UTF-8 となっております。

    • ベストアンサー
    • HTML
  • PHPをhtmlに読み込んだファイルが文字化けする

    お世話になります。 通常のHTMLファイルにWordPressを生成し、WPでブログを書いたファイル(/wp/index.php)を読み込んで、表示させたいと考えております。その件に関してはなんとか表示できるようになったのですが、私が作ったhtmlファイル(/wp/index.html)はShift-JISで、 WordPressが吐き出してるブログ(/wp/index.php)はUTF-8で文字コードが違うので、ブログ部分のみ文字化けが起こります。それで上記のように/wp/index.htmlのcharsetをShift-JISからUTF-8へ変更しました。 <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> ところが「テキストコーディングエラー」とポップアップが起こりました。「設定したテキストエンコーディングで保存済みですが、テキスト中のcharset設定と一致していないので、ブラウザ等で表示すると文字化けする可能性があります」とのことです。その結果、今度はブログ部分がちゃんと表示され、HTMLで作成した部分は文字化けするようになりました。これはPHPの問題ではないかもしれませんが、原因がどうにも分かりません。もしかしたら初歩的な質問をしているかもしれませんが、よければ教えていただけないでしょうか。

    • ベストアンサー
    • PHP
  • 文字化けについて質問です。

    文字化けについて質問です。 例えば、 text.txt(あいうえお) とテキストファイルにあります。 そのファイルを読み込んで、 echo "$a"; で表示すると、文字化けします。 ファイルの中身がaaaaaaのように英数字なら普通に表示されるのですが・・・ <meta http-equiv="Content-Type" content="text/html; charset=shift-jis" /> と今は定義しています。 utf-8にしても文字化けしてしまいます。 解決策はあるでしょうか?

    • ベストアンサー
    • HTML
  • Latexの文字化けについて教えてください!

    windowsでlatexを使って日本語の含まれたtexファイルを作ったのですが、仮想環境のubuntu10.04でtexファイルを開くと文字化けが起こったので、 iconv -f EUC -t UTF-8 ファイル名.tex > 新しいファイル名.tex platex 新しいファイル名.tex で文字コードをEUCからUTF-8に変換することで、texファイルの文字化けは無くなったのですがxdviを使ってdviファイルを開くと文字化けしています。このような場合はどうすれば解消できますか?わかる方詳しく教えてください! EUSとUTF-8の変換前と変換後の文字コードは、 nkf -g ファイル名 で確認しました。 出来れば、他のubuntuの環境でも文字化けしないようにしたいので、環境設定を変えない方法があれば教えてください!

  • テキストが文字化けしてしまいます

    はじめて質問させていただきます。 LinuxのOpen office word processor でテキストファイルを作成し、保存したものを、再度開こうとしたところ、文字化けしてしまってよむことができません。自動的にUTFー8の文字コードで保存されていたようなので、同じコードで立ち上げようとしましたがうまく行かず、他のコードにも変換してためしましたが、どれでもうまくいきません。かなりの分量の文章を作成したので、何とか救済したいのですが、皆様お力を貸していただけないでしょうか。

  • 文字化けに関して

    文字化けが起きてしまって困っています。 PHPとMysqlを使用した、CMSを今あるサーバから別のサーバに移したいのですが、 新しいサーバに移すと文字化けをしてしまいます。 正確にはデータベースから読み込んでいる部分だけが文字化けしています。 index.phpにHTMLコードとして記述してある部分は文字化けしていません。 ブラウザ(IE)の「表示→エンコード」からUTF8を選ぶと逆に データベースの部分が正確に表示され、HTMLに直接書き込んだ部分が文字化けします。 現状でわかる範囲で書きます。 ・index.phpのmetaは <meta http-equiv="Content-Type" content="text/html; charset=Shift_JIS" /> ・MYSQL(phpmyadminに書かれている)文字セットは UTF-8 Unicode (utf8) ・php.iniの設定 mbstring.language・・・japanese mbstring.internal_encoding・・・UTF-8 mbstring.encoding_translation・・・on mbstring.http_input・・・未設定 mbstring.http_output・・・未設定 default_charset・・・未設定 output_handler・・・未設定 output_buffering・・・未設定 magic_quotes_gpc・・・Off 詳しい方よろしくお願いします。

    • ベストアンサー
    • PHP
  • XMLの&amp;が&に変換されない

    FlashにXMLを読み込むとエスケープの「&amp;」が「&」に変換されず 「&amp;」のままになってしまいます。 「&」だけにしても「&amp;」に変換されてしまいます。 getURL内およびテキストフィールドで使おうとしています。 「&」を表示するにはどうしたらよいのでしょうか? MacOS 10.4、Flash8、XMLは文字コードUTF-8 / LFです。 よろしくお願いいたします。

    • ベストアンサー
    • Flash
  • 文字化けを修正する方法

    dreamweaverMXでホームページを作っています。 最近、文字コードをcharset=Shift_JISからcharset=UTF-8に変更したら文字化けが起きてしまい、修正する方法がわからず困っています。 具体的には、テンプレートファイルで文字コードをcharset=Shift_JISからcharset=UTF-8に変更し、更新をかけました。 テンプレートファイルは文字化けしていませんが、更新した他のhtmlファイルはすべて文字化けしてしまっています。 CSSファイルにもちゃんと@charset "utf-8";と記入してあります。原因がわかりません。 どうすればよいのでしょうか?

    • ベストアンサー
    • HTML
  • MySQL4.0 UTF-8 での文字化け

    こんにちは MySQL4.0 & PHP4.3 でHTMLは文字コードUTF-8で記述しています。 MySQL4.0の文字コード設定はレンタルサーバーのため不明ですが、 phpMyAdminで、utf-8にてデータを入力しました。 select文でMySQLのデータを拾ってくると文字化けはおきないのですが PHP経由でPOSTされた値を使ってinsertやupdateをかけると文字化けしてしまいます。phpMyAdmin上でも文字化けしていますが、phpMyAdminをEUC-JPにすると、入力した文字が文字化けせずに表示されます。 (が、すでに入っているデータは文字化けします、、、、) 入力画面は metaでUTF-8宣言をしており、ブラウザ(IE)上でエンコードを確認するとUnicode(UTF-8)になっています。4.1みたいにset names を指定するとうまくいくかな?と思ったのですが、やっぱり4.0なので結果は変わらず、でした。PHPのスクリプトそのものは、UTF-8で記述しているのですが、、、、 どういった項目をみなおせばいいのでしょうか?

    • ベストアンサー
    • MySQL
  • テキストエディターの文字化け

    素人の者です。 これまで、PHPのプログラムの書き込みをSJISで行ってきましたが、どうもネット上を調べているうちにSJISはあまり使わないほうが良いようなことが書いてあったので、UTF-8で書くことにしようと思いました。そして、UTF-8で書いていてWEB上は特に問題なく文字化けもせず表示されるのですが、テキストエディターで再度ファイルを開くと、テキストエディター内で文字化けしていることがあります。メモ帳で開くときはファイルの文字コートをUTF-8に指定すれば文字化けしません。サクラエディターで開けば、何もしなくても文字化けしません。php_editor_stdで開けば、文字化けします。ez-HTMLで開けば、文字化けします。???とこんな具合です。テキストエディターを開くときにエンコードを指定して開けば、文字化けはしないであろうと考えて、設定の部分を色々と探していじってみても、文字化けの現象は変わりません。SJISですと、ダメ文字とかあるのでやはり切り替えていったほうが良いと思い試している最中です。テキストエディターで文字化けした場合、どのようにすれば解消するのかお分かりになる方がおりました教えていただけないでしょうか。よろしくお願いいたします。

    • ベストアンサー
    • PHP

専門家に質問してみよう