テキストエディターに表示ができない特殊な文字

このQ&Aのポイント
  • HTMLの文字列をテキストエディターに貼り付けると、特殊な文字が表示できないことがあります。
  • 特殊な文字の正体やその表示方法についての具体的な情報が見つからないため、質問させていただきます。
  • インターネットブラウザーやMicrosoft Wordでは表示できるのに、テキストエディターで表示できない理由が知りたいです。
回答を見る
  • ベストアンサー

html の文字列をテキスト エディターに張り付け

goo辞書には発音記号が表示されています。 connect の発音記号は「kənékt」 apple の発音記号は「ǽpl」 http://dictionary.goo.ne.jp/leaf/ej3/3823/m0u/apple/ これは、インターネット ブラウザー(=html ブラウザー)では、せいじょうに表示されています。また、Microsoft Word に張り付けても表示できます。 しかし、テキスト エディターに張り付けると、以下のように「?」表示になります。 connect の発音記号は「k?n?kt」 apple の発音記号は「?pl」 これは なぜでしょうか。「特殊な文字を使用しているのだろう」くらいは推測できますが、具体的には何という名前の特殊文字なのでしょうか。これをテキスト エディターに表示させる方法は存在しないのでしょうか。言い換えれば、なぜ html ブラウザーや MS Word では表示できているのでしょうか。インターネットで「特殊文字 ブラウザー テキスト エディター」などで検索しても発見できませんでした。そのため質問させていただきます。よろしくお願いいたします。 具体例: インターネット ブラウザー:Firefox、Internet Explorer、Opera、Google Chrome テキスト エディター:秀丸エディタ、メモ帳(notepad.exe)、VxEditor

質問者が選んだベストアンサー

  • ベストアンサー
  • Safe_Mode
  • ベストアンサー率48% (1329/2725)
回答No.9

ANo.1です。 >TeraPad >オプション > 文字コード >初期文字コード: UTF-8 >保存文字コード: UTF-8 >というか、だったら、これらの設定は >いったい何なのでしょうか。 その場合の初期文字コードというのはTeraPadで文書作成する際に初期文字コードをUTF-8にしておくということのはずですし、保存についてもTeraPadで保存する際にデフォルトでUTF-8にするという設定項目ですよね。 今回のような質問の場合、どこかの誰かがどんな文字コードで作成したか判らない文書をどの文字コードで「解釈」するか?という設定を見る必要があるわけで・・・ TeraPadの場合、オプション設定で「文字コード/改行コードを自動認識する」という設定があるようです。このあたりを確認してみてはどうですか? 因みに… ブラウザはそのWebページがどんなHTML(またはXMLとか)のバージョンと文字コードで作成されているかをヘッダー情報から判断しそれによってソースを解釈して表示させますので、今回の質問で提示されたページならHTML4.01 Transitional で文字コードがUTF-8(charset=utf-8)となっていることを判断し、解釈できるブラウザなら(大抵はそうですが)当然文字化けはしません。 ただテキストエディター側ではブラウザが表示させた結果の文字がどの文字コードで書かれたものかを自動的に判断出来なければ結果として文字化けするということでしょう。 なお、今回のような質問の回答に対するヒントを検索するなら「発音記号 テキストエディター」いったキーワードのほうがヒットしやすいかと思いますよ。

uuuuu8u8888uuu
質問者

お礼

有力な情報が得られないので、これで終了します。回答してくださった皆さん、ありがとうございます。

uuuuu8u8888uuu
質問者

補足

かいとうをありがとうございます。 >TeraPadの場合、オプション設定で「文字コード/改行コードを自動認識する」という設定があるようです。このあたりを確認してみてはどうですか? はい、その設定も実行しました。その設定が有効の場合、無効の場合、両方とも試しました。また、考えられる限りの類似設定の全部は実行しました。それでも不可能でした。 >ただテキストエディター側ではブラウザが表示させた結果の文字がどの文字コードで書かれたものかを自動的に判断出来なければ結果として文字化けするということでしょう。 それは、確かに、ヘッダー情報がない限り、そのとおりだと おもいます。言い換えれば、こうなります。 「全部のテキスト エディターは、ヘッダー情報のない全部のコピペは、文字化けする。」 これは現実矛盾です。実際に、メモ帳はコピペだけで文字コードを判別できてしまいます。一方、「本当にコピペした文字情報だけで判断できる」のであれば、ヘッダー情報が完全な冗長情報に なってしまいます。ゆえに、ヘッダーの文字コード情報は世界中から消滅していなければ不自然です。 ということは、これらの矛盾全部を合理的に説明できる手段は1つだけです。「コピペしているときに、ユーザーが気づかないだけで、文字コード情報も Windows OS が こっそりコピペしている」ということでしょう。そう考えなければ不自然です。そして、TeraPad や VxEditor は、それを読み取る能力がない、にもかかわらず、設定には読み取れるかのような状態を維持している。つまり不具合である、と想定されます。この解釈いがいだと、絶対に現実矛盾が発生します。私の認識に間違いがあれば、指摘してください。

その他の回答 (10)

  • Safe_Mode
  • ベストアンサー率48% (1329/2725)
回答No.11

>「コピペしているときに、ユーザーが気づかないだけで、 >文字コード情報も Windows OS が こっそりコピペしている」 >ということでしょう。 そうですね。OS側では文字コード情報もコピーしているはずです。 >TeraPad や VxEditor は、それを読み取る能力がない、 >にもかかわらず、設定には読み取れるかのような状態を >維持している。つまり不具合である、と想定されます。 提示されたURLのHTMLソースを見れば判りますが、「ǽ」については「ǽ」となっています。 ご存じだと思いますが、Webページ上で発音記号のような特殊文字を表示させるにはその特殊文字に対応したコード表に従って表記するので「ǽ」を表示させるならHTMLのソース上では「ǽ」と表記するわけですよね。 TeraPadをインストールして提示されたURLのHTMLソースを読み込んでみましたがちゃんと「ǽ」として表示されてましたので、文字コード情報を読み込んで表示させていることになるといえるでしょう。 TeraPadや秀丸エディター等はphpやHTMLの編集・作成に用いられる訳で、その際には特殊文字をそのまま表示してしまうと却って不具合なこととなるのを考えているのかもしれません。 このあたりは作者に直接問い合わせてみるのもありかと思います。

  • ORUKA1951
  • ベストアンサー率45% (5062/11036)
回答No.10

No.6,7,8です。 OS(Windows)自体は、文字コードを読取ると、それをテキストエディタに貼り付けるときにそれを利用します。 ※ただ、テキストエディタでフォントの指定をそのキャラクターを持っていないフォントセットにしていると文字を表示することが出来ません。 ⓵(晴)✄➀〠¼ これらの文字を、テキストエディタのフォントを拡張していないMSP明朝では表示できない・・  いまどき、内部処理にUTF-8を使っていないアプリケーションは少ないと思います。

  • ORUKA1951
  • ベストアンサー率45% (5062/11036)
回答No.8

>というか、だったら、これらの設定は いったい何なのでしょうか。  なんなんでしょうね、--製作者に聞いてみないとわからない。  どのブラウザでも同じ結果になると言うことは、すくなくともシステム上はちゃんとUNICODEで受け渡しされている。  それをアプリケーションが受け取る時に、旨くいってない。

  • ORUKA1951
  • ベストアンサー率45% (5062/11036)
回答No.7

他のテキストエディタはわかりませんが・・ ひょっとして新規作成時の初期設定の文字コードがShift_JISになっているのでは?? EmEditorの場合、システムに指定しておけば、unicodeがデフォルトになる。 XP以降のWindowsはUNICODEですから・・

uuuuu8u8888uuu
質問者

補足

かいとうをありがとうございます。 以下の設定に変更後、エディターを再起動して試しましたが、不具合は変化しませんでした。 VxEditor 共通の設定 > 文字コード > 初期文字コード: UTF-8 TeraPad オプション > 文字コード 初期文字コード: UTF-8 保存文字コード: UTF-8 というか、だったら、これらの設定は いったい何なのでしょうか。

  • ORUKA1951
  • ベストアンサー率45% (5062/11036)
回答No.6

テキストエディタの問題だと思いますが??? 普通にテキストエディタ(EmEditor -- http://jp.emeditor.com/ )に、何の特段の処理しなくても添付図のようにコピーペーストできます。タスクバーのアイコンを左クリックすと貼り付けて起動する。ついで他のテキストもコピーペースト。いずれでも  ためしに、その文字を選択して、表示メニューから「文字コード表示」でU+01FD も表示されます。  保存時の文字コードをShift_JISなどに指定すると、「この文字コードでは保存できない文字がある」と指摘されますが・・

uuuuu8u8888uuu
質問者

補足

かいとうをありがとうございます。 やはり不具合はテキスト エディターに依存するのですね。知りたいのは、おもに以下のことです。 ・なぜテキスト エディターにより不具合が発生する場合があるのか? 必要最小限の機能しかない「メモ帳」でさえ、せいじょうに貼り付けられるのに、なぜ一部のテキスト エディターは不具合を発生させるのか? メモ帳以下の性能ということか? ・数多く存在するテキスト エディターのうち、どのくらいの割合で、この不具合は発生するのか? 有名なテキスト エディターでさえ、この不具合を発生させているということは、ほとんどで不具合は発生する?

  • Kaneyan-R
  • ベストアンサー率42% (1241/2889)
回答No.5

>文字コードとは無関係に見えます。 >メモ帳に張り付けたところ、確かに文字化け しませんでした。 >しかし、VxEditor、TeraPad だと文字化け しました。 >設定で「UTF-8」「EUC」などに変更しても、やはり文字化け しました。 貼り付けた後に変更しても意味がありません。 貼り付けた時点でsjisになっています。 Windows 7の標準入出力表示は、厳密には「Windows code page 932(cp932)」です。 ただ、Shift-JISと同じなので普通はShift-JISと言ってますが。

uuuuu8u8888uuu
質問者

補足

かいとうをありがとうございます。 貼り付けた後に変更した場合、貼り付ける前に変更する場合、両方とも試しました。そのほか、いろいろと試しましたが全滅です。

  • torayoshi
  • ベストアンサー率62% (910/1449)
回答No.4

「VxEditor」を例に。 VxEditorのヘルプに、 「VxEditorは内部ではShiftJISで文字列を扱っているため、ShiftJISにない文字は扱えません。」 とあります。 このへんが関係してるのでは? エディターソフトに依存するってことでしょう。

回答No.3

発音記号の正式名称は 国際音声記号(IPA=International Phonetic Alphabet)です。 今試してみたけれどFirefox→Terapadでも文字化けしやした。 ただwin7の標準メモ帳は読み込めましたね。 unicodeとshiftjisしか読めないのにメモ帳はおkでテキストエディタはNG という事になると 収録されている文字列に存在しない記号は「?」と表記されているのではないでしょうか? あくまで憶測ですけれど。

uuuuu8u8888uuu
質問者

補足

回答をありがとうございます。 文字コードとは無関係に見えます。私の環境は Windows 7 です。メモ帳に張り付けたところ、確かに文字化け しませんでした。しかし、VxEditor、TeraPad だと文字化け しました。設定で「UTF-8」「EUC」などに変更しても、やはり文字化け しました。仮に文字コードが関係しているのであれば、ウェブ サイトと同じ UTF-8 に設定したじてんで正しく表示されるはずです。そうでないということは、文字コード以外の何らかの理由に依存していると想定されます。

回答No.2

回答からは、外れますが、 今、Windows7のメモ帳にコピペしたところ 正しく表示できたので、 おそらくUTF-8ではないかと、推測しています。 お持ちの、テキスト エディター をUTF-8モードにしてから、貼り付けてみても ダメですか?

uuuuu8u8888uuu
質問者

補足

回答をありがとうございます。 文字コードとは無関係に見えます。私の環境は Windows 7 です。メモ帳に張り付けたところ、確かに文字化け しませんでした。しかし、VxEditor、TeraPad だと文字化け しました。設定で「UTF-8」「EUC」などに変更しても、やはり文字化け しました。仮に文字コードが関係しているのであれば、ウェブ サイトと同じ UTF-8 に設定したじてんで正しく表示されるはずです。そうでないということは、文字コード以外の何らかの理由に依存していると想定されます。

  • Safe_Mode
  • ベストアンサー率48% (1329/2725)
回答No.1

少なくともWindows8上のメモ帳では普通にコピー出来ますけど。 UTF-8が扱えるテキストエディターならOKだと思いますが。

uuuuu8u8888uuu
質問者

補足

回答をありがとうございます。 文字コードとは無関係に見えます。私の環境は Windows 7 です。メモ帳に張り付けたところ、確かに文字化け しませんでした。しかし、VxEditor、TeraPad だと文字化け しました。設定で「UTF-8」「EUC」などに変更しても、やはり文字化け しました。仮に文字コードが関係しているのであれば、ウェブ サイトと同じ UTF-8 に設定したじてんで正しく表示されるはずです。そうでないということは、文字コード以外の何らかの理由に依存していると想定されます。

関連するQ&A

  • Unicode?対応テキストエディタ

    いま、WinMeでテキストエディタを作っているのですが、 あの、Wordとかは、Unicodeにしかないと思われる記号が入力できますよね??逆向きの?とかですが。 ああいうのを、普通のエディタに入れると、 ?になってしまうのですが、どうしたらそういった記号なども正しく表示できるのでしょうか。

  • テキストエディタの使い方がわかりません。

    テキストエディタというものを使ってみたいとおもってます。 ところが、xzzyやk2editorをダウンロードしてびっくり。 禁則文字やら、ワードラップやら、整形やらキャレットやら、あまりの難しさに驚いています。 テキストエディタ初心者のために、やさしくいろんな用語や使い方を解説しているサイトとかないでしょうか?(ヘルプみてもわからないんです)。

  • テキストエディタを紹介してください

    長くテラパッドを愛用しております。 機能的には不満はないのですが、文字の色を変える機能(html編集時でなく)や、文字を太字表示できるようなテキストエディタはないのでしょうか? それはワードパットのようなものになるのでしょうか? よいエディタをご存知の方教えていただけたら助かります。

  • テキストエディタの文字サイズ変更

    テキストエディタの文字サイズ変更 テキストエディタでワープロソフトみたいに特定の文字だけ 文字サイズを変更したり色を変えたりしたいのですが (例えば見出しだけ文字サイズを変えるなど) それが出来るエディタはありますか。(ワードパット以外で) フリー、シェアウェアどちらでもいいです。

  • テキストエディターでカラー文字を(  )に変換

    文章中にカラーで表記した文字だけを(  )に変換する機能を持つテキストエディターをご存じでしたら教えていただきたくお願いします。MS Word にそのような機能があることは知っていますが、フリーのテキストエディターで同じことができるものを探しています。

  • テキストエディターの文字化け

    素人の者です。 これまで、PHPのプログラムの書き込みをSJISで行ってきましたが、どうもネット上を調べているうちにSJISはあまり使わないほうが良いようなことが書いてあったので、UTF-8で書くことにしようと思いました。そして、UTF-8で書いていてWEB上は特に問題なく文字化けもせず表示されるのですが、テキストエディターで再度ファイルを開くと、テキストエディター内で文字化けしていることがあります。メモ帳で開くときはファイルの文字コートをUTF-8に指定すれば文字化けしません。サクラエディターで開けば、何もしなくても文字化けしません。php_editor_stdで開けば、文字化けします。ez-HTMLで開けば、文字化けします。???とこんな具合です。テキストエディターを開くときにエンコードを指定して開けば、文字化けはしないであろうと考えて、設定の部分を色々と探していじってみても、文字化けの現象は変わりません。SJISですと、ダメ文字とかあるのでやはり切り替えていったほうが良いと思い試している最中です。テキストエディターで文字化けした場合、どのようにすれば解消するのかお分かりになる方がおりました教えていただけないでしょうか。よろしくお願いいたします。

    • ベストアンサー
    • PHP
  • テキストエディターの利点とは何ですか。

    よくフリーのテキストエディターの紹介で「一太郎やWORDは重いので普段はテキストエディターを使っています。」という表現があるのですが、どうも、この「重い」というのが実感としてわかりません。私なんか、WMPで、音楽を聴きながら、エクセルと一太郎を開いて、さらにインターネットで資料を調べながらということをよくしております。4つのプログラムを開いているのに、一太郎はサクサクと軽く動くんですけど。 質問1 そんなに一太郎、WORDは重いですか。 質問2 テキストエディターの利点はいったい何なのですか。

  • chromeでのテキストエディタ

    ブラウザでchromeを使っています。ページのソースを表示でソースは出てくるのですが編集できません。テキストエディタで編集したいのですが、テキストエディタを指定する方法はあるのでしょうか。

  • テキストエディタとHTML

     こんにちは。テキストエディタのTeraPadを使っています。これでHTMLを編集するとき、pタグを使うときなのですが、ソースを見やすくするために文章の行頭を揃えるためにTABを挿入しているのですが、そうすると、ブラウザで表示したとき、TABを挟んだ文字間に半角スペースのようなスペースが入っているように表示されてしまいます。  このスペースが入っているように表示されるのを、表示されないように、つまり、文字間を詰めて表示するためにはどうしたらよいでしょうか。  よろしくお願い致します。

  • エディタで文字化け

    PHPのプログラムを組んで、EUCで保存し ブラウザで確認すると正常に動いています。 しかし、そのPHPを再度エディタで開くと 日本語で書いたところが文字化けしています。 秀丸とnotepad両方とも×でした。 どなたか解決法を教えていただけませんでしょうか?

    • ベストアンサー
    • PHP