• ベストアンサー

テキストエディタの標準の文字コードについて

 EUC_JP で 例えば「あ」の一文字を保存したファイルを Windows 上で 秀丸などのテキストエディタで、 標準の文字コードを 自動選択にした場合に文字化け して画面に表示されますが、 標準の文字コードを EUC に設定して、開きなおすと 正しく表示されます。  ファイルを開くとき、エディタとOSは、どのような 処理をしているのでしょうか? 何かの パラメタ 付き API を発行して EUC での文字 コードに適したフォント、グリフが選択されて、画面 に表示されているのでしょうか? ( 実際の API 名があるのなら教えてください。 )

質問者が選んだベストアンサー

  • ベストアンサー
  • Gotthold
  • ベストアンサー率47% (396/832)
回答No.4

> アプリケーションの標準の文字コードの設定 によって > 表示を変えることが可能となる > (グリフ、フォントの選択等の)仕組みを教えて頂きたいのです。 開くときにUnicodeに変換して内部的には全部Unicodeで扱ってます。

kawamao
質問者

補足

回答ありがとうございます。 > 開くときにUnicodeに変換して内部的には全部Unicodeで扱ってます。 ということは、画面に表示されている文字データを テキストエディタは、 Unicode としてメモリ上に保持しておいて、 ファイルを閉じるときに、標準の文字コードにコード変換して HDD などの外部記憶装置に保存しているという認識でよろしいので しょうか? 試しに、下の上付き 2 など Shift_JIS に存在しない文字も 3²+4² = 5² エディタの画面上では貼り付けて表示することができて、 保存するときに「 Unicode テキストが含まれていたので...」 のメッセージが出ました。、

その他の回答 (4)

  • trytobe
  • ベストアンサー率36% (3457/9591)
回答No.5

Internet Explorer で、エンコードの選択の中に「日本語(自動選択)」があるように、表示しようとしてみたときに、 ブラウザなどのソフトが意図していた文字コードで全部が表示しきれないときに、「もしかしたら、EUC で来てたデータではなく、Shift-JIS で来てるのかも」と検知して、より多くの文字が表示でき、半角文字・全角文字が混ざった行でも、文末の改行コードなどにたどり着くときに1バイトずれていたりしない(文末に唐突に「半角カタカナ」がないと改行できないような、おかしな文末になっていない、など)になるほうを、自動選択しているのです。 そういう自動選択ができないソフトがあれば、そのソフトが要求する文字コード(Unicode に対応する前の、EUC か Shift-JIS に決め打ちしていた、Unix系 なり DOS系なりの環境依存システム)に合わせた出力をして、その時代遅れのソフトに合わせてあげるしか手はありません。

回答No.3

文字データがサーバーを経由するならEUC。 PCだけならS-JIS。 1バイト規格と2バイト規格の違いが影響します。 基本的に日本語は26文字しかないアメリカの規格には収まらず、2バイトを利用して、かな・カナ・漢字を表現します。 通信を中継する場合、EUCを利用し、末端でS-JISに変換するのがお決まりです。

  • t_ohta
  • ベストアンサー率38% (5071/13250)
回答No.2

OSは特別な事はせず、アプリケーションに対してバイナリーデータとしてファイルの内容を渡すだけです。 賢いテキストエディタはファイルの内容をみて、各文字のバイナリーデータからどの文字コードが適切か推測します。 各文字コードで使われるコード番号は、番号の範囲が異なるのでバイナリーデータから推測する事が可能ですが、ダブっている範囲もあるため文字数が少ないと正しく判断出来ない場合があります。 どの文字コードが使われているか判断が付かない場合は、そのアプリケーションの設定で標準とされている文字コードでデータを描画する事に成ります。

kawamao
質問者

補足

回答ありがとうございます。 すみません。質問のポイントがずれていました。 >そのアプリケーションの設定で標準とされている文字コードでデータを描画する 例えば、 Shift_JIS で コード 0xE1A1 の 「癸」で保存したファイルを 標準の文字コードを EUC に設定して、開きなおすと EUC_JP の同じコード 0xE1A1 の 「瓠」で表示されます。 この同じバイナリで、 アプリケーションの標準の文字コードの設定 によって 表示を変えることが可能となる (グリフ、フォントの選択等の)仕組みを教えて頂きたいのです。

noname#242220
noname#242220
回答No.1

日本語Windowsの場合テキストエディタ以外は殆どS-JISを使用しています。 EUCは『2バイトコード』ですが『SIFTコード』が含まれる2バイトコードは S-JISコードと判断しているでしょうね。 おそらくAPIは共通ですね。 *日本語Windows以外は大概EUC文字コード対応です。 国際英語版はXPの頃からEUC文字コードに対応してます。

関連するQ&A

  • サブとしてのテキストエディタについて

    私は普段使いのテキストエディタとして秀丸エディタを使っているのですが、 秀丸の設定中にその画面を参考にメモなどを取りたいことがあります。 しかしながら設定画面を開いている状態では秀丸エディタを使うことができません。 そんなとき、サブのテキストエディタを使うことになるのですが、 何か良いものがないかなと思いまして。 システムのメモ帳などでも良いのですが、あまりにさっぱりしすぎているというか 最低限、エディタの背景色を変更したり、フォントの選択と文字サイズの変更 できれば、行間なども指定できるものがよいです。 あとは、シンプルで軽いものであるとなお良いです。 あなたがお使いのエディタですとか、何かそのような用途におすすめの テキストエディタがあれば色々教えてください。

  • テキストエディタでの韓国語表示について

    EmEditorでテキストファイル編集するときに、入力中はハングルで表示されるのですが、一度、保存(EUCで)した後に再度開くと、ハングルの部分が文字コードとして表示されてしまいます。 例) "もしもし"をハングル文字で    ヨボセヨ(←実際にはハングルで画面上表示されている)   と入力する。一度、保存(EUC)して、再度ファイルを開くと    "여보세요"   となってしまい、ハングル表示されません。   入力したハングルを表示して確認したいのですが、良い方法をご存知の方、教えてください。 他のエディター(秀丸やKajeroなど)でやってみようとしましたが、分かりませんでした。 よろしくお願いします。

  • 秀丸エディタ

    NotePadで開いていたテキストファイルを秀丸で開くようにしたのですが、日本語が文字化けしてしまっています。文字コードをUTF-8に統一して秀丸エディタで見れるようにしたいのですが、文字コードを変換することは可能でしょうか?

  • 文字コード

    かっこいいHPを見かけると中身がどうなっているのか見たくなります。 しかしコードの表示でコードを表示しても文字化けして読めません。 またそのコードを保存して秀丸エディタでコードを選択して保存してもうまくいきません。なにか解決策はありますか?

    • ベストアンサー
    • HTML
  • 文字化け(違う文字コードで保存すると不可逆?)

    テキスト・エディタでSJISのテキスト・ファイルをEUCとして開き(この時点で文字化けしてたのですが、それに気付かず)、誤ってそのまま保存してしまいました。 しかも大量のファイルを・・・。 日本語が文字化けしてしまったのですが、これを修復することはできるでしょうか? 一応、EUCのファイルをもう一度SJISで保存し直してみたり、エンコードを読み変えるソフトなどを試してみたのですが、結果はダメでした。 具体的には、以下の手順でやってしまいました。 1.秀丸でSJISファイル(PHPスクリプト)を開く 2.拡張子関連付け(PHPファイル=EUC)によって、開いた時はEUCモード(この時点で文字化け) 3.そのまま(EUCファイルとして)上書き保存 どなたか、修復の方法が分かる方、教えてください・・・・

  • EUCの文字化けについて質問です。

    EUCの文字化けについて質問です。 エディタは秀丸を使っています。 ・名前をつけて保存→文字コードをEUC ・その他→ファイルタイプ別の設定→保存読み込み→文字コードをEUC 上の二つを試しましたが、日本語を記入してあったところ(コメントにしてありました)が 漢字だらけになって表示されてしまいます。 半角英数の部分はきちんと表示されています。 プログラム上は支障はないとは思うのですが、 コメントが読めなくて困っています。 どうか良い解決法をお教え下さい! マシンはウィンドウズです。

  • エディタで文字化け

    PHPのプログラムを組んで、EUCで保存し ブラウザで確認すると正常に動いています。 しかし、そのPHPを再度エディタで開くと 日本語で書いたところが文字化けしています。 秀丸とnotepad両方とも×でした。 どなたか解決法を教えていただけませんでしょうか?

    • ベストアンサー
    • PHP
  • テキストエディターの文字化け

    素人の者です。 これまで、PHPのプログラムの書き込みをSJISで行ってきましたが、どうもネット上を調べているうちにSJISはあまり使わないほうが良いようなことが書いてあったので、UTF-8で書くことにしようと思いました。そして、UTF-8で書いていてWEB上は特に問題なく文字化けもせず表示されるのですが、テキストエディターで再度ファイルを開くと、テキストエディター内で文字化けしていることがあります。メモ帳で開くときはファイルの文字コートをUTF-8に指定すれば文字化けしません。サクラエディターで開けば、何もしなくても文字化けしません。php_editor_stdで開けば、文字化けします。ez-HTMLで開けば、文字化けします。???とこんな具合です。テキストエディターを開くときにエンコードを指定して開けば、文字化けはしないであろうと考えて、設定の部分を色々と探していじってみても、文字化けの現象は変わりません。SJISですと、ダメ文字とかあるのでやはり切り替えていったほうが良いと思い試している最中です。テキストエディターで文字化けした場合、どのようにすれば解消するのかお分かりになる方がおりました教えていただけないでしょうか。よろしくお願いいたします。

    • ベストアンサー
    • PHP
  • 秀丸エディタのファイル保存時の文字コード選択について

    秀丸Ver 3.19を使用してます。 ファイルを名前を付けて保存するとき、文字コードEUCと改行コードLFに自動で保存することはできないのでしょうか? 今はいちいち選択しないといけないので効率が悪く面倒なのですが・・。

  • 秀丸エディタ、秀丸メールのメニューの文字化け

    不要なフォントを削除したところ、必要なフォントまで削除してしまったようで、これらの症状が出ました。 秀丸エディタ その他>動作環境 左部分のメニュー文字化け(白背景部分の文字全部) 秀丸メール 設定>全般的な設定 左部分のメニュー文字化け(白背景部分の文字全部) 秀丸メール 日本語ファイル名のファイルを添付すると、その瞬間にファイル名が文字化け 他のソフトなどは問題なく、秀丸シリーズのみに問題が出ているようです。 フォントは元の通りに戻して、FNTCACHE.DATファイルを削除しました。 さらに、秀丸シリーズを完全に削除して、一からインストールしてみましたが、改善されませんでした。 メニューはいいとしても、添付ファイルが文字化けしますので困っています。 改善方法を教えていただければ助かります。よろしくお願いいたします。