• 締切済み

文字コードの利点・欠点について

おはようございます。 文字コードには、大きく分けて4種類 ・JISコード ・S-JIS ・EUC ・Unicode がありますが、それぞれの利点・欠点を教えていただけますでしょうか。 あと、EUCはなぜ制御文字を使って、1バイト仮名や補助漢字の文字コードを割り当てているのかも教えてください。 よろしくお願いします。

みんなの回答

  • notnot
  • ベストアンサー率47% (4846/10257)
回答No.2

文字コードの解説はされているので、残った >EUCはなぜ制御文字を使って、1バイト仮名や補助漢字の文字コードを割り当てているのかも教えてください。 何故かというとその方式がISO2022という規格で定められているからそれに従っています。 さらに何故ISO2022でそう定められているかというと、別の文字セットへの切り替え指示は、今の文字セットに割り当てられていない範囲を使うしかないわけで、そう言う意味で制御コードの範囲にその機能が割り当てられています。

回答No.1

もう一つの質問とまとめてもよかった気がしますが…。 ・旧JIS(JIS X 0201)(8bit)利点 ASCIIと同じバイト数で、ASCIIに加えてカナを扱える。 構造が単純。 欠点 漢字は扱えない ・新JIS(JIS X 0208)(7bit)利点 7bitしか使わないので昔の低性能な通信にも耐えた。(残り1bitで誤り検出) 扱う文字を増やそうと思えばいくらでも増やせる。 ・欠点 ステートフルなので文字列の途中を見ても書いてある文字が分からない。 エスケープシークエンスの分容量がかさむ。 ・Shift_JIS利点 旧JISの上位互換なので旧来の資源をそのまま使える。 半角カナを有効利用すると保存に必要なデータ量が新JISやEUCより少ない。 WindowsとMacで標準なのでデファクトスタンダード。 欠点 元は独自拡張なので世界の統一コードであるISO2022と互換性がない。(ただし韓国と中国にShift_JISと同じ構造のコードがある) エンコードが複雑。 2バイトの区切りを間違えると文字列の途中から見て読めない。 2バイト目に「\」のコードが出て問題が起こる。 ・EUC利点 上記Shift_JISの欠点を全て解決。 Shift_JISの漢字に加え補助漢字数千字が使える。 ・欠点 半角カナが使えない(無理に使うと複雑なコードに)。 補助漢字は複雑なコード。 旧JISに互換性がない。 WindowsやMacで使いづらい。 ・Unicode利点 文字数が多い。 ・UTF-8利点 ASCIIの上位互換。 文字列の途中からでも読める。 ・UTF-16利点 基本多言語面のみなら1文字2バイト固定で扱いやすい。 2バイトで扱える文字が最も多い。 ・Unicode欠点 さまざまな文字がごちゃまぜに登録されているため、扱いが面倒。 (例: 右から左に書く文字、合成文字、文字方向を変える制御文字、同じ文字に複数のコード) ・UTF-8欠点 1文字あたりのバイト数が不定。 他のコードに比べ1文字あたりのバイト数が多い。 ・UTF-16欠点 基本多言語面以外の文字を使おうとするとバイト数不定。 ASCIIに互換性がない。

関連するQ&A

  • 文字コードの利点、欠点

    シフトーJISとかEUCとか、色々文字コードが ありますが、例えばこのふたつの文字コードの場合、 それぞれの利点、欠点は何なのでしょうか? よく観るホームページではシフト-JISが多い気もしますが、 どちらの方がいいのでしょう?

  • TeraPadの文字コード

    TeraPadの文字コードについて教えてください。 1. TeraPadで扱える文字コードは Shift-JIS、JIS、EUC、Unicode、UTF-8、UTF-8N の6種類あるようですが、このEUCとEUC-JPは 同じものですか? 2. Shift-JISで保存すると、TeraPadの下の部分に 表示される文字コードがSJISとなります。 これはShift-JISのことですか? 3. 短い文章では文字コードを誤認識する場合も あるようですが、どうしたら正しく認識 させられますか? 指定した文字コードで保存できず困っています。

  • コードに対する疑問(eucコードとs-jisコード)

    eucコードで半角カナは2バイト表現、s-jisコードは1バイト表現と認識しています。 eucコードで保有するデータが40バイトとした場合、 s-jisコードで保有するとしたら、単純に20バイトとすることで影響はありますでしょうか?

  • 漢字に関する規定がない、文字コード体系について教えて下さい!

    文字コード体系の中で、漢字に関する規定がないものを探しています。 ご存知の方がみえたら教えて下さい。。。。  (1)EUC-JP  (2)ASCII  (3)Shift_JIS  (4)JIS  (5)Unicode (1)~(5)の中で該当する文字コードはどれになるのでしょうか? 回答お願いします! 解説も添えてもらえると助かります^^;

  • 文字コードに関することです

    こんばんは。 社会人1年目でSEをやっております。 来週文字コードについて、発表することになっています。 発表内容として 文字コードの種類としてsjis.unicode.EUCなどがあり、これらの文字コードについて説明します。 しかし、どの程度のレベルまで説明すればいいのか悩んでいます。 私の考えとしては、unicodeを例にあげさせていただきますが、 unicodeとは、世界の言語を1文字2バイトを用いて表現できる文字コードです。unicodeの中でも大きく分けて2種類utf-8、utf-16に分けられます。 次に各utfの詳細な説明に入ります。 こんな具合にそれぞれの文字コードについて、説明していってもよろしいですか?? あと、utf-8がなぜ必要になったのか、教えていただけますでしょうか?? よろしくお願いします。

  • ファイルの文字コード

    パソコンの文字コードには、Shift-JISやEUCなど様々な形態があるようなのですが、 日本語(漢字、半角カナなど)を使用していないファイル=英語のみのファイル ではファイルの文字コードというのはどれでも同じなのでしょうか? 初心者な質問ですが、何卒よろしくお願いします。

  • 文字コードについて!

    文字コードについて! 文字コードのこれまでの歴史的経緯と 現状ではどのような場面で用いられているか が、調べても良く分からないので知ってらっしゃる方いませんか? ASCII、JIS、ShiftJIS、EUC,unicode どれか1つでも結構です(*Δ*) 様々な文字コードについての感想 インターネットにおける文字の扱いについても 個人的な意見でいいので、あれば聞かせてください^^

  • 漢字のコードを比較できるサイトってありませんか。

    最近仕事で、それぞれの漢字に対し、漢字のコード(ユニコード、Shift_JIS、JIS、EUC-JP)を比較できるように、一覧にしなければならなくなりました。 少し調べたところ、インターネット上には、それぞれの文字コード表はあるのですが、文字コードを横断した一覧というものは見つかりません。 それぞれの文字コード表を結合して、一覧にすることも可能だとは思うのですが、かなり時間がかかりそうなので、どこかのサイトに上記のような一覧がないものかと探しております。 ご存じの方がみえましたら、ご教授ください。

  • 保存する際の文字コードについて

    まったくの初心者です。 Windows上でエディタ等でVBScriptを書いた場合 保存する際の文字コードは シフトJIS(ANSI)、Unicode、EUC等のうち どれにすべきでしょうか。 どれでも問題ないでしょうか。

  • 文字コードの使い分けについて

    ホームページはいろんな種類の文字コード(Shift_JIS、EUCなど)で作られていますよね。 素人考えでは、日本語のサイトだけでも1種類の文字コードに統一すればいいのに・・・と思うのですが、このように様々な文字コードが存在するのはどのような理由があるのでしょうか。

    • ベストアンサー
    • HTML

専門家に質問してみよう