• ベストアンサー

文字コードの種類について

大変恥ずかしい質問ですが、文字コードの種類について疑問があります。 UTF-8、UTF-16、UTF-32という規格はどのような場合に使用するのでしょうか? Windowsのメモ帳で使用している(?)、Shift-JISという規格も全く解りません。 wikipediaで調べてみたものの、説明が理解できませんでした。 ・・・-xの数値がビットを表している、と言われてもピンときません。 符号空間?何それ?というレベルです。 大まかなイメージを掴みたいので、お知恵を拝借頂けると幸いです。 よろしくお願いいたします。

質問者が選んだベストアンサー

  • ベストアンサー
回答No.1

> UTF-8、UTF-16、UTF-32という規格はどのような場合に使用するのでしょうか? wikipediaに書いてあったような。 http://ja.wikipedia.org/wiki/Unicode#.E3.82.A8.E3.83.B3.E3.82.B3.E3.83.BC.E3.83.87.E3.82.A3.E3.83.B3.E3.82.B0.EF.BC.88.E7.AC.A6.E5.8F.B7.E5.8C.96.E6.96.B9.E5.BC.8F.EF.BC.89 UTF-8(UTF-2、UTF-FSS) インターネットではもっとも一般的に利用されている。 ※ Linuxを含め最近のunix系のシステムではファイル名などにもUTF-8を使っている事が多いし、公開されているウェブページも非常に多くがUTF-8で書かれています。 UTF-16 Windows XPなどの近年のOSの内部では、UTF-16符号化形式が使われている。 Windowsのメモ帳で作成した「Unicodeテキスト」 UTF-32 (Unicode 3.1より) ただしすべてのUnicodeを扱う処理を行う場合には、すべての文字を単一の符号単位で表現したほうが処理に適するため、内部の処理ではUTF-32符号化形式(あるいはUCS-4)で扱うことも多い。 ※ソフト内部で使われている(メモリに読み込む時にこの形式で読み込み、書き出す時に保存形式に変換)場合は少なくないが扱えないソフトも多くファイルとして使われている事は非常に少ない。 > wikipediaで調べてみたものの、説明が理解できませんでした。 関連する解説いくつもあったように記憶してます。どのページが理解できなかったのかな。 上はほぼwikipediaに書かれていた事を写しただけです。(※は私の書いたコメント) > 符号空間?何それ?というレベルです。 例えば、ASCIIにおける大文字アルファベットだとA:65 B:66 ... Z:90ですし、小文字アルファベットだとa:97 b:98 ... z:123 数字だと 0:48 1:49 ... 9:57ですよね。 asciiにおける大文字アルファベットの符号空間は65-90だし、数字の符号空間は48-57という事になります。 ※asciiの体系全体では制御文字や記号などが加わり0-127という事になります。(32以降が印字可能文字) ※65を'A'として使いますっていうのが符号化。 符号化の団体が符号空間。(上に書いた数字の符号空間は48-57/大文字アルファベットの符号空間は65-90もその一例) 英語も日本語もはめ込んでいる符号空間は大きい。

tobochite
質問者

お礼

ご回答ありがとうございます。 私がwikipediaを上手く使えておりませんでした。 汗顔の至りです("Unicode"で検索していなかったです)。 ※のコメントも大変ありがたいです。 saijyo_739様と仕事ができる方々は幸せですね。 不勉強を反省し、精進いたします。 重ねて御礼申し上げます。

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • 文字コードが変わってしまう

    Webページ作成関連の市販のテキストについているサンプルコードを自分のマシンにコピーして勉強しています。WindowsXPとWindows7を使っています。 たとえば、【今日問題なく使った】のに、翌日同じHTMLファイルのソースを見たら、文字コードが矢印に変わってしまっています。 改行コード変換ソフトで変換して、また元に戻して作業をしました。 翌日、他の部屋のマシン(WinXP)でそのファイルを開いたら、また文字コードが矢印に変わっていました。 詳しいことはわからないレベルですが、状況だけ書いてみました。 文字コードが変わってしまうタイミングってあるのでしょうか。関係ないかもしれませんが、書籍についてきたサンプルファイルの文字コードはUTF-8なので、文字コード変換ソフトでShift_JISに変更しました(なぜShift_JISにしたかは、特に意味はありません。UTF8がいいというのは聞いていますが、とりあえずShift_JISでやっています)。 難しい理論は理解できないと思いますが、どうしてそうなるかを教えていただける方がいたらお願いします。

  • Webの文字コードについて

    しばらくWeb制作から離れていまして、久しぶりなのですが、DreamweaverCS3のデフォルトの文字コードがUTF-8になっていました。 以前(MX2004の頃)はshift-jisだったと思います。 文字コードの知識もあまりなく、shift-jisにしておけば無難・・ということでそれに従っていただけなのですが、いまはUTF-8が普通なのでしょうか? UTF-8に変わった理由も知りたいです。

  • 文字コードってUTF-8が主流に?

    文字コードについては、UTF-8が主流になりつつあるってネットで観ました。 文字コードを検索すると次のような説明があります。 (UTF-8のエンコード) UTF-8は、UnicodeとASCIIコードを混在させるための規格です。 (シフトJISコード) シフトJISコードは、SJISとも呼び、Microsoft社が決めたコードでWindows95やMS-DOSやMacなどで使用されています。 その上で質問です。 1、 UTF-8が主流になるってことは、Windows、MacがUTF-8に方向転換するってことでしょうか? 2、 仮にUTF-8が主流になっても、サイトに <META http-equiv="Content-Type" content="text/html; charset=Shift_JIS"> と記述していれば文字化けなく表示されるのでしょうか? 今の時点では判断できない質問なのでしょうか・・

  • 文字コードEUC-JPは、文字集合なのか符号化方式なのか?

    文字コードEUC-JPは、文字集合なのか符号化方式なのか? 文字コードの文字集合・符号化方式についてWikipediaをみて 勉強をしていたのですが、途中で分からなくなりました。 とりあえず、文字集合・符号化方式それぞれの具体例を把握することにより まずはイメージをつかもうとしていました。 文字コード - Wikipedia http://ja.wikipedia.org/wiki/%E6%96%87%E5%AD%97%E3%82%B3%E3%83%BC%E3%83%89 「2(符号化)文字集合、文字符号化方式」の内容についてです。 以下の部分を読んだところ # 日本語には JIS X 0208 というひとつの文字集合に対して # ISO-2022-JP (JIS コード等と呼ばれることが多い)、EUC-JP、 # Shift_JIS など複数の符号化方式が存在する。 以下だと解釈しました。 →文字集合 :JIS X 0208 →符号化方式:ISO-2022-JP(JISコード)、EUC-JP、Shift_JIS 一方以下の部分を読んだところ # また、それぞれ異なる文字集合を同じ符号化方式とする関係もあり、 # 例えば符号化方式 EUC に対して EUC-JP、EUC-KR、GB2312 (EUC-CN) # などがある。 以下だと解釈しました…。 →文字集合 :EUC-JP、EUC-KR、GB2312 (EUC-CN) →符号化方式:EUC で、「EUC-JP」が文字集合なのか符号化方式なのか 分からなくなってしまいました。Wikipediaの記述が間違っているのか、 「EUC-JP」は文字集合でもあり符号化方式でもあるのか分かりません。 「EUC-JP」が文字集合なのでしょうか? それとも符号化方式なのでしょうか? その両方であるのでしょうか? Wikipediaの記述が間違っているのでしょうか? この辺について教えてください。よろしくお願いします。

  • 文字コードについて(どのファイルをどの文字コードにしてWeb開発を進めていくべきか)

    【疑問の背景】 文字コードについて(どのファイルをどの文字コードにしてWeb開発を進めていくべきか)   国際標準で使われているUTF-8で統一しておけば問題はないだろうと思って開発を進めていると・・・   UTF-8は「日本語が2~4バイト」で扱われるという、バイトの扱いが厄介であるため、   できればJavaでのUTF-8で開発は避けたい、だから「Shift-JIS」にしておきたいという話があがり、   各々のファイルにどの文字コードを設定すれば良いのかがわからなくなっている状態です。    いくつかの疑問がでていまして  判る範囲で構いませんので文字コード設定の判断についてのアドバイスいただけませんでしょうか? 【現在の開発文字コード】 HTMLファイル: UTF-8 JSPファイル: UTF-8 Javaファイル(servlet): UTF-8 Javaファイル(Bean): UTF-8 Javaファイル(JSPから出来たサーブレット): UTF-8 データベース: UTF-8 【設定したい今後の予定文字コード】 HTMLファイル: UTF-8 JSPファイル: UTF-8 Javaファイル(servlet): Shift-JIS Javaファイル(Bean): Shift-JIS Javaファイル(JSPから出来たサーブレット): Shift-JIS データベース: UTF-8 【疑問1】 javaファイル(servlet,Bean)をどのコードにすべきかについて  全てS-JISにした方がいいのか、UTF-8にした方がいいのかどうあるべきなのでしょうか?  (UTF-8 で 「日本語が2~4バイト」として扱われると、どういった弊害が発生するのでしょうか?) 【疑問2】 javaファイルをS-JISに変える方法について  今はサクラエディターというツールで  名前を付けて保存 → 文字コードセット「Shift-JIS」 → 保存 → ファイル名の文字コードセットの変更完了    今はエクスプローラーから直接フォルダの中にあるファイルを触っている状況なのですが、  eclipseから「ファイルの文字コードセットを変更する方法」はありますでしょうか? 【疑問3】 「Shift-JIS」に設定して開発していく必要性について  既存で「utf-8」で設定されているjavaファイルを、「Shift-JIS」に設定して開発していく必要性はあるのでしょうか? (all in one eclipse 3.4 を入れたとき、デフォルトで「utf-8」でjavaファイルが作られるつくりになっているみたいなのですが・・・)   【疑問4】 javaファイル作成時、「Shift-JIS」の形式でファイルを生成する方法について     現在、javaファイルを作成する場合「utf-8」のコードでjavaファイルが生成されるようになっています。      【自作で作成したjavaファイルの場合】    「サクラエディターを使用して、文字コードセットをShift-JISに変更すれば、ずっとShift-JISのファイルの状態」にすることができました。      しかしここで問題が出たのですが      【JSPファイルから自動生成されたjavaファイル(servlet)の場合】    「サクラエディターを使って、Shift-JISに変更した後に、JSPファイルを編集すると、また“utf-8に戻ってしまう” 状態」です。    現状としては「JavaファイルはShift-JISに統一して欲しい」という要望なので、    JSPから自動生成されたjavaファイルが "utf-8" になってしまいます。      JSPから自動生成されたjavaファイルを    "常にShift-JISに設定する" 方法はありますでしょうか?     【環境】  OS   ・WindowsXP Pro    java開発環境   ・all in one eclipse(3.4)   ・TomCat(6.0)   ・Java JRE(1.6)   ・MySQL(5.0)

    • ベストアンサー
    • Java
  • HTMLの文字コードについて

    ウェブサイトの文字コードは何を使うのが、よいのでしょうか?現在の自分のサイトはShift_jisですが、最近のサイトはUTF-8が多いようです。Shift_jis のHTMLをUTF-8に変更する場合、HTMLにどういった変更が必要なのでしょうか?また、UTF-8に変更するメリットはなんでしょうか?

    • ベストアンサー
    • HTML
  • 文字コードShif-JIS、UTF-8

    漢方の「瘀血」の“瘀”という文字の文字コードはUTF-8にはありますがShift-JISにはありません。html記述に作成にTeraPadを使っていますが、Shif-JISがデフォルトのようで“瘀”の文字がATOKで書き込めず、?に置き換わってしまいます。TeraPadの表示オプションの「文字コード」をUTF-8に設定しても同じです。ためしにメモ帳でやってみたところ問題なくATOKで瘀と書き込めます。TeraPadをUTF-8ベースで使うにはどうしたらいいでしょう。

  • windowsでのRailsの文字コードをUTF-8にしたい

    InstantRailsを使用しているのですが、文字コードをUTF-8にしたいと思っています。 Railsが作成するファイルがshift-jisになるのですが、これをUTF-8になるように変更する方法はあるのでしょうか?

  • 文字コードについて

    よろしくお願いします。 ホームページを作成しました。というより現在作成中です。 htmlの記述を確認しようと以下のサイト様より文法チェツクをしたところ、以下のように表示されました。 line 5: 指定されている文字コードセットは `Shift_JIS` ですが、実際のコードは UTF-8 のようです。 私は、文字コードの部分はShift_JISにしておきたいのですが、 このようなエラーはどのように、どの部分を変更すれば良いのでしょうか? 全く分からずに困っております。 どなた様か、ご指導の程よろしくお願いします

    • ベストアンサー
    • HTML
  • 文字コードの変換によるレイアウト崩れ

    はじめまして。 どうしても解決できない問題があり 皆様のお知恵を拝借したく投稿させていただきました。 文字コードの変換について教えていただけませんでしょうか。 HTML、CSSをUTF-8でコーディングしましたが、 急遽Shift-JISでの納品を求められ文字コードを変換したのですが 表示レイアウトが崩れてしまい見るも無惨なデータになってしまいました。。 WindowsXPの秀丸、Macのmiをそれぞれ使用して文字コードの変換をしました。(Dreamweaver8でも試しましたがだめでした。。) このとき他のサイトにて文字コード変換時にBOMを付加しないという記述をされていたので、それに従って変換したつもりなのですが どうにもこうにもうまくいきません。。。 どうすれば上手に表示されるようになるのでしょうか。。 不しつけな質問および言葉足らずかもしれませんが、 どなたかお教えください。 よろしくお願いします!