- ベストアンサー
文字コードの種類について
大変恥ずかしい質問ですが、文字コードの種類について疑問があります。 UTF-8、UTF-16、UTF-32という規格はどのような場合に使用するのでしょうか? Windowsのメモ帳で使用している(?)、Shift-JISという規格も全く解りません。 wikipediaで調べてみたものの、説明が理解できませんでした。 ・・・-xの数値がビットを表している、と言われてもピンときません。 符号空間?何それ?というレベルです。 大まかなイメージを掴みたいので、お知恵を拝借頂けると幸いです。 よろしくお願いいたします。
- みんなの回答 (1)
- 専門家の回答
質問者が選んだベストアンサー
関連するQ&A
- 文字コードが変わってしまう
Webページ作成関連の市販のテキストについているサンプルコードを自分のマシンにコピーして勉強しています。WindowsXPとWindows7を使っています。 たとえば、【今日問題なく使った】のに、翌日同じHTMLファイルのソースを見たら、文字コードが矢印に変わってしまっています。 改行コード変換ソフトで変換して、また元に戻して作業をしました。 翌日、他の部屋のマシン(WinXP)でそのファイルを開いたら、また文字コードが矢印に変わっていました。 詳しいことはわからないレベルですが、状況だけ書いてみました。 文字コードが変わってしまうタイミングってあるのでしょうか。関係ないかもしれませんが、書籍についてきたサンプルファイルの文字コードはUTF-8なので、文字コード変換ソフトでShift_JISに変更しました(なぜShift_JISにしたかは、特に意味はありません。UTF8がいいというのは聞いていますが、とりあえずShift_JISでやっています)。 難しい理論は理解できないと思いますが、どうしてそうなるかを教えていただける方がいたらお願いします。
- ベストアンサー
- その他([技術者向] コンピューター)
- Webの文字コードについて
しばらくWeb制作から離れていまして、久しぶりなのですが、DreamweaverCS3のデフォルトの文字コードがUTF-8になっていました。 以前(MX2004の頃)はshift-jisだったと思います。 文字コードの知識もあまりなく、shift-jisにしておけば無難・・ということでそれに従っていただけなのですが、いまはUTF-8が普通なのでしょうか? UTF-8に変わった理由も知りたいです。
- ベストアンサー
- ホームページ作成ソフト
- 文字コードってUTF-8が主流に?
文字コードについては、UTF-8が主流になりつつあるってネットで観ました。 文字コードを検索すると次のような説明があります。 (UTF-8のエンコード) UTF-8は、UnicodeとASCIIコードを混在させるための規格です。 (シフトJISコード) シフトJISコードは、SJISとも呼び、Microsoft社が決めたコードでWindows95やMS-DOSやMacなどで使用されています。 その上で質問です。 1、 UTF-8が主流になるってことは、Windows、MacがUTF-8に方向転換するってことでしょうか? 2、 仮にUTF-8が主流になっても、サイトに <META http-equiv="Content-Type" content="text/html; charset=Shift_JIS"> と記述していれば文字化けなく表示されるのでしょうか? 今の時点では判断できない質問なのでしょうか・・
- ベストアンサー
- その他([技術者向] コンピューター)
- 文字コードEUC-JPは、文字集合なのか符号化方式なのか?
文字コードEUC-JPは、文字集合なのか符号化方式なのか? 文字コードの文字集合・符号化方式についてWikipediaをみて 勉強をしていたのですが、途中で分からなくなりました。 とりあえず、文字集合・符号化方式それぞれの具体例を把握することにより まずはイメージをつかもうとしていました。 文字コード - Wikipedia http://ja.wikipedia.org/wiki/%E6%96%87%E5%AD%97%E3%82%B3%E3%83%BC%E3%83%89 「2(符号化)文字集合、文字符号化方式」の内容についてです。 以下の部分を読んだところ # 日本語には JIS X 0208 というひとつの文字集合に対して # ISO-2022-JP (JIS コード等と呼ばれることが多い)、EUC-JP、 # Shift_JIS など複数の符号化方式が存在する。 以下だと解釈しました。 →文字集合 :JIS X 0208 →符号化方式:ISO-2022-JP(JISコード)、EUC-JP、Shift_JIS 一方以下の部分を読んだところ # また、それぞれ異なる文字集合を同じ符号化方式とする関係もあり、 # 例えば符号化方式 EUC に対して EUC-JP、EUC-KR、GB2312 (EUC-CN) # などがある。 以下だと解釈しました…。 →文字集合 :EUC-JP、EUC-KR、GB2312 (EUC-CN) →符号化方式:EUC で、「EUC-JP」が文字集合なのか符号化方式なのか 分からなくなってしまいました。Wikipediaの記述が間違っているのか、 「EUC-JP」は文字集合でもあり符号化方式でもあるのか分かりません。 「EUC-JP」が文字集合なのでしょうか? それとも符号化方式なのでしょうか? その両方であるのでしょうか? Wikipediaの記述が間違っているのでしょうか? この辺について教えてください。よろしくお願いします。
- ベストアンサー
- その他([技術者向] コンピューター)
- 文字コードについて(どのファイルをどの文字コードにしてWeb開発を進めていくべきか)
【疑問の背景】 文字コードについて(どのファイルをどの文字コードにしてWeb開発を進めていくべきか) 国際標準で使われているUTF-8で統一しておけば問題はないだろうと思って開発を進めていると・・・ UTF-8は「日本語が2~4バイト」で扱われるという、バイトの扱いが厄介であるため、 できればJavaでのUTF-8で開発は避けたい、だから「Shift-JIS」にしておきたいという話があがり、 各々のファイルにどの文字コードを設定すれば良いのかがわからなくなっている状態です。 いくつかの疑問がでていまして 判る範囲で構いませんので文字コード設定の判断についてのアドバイスいただけませんでしょうか? 【現在の開発文字コード】 HTMLファイル: UTF-8 JSPファイル: UTF-8 Javaファイル(servlet): UTF-8 Javaファイル(Bean): UTF-8 Javaファイル(JSPから出来たサーブレット): UTF-8 データベース: UTF-8 【設定したい今後の予定文字コード】 HTMLファイル: UTF-8 JSPファイル: UTF-8 Javaファイル(servlet): Shift-JIS Javaファイル(Bean): Shift-JIS Javaファイル(JSPから出来たサーブレット): Shift-JIS データベース: UTF-8 【疑問1】 javaファイル(servlet,Bean)をどのコードにすべきかについて 全てS-JISにした方がいいのか、UTF-8にした方がいいのかどうあるべきなのでしょうか? (UTF-8 で 「日本語が2~4バイト」として扱われると、どういった弊害が発生するのでしょうか?) 【疑問2】 javaファイルをS-JISに変える方法について 今はサクラエディターというツールで 名前を付けて保存 → 文字コードセット「Shift-JIS」 → 保存 → ファイル名の文字コードセットの変更完了 今はエクスプローラーから直接フォルダの中にあるファイルを触っている状況なのですが、 eclipseから「ファイルの文字コードセットを変更する方法」はありますでしょうか? 【疑問3】 「Shift-JIS」に設定して開発していく必要性について 既存で「utf-8」で設定されているjavaファイルを、「Shift-JIS」に設定して開発していく必要性はあるのでしょうか? (all in one eclipse 3.4 を入れたとき、デフォルトで「utf-8」でjavaファイルが作られるつくりになっているみたいなのですが・・・) 【疑問4】 javaファイル作成時、「Shift-JIS」の形式でファイルを生成する方法について 現在、javaファイルを作成する場合「utf-8」のコードでjavaファイルが生成されるようになっています。 【自作で作成したjavaファイルの場合】 「サクラエディターを使用して、文字コードセットをShift-JISに変更すれば、ずっとShift-JISのファイルの状態」にすることができました。 しかしここで問題が出たのですが 【JSPファイルから自動生成されたjavaファイル(servlet)の場合】 「サクラエディターを使って、Shift-JISに変更した後に、JSPファイルを編集すると、また“utf-8に戻ってしまう” 状態」です。 現状としては「JavaファイルはShift-JISに統一して欲しい」という要望なので、 JSPから自動生成されたjavaファイルが "utf-8" になってしまいます。 JSPから自動生成されたjavaファイルを "常にShift-JISに設定する" 方法はありますでしょうか? 【環境】 OS ・WindowsXP Pro java開発環境 ・all in one eclipse(3.4) ・TomCat(6.0) ・Java JRE(1.6) ・MySQL(5.0)
- ベストアンサー
- Java
- HTMLの文字コードについて
ウェブサイトの文字コードは何を使うのが、よいのでしょうか?現在の自分のサイトはShift_jisですが、最近のサイトはUTF-8が多いようです。Shift_jis のHTMLをUTF-8に変更する場合、HTMLにどういった変更が必要なのでしょうか?また、UTF-8に変更するメリットはなんでしょうか?
- ベストアンサー
- HTML
- 文字コードShif-JIS、UTF-8
漢方の「瘀血」の“瘀”という文字の文字コードはUTF-8にはありますがShift-JISにはありません。html記述に作成にTeraPadを使っていますが、Shif-JISがデフォルトのようで“瘀”の文字がATOKで書き込めず、?に置き換わってしまいます。TeraPadの表示オプションの「文字コード」をUTF-8に設定しても同じです。ためしにメモ帳でやってみたところ問題なくATOKで瘀と書き込めます。TeraPadをUTF-8ベースで使うにはどうしたらいいでしょう。
- ベストアンサー
- ホームページ作成ソフト
- windowsでのRailsの文字コードをUTF-8にしたい
InstantRailsを使用しているのですが、文字コードをUTF-8にしたいと思っています。 Railsが作成するファイルがshift-jisになるのですが、これをUTF-8になるように変更する方法はあるのでしょうか?
- 締切済み
- Ruby
- 文字コードの変換によるレイアウト崩れ
はじめまして。 どうしても解決できない問題があり 皆様のお知恵を拝借したく投稿させていただきました。 文字コードの変換について教えていただけませんでしょうか。 HTML、CSSをUTF-8でコーディングしましたが、 急遽Shift-JISでの納品を求められ文字コードを変換したのですが 表示レイアウトが崩れてしまい見るも無惨なデータになってしまいました。。 WindowsXPの秀丸、Macのmiをそれぞれ使用して文字コードの変換をしました。(Dreamweaver8でも試しましたがだめでした。。) このとき他のサイトにて文字コード変換時にBOMを付加しないという記述をされていたので、それに従って変換したつもりなのですが どうにもこうにもうまくいきません。。。 どうすれば上手に表示されるようになるのでしょうか。。 不しつけな質問および言葉足らずかもしれませんが、 どなたかお教えください。 よろしくお願いします!
- 締切済み
- HTML
お礼
ご回答ありがとうございます。 私がwikipediaを上手く使えておりませんでした。 汗顔の至りです("Unicode"で検索していなかったです)。 ※のコメントも大変ありがたいです。 saijyo_739様と仕事ができる方々は幸せですね。 不勉強を反省し、精進いたします。 重ねて御礼申し上げます。