- ベストアンサー
GB2312とGB18030についての疑問
kokoroneの回答
- kokorone
- ベストアンサー率38% (417/1093)
文字の集合体 と、 文字コード の違いは何? JISコード、アスキーコード、GBと、含まれる文字種別は異なります。それは、言語圏の違いで、ひとつの集合体では網羅できないからです。 そう言う視点から見ると文字の集合体です。 一方、一昔前の活字印刷のように、活字を目でみながら1文字1文字探して、文章にしていた頃はまさに、集合体という表現でしたが、昨今のコンピュータ化により、上記の様々な集合体をコードに置き換えて、コンピュータ処理するようになり、そこで 必要になったのが1文字1文字に対応したコードなのです。 文字の集合体が異なれば、同じ文字でもコードが異なります。 いかがでしょうか?
関連するQ&A
- 文字コードEUC-JPは、文字集合なのか符号化方式なのか?
文字コードEUC-JPは、文字集合なのか符号化方式なのか? 文字コードの文字集合・符号化方式についてWikipediaをみて 勉強をしていたのですが、途中で分からなくなりました。 とりあえず、文字集合・符号化方式それぞれの具体例を把握することにより まずはイメージをつかもうとしていました。 文字コード - Wikipedia http://ja.wikipedia.org/wiki/%E6%96%87%E5%AD%97%E3%82%B3%E3%83%BC%E3%83%89 「2(符号化)文字集合、文字符号化方式」の内容についてです。 以下の部分を読んだところ # 日本語には JIS X 0208 というひとつの文字集合に対して # ISO-2022-JP (JIS コード等と呼ばれることが多い)、EUC-JP、 # Shift_JIS など複数の符号化方式が存在する。 以下だと解釈しました。 →文字集合 :JIS X 0208 →符号化方式:ISO-2022-JP(JISコード)、EUC-JP、Shift_JIS 一方以下の部分を読んだところ # また、それぞれ異なる文字集合を同じ符号化方式とする関係もあり、 # 例えば符号化方式 EUC に対して EUC-JP、EUC-KR、GB2312 (EUC-CN) # などがある。 以下だと解釈しました…。 →文字集合 :EUC-JP、EUC-KR、GB2312 (EUC-CN) →符号化方式:EUC で、「EUC-JP」が文字集合なのか符号化方式なのか 分からなくなってしまいました。Wikipediaの記述が間違っているのか、 「EUC-JP」は文字集合でもあり符号化方式でもあるのか分かりません。 「EUC-JP」が文字集合なのでしょうか? それとも符号化方式なのでしょうか? その両方であるのでしょうか? Wikipediaの記述が間違っているのでしょうか? この辺について教えてください。よろしくお願いします。
- ベストアンサー
- その他([技術者向] コンピューター)
- GB2312とGB18030についての質問です。
「GB2312もGB18030もどちらも本来は文字集合という意味であるが、 今日では文字集合/文字コードの両方の意味で区別せず使ってよい」 上記の認識で間違いないでしょうか?よろしくお願いします。
- ベストアンサー
- その他([技術者向] コンピューター)
- 日本語URLと文字コード。名称を教えてください。
例えばブラウザのURL欄に入力した http://ja.wikipedia.org/wiki/日本語 という文字列は、IE以外では、それをテキストエディタなどにコピペすると http://ja.wikipedia.org/wiki/%E6%97%A5%E6%9C%AC%E8%AA%9E となりますが、この「%(16進数)」の文字コードの名称を教えていただけないでしょうか。 よろしくお願いします。
- ベストアンサー
- その他(プログラミング・開発)
- GB 18030-2005について
GB 18030-2005をいろいろ調べているのですが、情報が少なく、 分からないことがあり、教えてください。 Wikipediaでは、「GB18030-2005ではさらに1文字の割り当てが4バイト符号と入れ替えられた」 とあるので、UTF-32のようにすべて4バイト文字になったと思ったのですが、 Linuxのdebian6のgeditテキストエディタ(GB18030)確かめたら、 文字は1,2,4バイトでした。 以上、よろしくお願いします。
- 締切済み
- その他([技術者向] コンピューター)
- CSVファイルの改行コードについて。
http://ja.wikipedia.org/wiki/Comma-Separated_Values http://www110.kir.jp/study/jissen/script3075.html http://ja.wikipedia.org/wiki/%E3%83%86%E3%82%AD%E3%82%B9%E3%83%88%E3%83%95%E3%82%A1%E3%82%A4%E3%83%AB http://ja.wikipedia.org/wiki/%E6%94%B9%E8%A1%8C%E3%82%B3%E3%83%BC%E3%83%89 上記のウェブページ群を拝見しましても、 「CSVファイルの改行コード」の読み方が分かりませんでしたので、 業務で困っておりますから、改行コードの値の具体例を教えて頂けませんでしょうか?
- ベストアンサー
- その他(ソフトウェア)
- 実数全体集合を断りなしに「R」で表しても問題ない?
実数全体集合はR 自然数全体集合はN で表せる、とWikipediaに書いてありました。 http://ja.wikipedia.org/wiki/%E9%9B%86%E5%90%88 では、大学入試の数学の答案で、何の断りも無しに、 xが自然数であることを「x∈N」と書いても問題ないでしょうか? また、そうだとしたら、Nは普通の大文字の「N」ではなく、 左の縦棒を2本にした、少し変わった「N」じゃないといけないのでしょうか?
- ベストアンサー
- 数学・算数
- 解析学:開集合についてです。
解析学:連続写像の部分集合の話です。 ・実数R^nで作られた開集合の任意の個数の和集合は開集合になります。 ・開集合を有限個集めたときの共通部分も開集合となります。 ・しかし,開集合を無限個集めた時の共通部分は,必ずしも開集合になるとはかぎらないようなのですが,そのような例とはどのようなものなのでしょうか。 反例を提示していただけるかたいらっしゃいましたらよろしくお願いします。 http://ja.wikipedia.org/wiki/開集合 の性質(2)です。
- 締切済み
- 数学・算数
- UTF-8のコード表について
UTF-8のコード表の中に「Ͱ」、「ͱ」、「Ͳ」、「ͳ」といったように行列式のような文字がたくさんあるのですが、これらの用途は何でしょうか? どうやら文字コードの16進数を示している所まではわかるのですが・・・ わざわざ入れなくとも不使用、未使用にしてしまえばいいのにと感じます。 現在、 http://ja.wikipedia.org/wiki/UTF-8%E3%82%B3%E3%83%BC%E3%83%89%E4%B8%80%E8%A6%A7_0000-0FFF を参照しています。 回答よろしくお願いします。
- ベストアンサー
- その他([技術者向] コンピューター)
- 日本語の文字列のみをURLエンコードする
ある文字列の中から日本語の部分だけをURLエンコードしたいのですが、どのようにすれば良いのでしょうか。 例えば「http://ja.wikipedia.org/wiki/ウィキペディア」から「http://ja.wikipedia.org/wiki/%E3%82%A6%E3%82%A3%E3%82%AD%E3%83%9A%E3%83%87%E3%82%A3%E3%82%A2」という形にURLエンコードする、という事です。 よろしくお願いいたします。
- ベストアンサー
- PHP
- サイトの文字が読めない
http://ja.wikipedia.org/wiki/%E3%83%AA%E3%83%90%E3%83%BC%E3%82%B9%E3%83%A2%E3%83%BC%E3%82%B2%E3%83%83%E3%82%B8 上記のサイトを観覧したいのですが私のPCで見ると文字が読み取りにくいです。 どのような設定をすれば見れるようになりますでしょうか?
- 締切済み
- その他(インターネット接続・通信)
お礼
回答ありがとうございます。 というと、GBもつまりは文字の見え方、ではなく記号として表現できる集合体という理解でよろしいでしょうか?つまりはアスキーコードなどと同じものという考え方でいいのでしょうか?