• ベストアンサー

第1水準漢字の文字数など

(1)第1水準漢字、第2水準漢字、第3水準漢字、第4水準漢字と4種類ありますが、それぞれ何文字あるのでしょうか。 (2)半角英数字は上記のどの漢字に含まれるのでしょうか。 (3)(1)、(2)は、何という文書において決められているのでしょうか。

質問者が選んだベストアンサー

  • ベストアンサー
  • noocyte
  • ベストアンサー率58% (171/291)
回答No.2

> JIS X 0201に半角英数字が示されていることは分かるのですが、 > JIS X 0201に示されている半角英数字はJIS X 0208とJIS X 0213 > には含まれていないのでしょうか。それとも、JIS X 0208と > JIS X 0213にも含まれているのでしょうか。 JIS X 0208 の規格名称は「7ビット及び8ビットの2バイト情報交換用符号化漢字集合」, JIS X 0213 は「7ビット及び8ビットの2バイト情報交換用符号化拡張漢字集合」です. したがって1バイト文字である半角英数字は含まれません. シフト JIS では JIS X 0201 と JIS X 0208 を併用します. Windows や Mac 版のシフト JIS では,さらに機種依存文字が追加されています. JIS X 0213 は現在普通に使用されているシフト JIS では扱えませんが, Shift_JIS-2004 や EUC-JIS-2004 には含まれているそうです. Shift JIS-2004 (Wikipedia) http://ja.wikipedia.org/wiki/Shift_JIS-2004 EUC-JIS-2004 (Wikipedia) http://ja.wikipedia.org/wiki/EUC-JIS-2004 > 第1水準~第4水準の文字数は、御教示のWebサイトの「JIS X 0213:2004」の > 表に示される文字数で全部でしょうか。例えば、『第4水準漢字は、全部でと > 言うことなら「JIS X 0213:2004」の表に示される以外にもある』というような > ことはないでしょうか。 私も JIS X 0213 はまだ勉強中なので断言はできませんが, 「2004年時点では」これで全部でしょう. しかし今後の JIS X 0213 の改定により,文字が追加されたり, 既存の文字の字形が変更されたりする可能性はあると思います. JIS X 0208 や JIS X 0213 では,2バイト文字を 94×94 の表 (「面」と呼ぶ) に配置します.前回挙げた URL にも書かれていますが,JIS X 0213 では第1面と 第2面があり,次のように使用されています. ・第1面 (JIS X 0208 の拡張)  ・非漢字:1183文字 + 39文字分の未使用領域  ・第1水準漢字:2965文字  ・第2水準漢字:3390文字  ・第3水準漢字:1259文字 ・第2面  ・第4水準漢字:2436文字  ・未使用領域:6400文字分 したがって,第1~3水準にはこれ以上追加する余地はなさそうですが, 第4水準にはたっぷりあります.ただし今後追加する文字を第4水準と呼ぶのか, 第5水準と呼ぶのかはわかりませんが…. JIS X 0213 (Wikipedia) http://ja.wikipedia.org/wiki/JIS_X_0213 JIS X 0213:2004 第1面の文字表とエスケープシーケンス http://www.itscj.ipsj.or.jp/ISO-IR/233.pdf JIS X 0213:2000 第2面の文字表とエスケープシーケンス (2004年改正では2面には変更なし) http://www.itscj.ipsj.or.jp/ISO-IR/229.pdf > JIS X 0208が第1水準と第2水準の文字群が何であるかを定義する文書であり、 > JIS X 0213:2004が第3水準、第4水準の文字群が何であるかを定義する文書であり、 > かつ、第1水準と第2水準の文字群が何であるかを定義する文書は JIS X 0208以外 > にはなく、第3水準と第4水準の文字群が何であるかを定義する文書はJIS X 0213: > 2004以外にはないということでしょうか。 おおむねそう言えると思います.ただし「文字が何であるか」に例示字形まで含めて 考えると,JIS X 0208 の例示字形のうち,JIS X 0213:2000 で変更されたものも あるようです.したがって第1水準 (第2水準も?) は JIS X 0208 と JIS X 0213 では微妙に異なるということになります. 参考:Category:文字コード (Wikipedia) http://ja.wikipedia.org/wiki/Category:%E6%96%87%E5%AD%97%E3%82%B3%E3%83%BC%E3%83%89

wakabakun
質問者

お礼

たいへん詳細かつ明確な御回答を頂き、御礼の申し上げようもありません。よく分かりました。 有り難うございました。

その他の回答 (1)

  • noocyte
  • ベストアンサー率58% (171/291)
回答No.1

> (1)第1水準漢字、第2水準漢字、第3水準漢字、第4水準漢字と > 4種類ありますが、それぞれ何文字あるのでしょうか。 JIS X 0213 の第三・第四水準漢字(2) http://blog.miraclelinux.com/asianpen/2007/01/jis_x_0213_2_f279.html 「"第4水準漢字" "文字数"」で検索 http://www.google.co.jp/search?q=%22%E7%AC%AC%EF%BC%94%E6%B0%B4%E6%BA%96%E6%BC%A2%E5%AD%97%22+%22%E6%96%87%E5%AD%97%E6%95%B0%22&sourceid=navclient-ff&ie=UTF-8&rls=GGGL,GGGL:2006-34,GGGL:ja > (2)半角英数字は上記のどの漢字に含まれるのでしょうか。 どれにも含まれていません. JIS X 0201 (7ビット及び8ビットの情報交換用符号化文字集合) という規格です. JIS X 0201 (Wikipedia) http://ja.wikipedia.org/wiki/JIS_X_0201 > (3)(1)、(2)は、何という文書において決められているのでしょうか。 規格名のことなら,(1) については最初の URL を参照してください.

wakabakun
質問者

補足

早速の御回答有り難うございます。 だいたい分かったような気がするのですが、少しだけ確認の意味でお尋ねさせていただいてよいでしょうか。 > JIS X 0213 の第三・第四水準漢字(2) > http://blog.miraclelinux.com/asianpen/2007/01/jis_x_0213_2_f279.html​ 第1水準~第4水準の文字数は、御教示のWebサイトの「JIS X 0213:2004」の表に示される文字数で全部でしょうか。例えば、『第4水準漢字は、全部でと言うことなら「JIS X 0213:2004」の表に示される以外にもある』というようなことはないでしょうか。 >どれにも含まれていません. >JIS X 0201 (7ビット及び8ビットの情報交換用符号化文字集合) という規格です. JIS X 0201に半角英数字が示されていることは分かるのですが、JIS X 0201に示されている半角英数字はJIS X 0208とJIS X 0213には含まれていないのでしょうか。それとも、JIS X 0208とJIS X 0213にも含まれているのでしょうか。 >規格名のことなら,(1) については最初の URL を参照してください. これはつまり、 JIS X 0208が第1水準と第2水準の文字群が何であるかを定義する文書であり、JIS X 0213:2004が第3水準、第4水準の文字群が何であるかを定義する文書であり、かつ、第1水準と第2水準の文字群が何であるかを定義する文書はJIS X 0208以外にはなく、第3水準と第4水準の文字群が何であるかを定義する文書はJIS X 0213:2004以外にはない ということでしょうか。

関連するQ&A

  • 「第四水準漢字」の文字数

    (1)「第四水準漢字」は全部で何文字あるのでしょうか。 (2)また、そのこと(文字数の数値)を閲覧できるWebサイトがあるでしょうか。 (3)「第四水準漢字」はこれだけの文字群だということは、何という文書に示されているのでしょうか。

  • 第二水準漢字が含まれるか?

    テキストファイル内にJIS第二水準の文字が含まれているかを検索する方法はありますか?フリーソフトでもかまいません。 やりたいことは、 1.第二水準漢字がふくまれるか 2.第二水準漢字が何個存在するか? 3.第二水準漢字の抽出 のいずれかですが、3ができたら最高です。

  • 第1水準漢字などの名称

    (1)「第1水準漢字」は「JIS X 0208:1997の附属書6に「第1水準」として示される文字のうちの漢字。字数は2,965字。」のことだと思うのですが、そのような理解で正しいでしょうか。 (2)JIS X 0208:1997の附属書6に「第1水準」として示される文字は総字数3,489字ですが、この3,489字はまとめて通常何という名前で呼ばれるのでしょうか。

  • JIS第1水準+第2水準の文字数

    JIS第1水準+第2水準の文字数は、いくつあるのでしょうか? IMEとか、ATOKに登録されている文字数が知りたくて 困っています。 よろしくお願いします。

  • JIS第三、第四水準の漢字は入力可能になったか?

    OSが Win 7 Pro SP-1 の私のパソコンでは、JIS第一水準および第二水準までの漢字は入力可能だけど、第三、第四水準の漢字は入力不可能です。 Windows 8 では、第三、第四水準の漢字も入力できるようになっていますか? 漢字コードで入力する場合、入力可能なコードの種類は次のドレとドレかを教えて下さい。 区点コード、JISコード、シフトJISコード、UNIコード 具体例を挙げておきます。 添付 Fig-1 の漢字(「徳」の異字体)  →第四水準 「山」冠の下に「奇」(「嵜」の異字体)→第三水準 「山」偏の右に「竒」(「崎」の異字体)→第三水準 これらの漢字をMS明朝で入力&表示できますか?

  • JIS第3,第4水準の漢字の表示について

    windowsXP,ワード2002を使っていますが,以前までの自分の認識としてはMS明朝,MSゴシックで第3,4水準の漢字を表示できないと思っていたのですが,牛建(牛偏に「建」:第3水準),山古(山偏に「古」:第4水準)などの漢字がIMEの手書き認識でワード上で表示できることが分かりました。しかし,弓巾(弓偏に「巾」:第4水準)などはXANO明朝やKandataなどの特別なフォントでないと表示できないものもあるようです。 そこで以下の3つについて教えていただきたいと思います。 (1)これらの第3,4水準の文字は以前から表示可能だったのか? (2)これらの文字はwindows標準のMS明朝で表示できる文字とできない文字があるようですが,この差は何か? (3)このれらの文字は楷書とかポップなどのフォントに置き換わりません。と言うことはやはり何らかの制限があるのでしょうか?

  • メールの文字化け?

    マイクロソフトOEで、受け取った文書の一部(ひらがなの一文字)が英数字となる(半角英数字の二文字となる。)のは、なぜか。こちらの文書は送信済みでは英数字がないのに、返信された文書には英数字がある。また、今回送られてきた相手方の文書にもあった。 何が悪いのでしょうか。

  • JIS漢字の第1水準と第2水準の見分け方

    JIS漢字をVBのプログラムの中で、第1水準か第2水準か判断することはできますでしょうか? またLotusNotesのロータススクリプトでもできますでしょうか?

  • 外字をJIS水準内の文字に置き換えたい

    髙→「高」 﨑→「崎」 というように、外字にはそれぞれ当てはめるべきJIS水準内の文字が用意されているかと思います。 このように、使用頻度の高い文字であれば頭で覚えていられるのですが、初めて見る漢字、難しい漢字の外字をJIS水準内の漢字に置き換えなければならない場合、皆さんならどうしますか? ・外字をJIS水準内の文字に置き換えるための対比表等があれば大変助かります。 ・また、いわゆる「外字変換ツール」というものは有効でしょうか? 使用OS:WINDOWS2000  

  • WORDで第二水準の漢字が必要ですが。

    もう一台のノートPCでは、WORDで文書作成の際、「圓」(えん、まる)が出ませんが、どうすればいいのでしょうか? 句点入力(四桁数字)して目的の第二水準漢字を出すことはできないのでしょうか? WORDの文書作成画面から教えてください。