ベストアンサー

※ ChatGPTを利用し、要約された質問です（原文：Unicodeは使うべきなのでしょうか？）

Unicodeの使い方とその影響について

2011/06/27 14:25

このQ&Aのポイント

Unicodeの存在に興味や疑問や怖さが募っています。半角１バイト全角２バイトの扱いは将来的に廃止される可能性があるのか、ブラウザやチャットでの多言語同時表示がデータ送信負荷にならないのか、Unicodeによる保存・管理・通信の無駄に関する疑問があります。プログラマーの皆さんはどのようにUnicodeを使い分けているのか知りたいです。
Unicodeの存在に疑問を抱いています。半角１バイト全角２バイトの扱いが将来的に廃止される可能性やブラウザやチャットでの多言語同時表示のデータ送信負荷について疑問があります。Unicodeを使うことで保存・管理・通信の無駄が増えるのではないかと思っています。プログラマーの皆さんはどんな風にUnicodeを使っていますか？
Unicodeについて興味と疑問、そして恐怖心を感じています。半角１バイト全角２バイトの扱いがなくなる可能性やブラウザやチャットでの多言語表示のデータ送信負荷について心配しています。Unicodeを使って保存や管理、通信をすると無駄が増えるのではないかと心配しています。プログラマーの方々はどのようにUnicodeを使っているのでしょうか？

noname#202167

C・C++・C#
回答数6
ありがとう数6

みんなの回答 （6）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

papapa0427
ベストアンサー率25% (371/1472)

2011/06/27 15:01 回答No.1

文字コードよりも、OSの歴史の勉強が必要かも？グローバルスタンダードという言葉をご存知でしょうか？質問１　多分将来的には日本でしか使用されないでしょう。それも疑問ですが。　MS-DOSの時代にはこのコードが使用されていました。全角２BytというのはシフトJISという文字コードが使用されており、使用できる漢字は２千文字たらずです。現在の常用漢字すら全て表示させることはできません。質問２　通信サービスが始まった頃は、通常のメタル回戦を使用してFAXみたいに通信をしていました。たかだか１２００Bpsです。(150Byt/Sec)現在ではADSLでも数MBytの転送スピードがありますので問題にはならないでしょう。インフラの整備でますます早くなってくるでしょうから問題にはなりえないでしょう。無線LANのWi-Fiでも公称100M/sec実効でも１０数～２０M/せcはいくでしょう。質問３　確かに無駄かもしれません。がHDDなんかは１セクターを８Kbytや１６Kbytで管理しています。つまり１bytのファイルを書き込んでも１６Kbytの容量を消費してしまいます。こちらの方がよっぽど無駄でしょう？でも大容量化によって問題にはなっていませんね。 Unicodeは６bytですが６４bitCPUなら一気に８bytのデータを取り扱うことができますよ。それと何故Unicodeになったかは、全世界で同じOSが使用でき全世界の言語を使用できようにしたためです。Windows98あたりまでは、日本は日本向けのOS、アメリカはアメリカ用のOS。中国も韓国も、その他もろもろの国に対応したOSの使用になっていました。そのため文字コードでデータ(情報)の共有に支障をきたしていました。全世界で同じデータを共用するのならUnicodeは現在のところ外せない物です。

質問者

お礼 2011/06/29 05:55

膨大な通信負荷を避けたい場合以外は気にする事などなさそうですね。とても参考になりました。ご回答ありがとうございました。

その他の回答 (5)

bajutsu
ベストアンサー率20% (139/693)

2011/06/28 23:02 回答No.6

なんとなく、質問者が２バイト文字圏内だから疑問に持ってるだけな気がする。普通、日本にいる限りは２バイト文字で事足りますからね。ただ、世界規模で見た場合、２バイトで足りないだけの文字が存在するのは確かですし、 unicodeが目標としているような、全世界で共通の文字コード体系になってそれが広がれば、「文字化け」で悩まされることはなくなるんですから。たぶん、質問者さんは今まで文字コードで苦労したことないんでしょう？私は、仕事柄、いろんな文字に接してますから文字化けにはよく悩まされますよ。 ISO8859-1の一部は、日本語環境では半角カタカナに化けますしね。文字化け云々だけじゃなくて、作ったものを海外展開するのにローカルな文字コードにしか対応していない場合と unicodeに対応して作っておくのとでは、どっちが楽かは想像に難くないでしょう。とうことで、私は、unicode化の流れになんの疑問も持ちません。ま、unicodeはunicodeでいろいろ面倒なんですが unicodeが目標としているところは分かります。 ■質問１細く、長く残ると思います。理由は、実装が楽だし、扱いやすい。自分だけとか、身内しか使う予定のないちょっとしたツールとかのあからさまに国内onlyなものまで、unicode化はしないでしょ？ ■質問２送信負荷と言っても、文字の送受信なんてたかが知れてますしそれ以上に多言語同時表示にメリットがあるということでしょう。 ■質問３２バイトで事足りることしかしてないから、そう感じる。 “１バイト文字や２バイト文字と比較”したら、そりゃ無駄に感じるのは当たり前。日本国内しか見てないから、そう思う。たぶん、１バイト文字圏内の人で、外を見ないタイプの人は、もっと疑問に感じているでしょう。ただ、今の通信インフラ、メモリ容量、処理速度等々を考慮したら微々たるものですし “世界”に目を向けたら、１バイトや２バイトじゃ足りないのは明白なんで…。使い分けは、多言語表示するか、しないか？とか海外の人にも使ってもらうことが想定されるかどうか？じゃないですか？質問１でも答えたけど、身内が使う前提とかなら、全く意識しませんし。もうちょっと広い視野で物事を考えましょう。

質問者

お礼 2011/06/29 06:03

perlとｃでの全角半角識別程度の苦労ならしましたが。目的をできるだけ明確にしないと無駄になるという事ですね。むしろUnicodeで組んで通信時だけ変換すれば良い話か…。回答どうもでした。

Tacosan
ベストアンサー率23% (3656/15482)

2011/06/28 11:10 回答No.5

そもそも「半角１バイト　全角２バイト」というのがおかしいわけで.... EUC って知ってます? まあ, まじめな話として Unicode を「完璧に扱える」プログラムが存在するとは思えないので, てきと～につまみ食いすればいいんじゃないでしょうか. ちなみに「Unicode を使えば多言語を扱える」というのは理論上正しいけど現実的にはほぼ妄想. あと, あんまり言いたくないんだけど Unicode には「半角」「全角」ってあったりするんだよね.

質問者

お礼 2011/06/29 05:47

ご回答ありがとうございます。

神崎渉瑠（@taloo）
ベストアンサー率44% (1016/2280)

2011/06/27 16:49 回答No.4

>■質問１コード体系としては残るでしょうけど、実際に使われることはないという意味で、いずれは消えていくと思います。（古語（漢文）、歴史的仮名遣いのような扱い）また、それらの文字コードを、ソフトウェアがサポートするかどうか、と言う意味でも使われなくなると思います。 http://www.gnu.org/licenses/licenses.ja.html jis（iso-2022-jp）で書かれていますが、IE、Safariでは文字化けして読めません。半角、全角の言葉を使っているのはプログラマーだけではありませんし、非プログラマー向け、および通称としての半角、全角は残ると思います。もちろんプログラミングとしては半角、全角は不正確ですので、１バイト文字、２バイト文字、３バイト文字、、、Shift_JIS、UTF-8などの表現になると思います。 >■質問２データサイズの削減にShift_JISやEUC-JPなどが使われることはあると思いますが、極めてまれだと思います。 >■質問３無駄もありますが、必要もあります。データサイズの増大は無駄かもしれませんが、それ以上に多言語が扱えるのは有利だと思います。

質問者

お礼 2011/06/29 05:48

ご回答ありがとうございました。

nda23
ベストアンサー率54% (777/1415)

2011/06/27 15:57 回答No.3

質問１過去の遺産が残る限り、廃止されないでしょう。質問２データ転送の実体は実データ以外の項目もあり、単に見えている文字だけではありません。それに、転送速度が高速なので、通常は問題になりません。質問３音楽、画像といったものに比べれば大した話ではないと思います。 VBで使用するDLLを開発する場合、文字列の受け渡しはマルチバイトです。但し、フォルダのIDリストを受け取るとか、オブジェクトのプロパティやメソッドにアクセスする際のDISPIDを得る場合など、UniCode でしか処理できないAPIもあります。ベースはマルチバイトでも語尾にWが付くUniCode用 APIを意識的に使うこともあります。都合の良い方を使うだけの問題でしょう。

質問者

お礼 2011/06/29 05:49

ご回答ありがとうございました。

Yune-Kichi
ベストアンサー率74% (465/626)

2011/06/27 15:48 回答No.2

> 今まで、半角１バイト　全角２バイトでプログラミングして来ました。半角ってなんでしょうか。全角ってなんでしょうか。ちゃんと突き詰めて考えると，この部分から実は崩れ去ります。 > ・半角１バイト　全角２バイトという扱いは > 　将来的に廃止され締め出されてしまう危険などが有るのでしょうか？廃止も何も，半角や全角という言葉自体が公式に定義があるわけでもなく，特定の実装における状況を表現したに過ぎません。 > ・ブラウザ/一部チャットのように多言語同時表示は > 　文字数分大量の無駄なデータ送信負荷になってないのでしょうか？ > 　時に１文字６バイトにすらなるとも聞くだけに疑問です。昔のUTF-8は6 octetまで定義されていましたが，現在は4 octetまでです。それはともかく，Unicodeという文字集合の全部の文字を表現することが必要なのですから無駄ではないです。不要なので無駄だと思うのであれば，その文字コードを使わなければよいわけですし。 > ・Unicodeだと、半角１バイト　全角２バイトの扱いに比べ > 　保存も管理も通信も、無駄が増えるだけにも思えてしますます。上記の通りです。文字集合としてUnicodeを使っているからといって，文字コードとしてUTF系を使わないといけないわけではないですから。 > 　Unicodeをプログラマーの皆さんはどう認識し使ったり使い分け > 　しているのでしょうか？ Unicodeは当然のようにそこにあるものです。従来コードが使いやすければ従来コードを使いますし， UTF系コードが使いやすければUTF系コードを使います。単純に大きくてよく使われている文字集合という扱いです。ちなみに，表示幅を文字の専有バイト数で決定しようとするアプローチは，プロポーショナルフォントの存在によって既に破綻しています。また，×など，フォントによって幅が大きく違うものも存在します。このため，表示幅を決めるには，いちど幅を取得するAPIを使って表示幅を取得し，フォントサイズを変更して再度表示幅を取得して入ることを確認する，というような手続きが必要になります。

質問者

お礼 2011/06/29 05:51

ご回答ありがとうございました。参考になります。

Unicodeの使い方とその影響について

Unicodeは使うべきなのでしょうか？