• ベストアンサー

2バイトって何文字分ですか?

none123の回答

  • none123
  • ベストアンサー率30% (49/162)
回答No.3

ちょっと嘘入ってるかもしれませんが(何!)ご説明です。 8ビットというのは8桁の数字の列です。但しその中には0か1しか書けません。 00000000 ~ 11111111 までの組み合わせが表現できます。 この組み合わせは、2の8乗分の数を表現できます。(0か1かの2択の8桁分) sesameさんの言われている256通りとはこのことです。 英語の文字は(記号とか含めても)そんなに種類が無いですよね。 256個で充分でしょう。 ということで、一文字ずつにひとつずつ数字を割り振っていきます。 たとえば 00000001 なら A ということにする みたいな感じでです。 (↑数字は大嘘です) こんな感じで、半角英数文字は 1バイトで表現できます。 ところが、日本語になると、そうはいきません。 文字はいっぱい漢字もたくさん。256コでは日本語は表現しきれません。 というわけで、日本語は英数文字の倍のデータ量である 2バイト使うようにしました。 これなら 2の16乗 なので 65536 通り となり 何とかなりそうです。 (記憶違いでなければ 13 桁使って残りは使っていないという話を聞いたことがあるのですが…そうすると 2の13乗だから 8192 通り?…なんか違うかも。) というわけで、日本語のような全角文字は2バイトで表現しました。 つまり、ひとつの文字にひとつの数字を割り振ってある と考えればよいのです。 多分日本語の文字といっても、使用頻度の低いものは収録されていないので、すべての文字を表示することは、出来ないのかもしれませんね。 上記のような表現方法の結果、全角は2バイト・半角は1バイト となっているようです。 ちなみに上の話は、メモ帳とかのソフトを使って純粋に文字だけ保存した場合のデータ量になります。 ワードなどのワープロソフトを使ってデータを作ると純粋な文字の情報以外にも、文字の表示位置や色の情報など、文字以外の情報をたくさん持ってしまうのでもっとデータは膨れ上がります。

gonpapa2002
質問者

お礼

ご回答ありがとうございます。 文字の表示位置や色の情報でも容量を使うんですね。そうですよね~。 ところで、半角カタカナは1byteなんですか? すいません、コンピュータ用語に弱いもので・・。

関連するQ&A

  • マルチバイト混在の文字列整形

    OS: Linux Ubuntu 言語: C++ 引数でchar*型の文字列配列(マルチバイト含む)を受け取り 指定した幅で枠つきで文字列を出力したいのですがうまくいきません。 作りたい出力 ━━━━━━━ ┃1: あいうえお┃ ┃2: かきく   ┃ ┃3: abc    ┃ ━━━━━━━ - str[] = {"あいうえお", "かきく", "abc"} - あいうえおの後ろは空白なし - 他は空白と文字列を合計してあいうえおと同じ長さに合うように 私の環境では日本語は3byteと認識され  strlen("あいうえお") = 15 となります。 イメージでは for (i = 0; i < strlen(str[])の最大値; i++) { cout << "┃" << i << ":" << setw(15) << left << str[i] << "┃" } のようなコードになると思うのですが 日本語一文字が出力上は2byte分の幅に見えるのに 認識としては3byteになってしまうので空白が1byte多くなり ━━━━━━━ ┃1: あいうえお┃ ┃2: かきく    ┃ ┃3: abc       ┃ ━━━━━━━ のようにずれてしまいます。 (表記上、最初の枠もずれていますが  現状は足りない分を埋めるsetfillが余計に働いてしまうということです。) 何か対策はありますでしょうか?

  • 人の脳をフルに活動できるとしたら、何バイトの記憶容量があるのでしょうか?

    人の脳をフルに活動できたした場合、 2000年分ぐらい?の新聞の文字データを入れることができると何かで、聞いたことがあります。 ------------------------------------------ では、 人の脳を100%活動でき、すべてを記憶に使った時、 何バイトの記憶容量があるのでしょうか?

  • FDの記憶容量計算について。

    ただ今、J検3級に向けて勉強中です。 FDの記憶容量計算について、教えてください。 1セクタが512バイト,1トラックが9セクタ,片面80トラックでフォーマットされている両面記録可能なフロッピーディスクの記憶容量を計算してみる。 1トラック分の記憶容量=512×9(バイト) 1面分の記憶容量=1トラック分の記憶容量×80(バイト) したがって、総容量=1面分の記憶容量×2(両面分)=737280B(バイト) =737280÷1024=720KB(キロバイト) セクタサイズだけを1024バイトと変えた場合に、同様の計算をすると、その記憶容量は1.44MB(メガバイト)となる。 上記とあります。 専門用語が分からない私は、まず、何をどのようにイメージしたら分かりやすいでしょうか。 また、専門用語ではなく、分かりやすい言葉で書き換えてくださる方はいらっしゃいませんでしょうか。 よろしくお願いいたします。

  • 海外PCで開くときのPDF中の特殊文字(2バイト文字)

    日本語の文章を英訳して、PDFにし、海外に送る予定です。 その際、日本語ではよく使われる、丸で囲まれた数字(1)(2)や、点・、 矢印→、四角□■◆□などの2バイト文字を英文中に使っても良い(海外のPCで読める)のでしょうか。 なんとなく、オリジナル文書(ワード)では2バイト文字は海外では文字化けしそうな感じがするのですが、PDFにすると2バイト文字も読めるのかなぁと言う気もしています。 NGの場合、回避テクニックもあれば教えてください。 ご指導よろしくお願いいたします。

  • 文字などで

    こんばんは。 Win98を使用しているんですが、 ネットなどをしている時に 検索サイトの『検索欄』に文字を打って検索 をすると、次回からその欄に文字が記憶され 選択できるようになりますよね? そこで、3つだけ質問させてください。 ・あの文字はどこに保存されてるのでしょうか? ・保存されているなら、消したりできるのですか? ・保存をしない設定は可能なんですか? ちょっとそれが分からなくて、 日本語入力ソフトはIME 98です。

  • 全角半角あわせて3文字

    全角半角が混在している文字列の左から3文字を取得したい場合にいい方法はないでしょうか? mb_substr関数で第3パラメータはバイト数で指定するようです。 関数リファレンスでは「最大文字数」って表現になってます。 http://php.net/manual/ja/function.mb-substr.php 半角なら文字数=バイト数ですが、全角だと指定の半分の文字数になります。 最大だから間違ってはないですが、文字数じゃないよな‥‥っていつも思ってます。 いったん半角→全角にして、6バイト分を切り出すのはできます。 でも、英数字も全角半角混在してるので元の文字列を壊したくないのです。 mb_substrの第3パラメータを6から3まで、mb_strlenが3になるまで回すのもやってみました。 でも、なんかスマートじゃないんですよ‥‥。 なにかこう、スマートないい手はないでしょうか? よろしくお願いします。

    • ベストアンサー
    • PHP
  • Oracle AL32UTF8でのバイトサイズ見積

    データベースのテーブルのカラムのサイズを定義しようとしています。調べた限りでは、Oracle AL32UTF8においては、以下の容量を消費するとなっていました。 (1) ASCII -> 1 byte (2) 記号文字 -> 2 byte (3) 半角カナ、全角カナ、ひらがな、漢字 -> 3 byte これは、「1」や「a」などの英数字は1バイト、「%」や「#」などの記号は2バイト、「あ」「ア」「亜」などの全ての日本語は3バイトで保存されるということだと思いますが正しいでしょうか? そうであれば、例えば氏名項目に20文字を保証したい場合は、一番バイト消費の多い3バイトで見積もり、20 * 3 = 60バイトで定義すればよいでしょうか? 第3水準文字、第4水準文字は4バイトで保存されるという記事もあったのですが、これらはとても稀なケースなので考慮せずに3バイトで考えておくのが一般的でしょうか? あとは、バイトで考えずにNLS_LENGTH_SEMANTICSという初期化パラメータをCharにすることで文字数ベースにすることができるとも聞いたのですがこのアプローチは推奨されますか?全てのテーブルに影響があると思うので、大きな決断になると思うのですが普及したやり方なのでしょうか? 以上、見解を教えて頂けると助かります。以上、宜しくお願いします。

  • 1B(バイト)って?

    1B(バイト)というのは、記憶容量なのでしょうか?もしそうならば1B は、文字や数字がどれぐらい入るのが「1B」なのでしょうか?

  • 2バイト文字を一括削除するマクロ

    英語と日本語が混在しているdocファイルがあり、 日本語のみ一括削除したいと思っております。 日本語(=2バイト文字)を一括削除するマクロはあるでしょうか。

  • ヤフーメールの最大送信容量は何バイトでしょうか?

     ヤフーメールの最大受信容量は1通あたり10MBです。最大送信容量は何バイトでしょうか?2MB超のBMPファイルをメールソフトから送信したら、送信不可でした。なお無料で使っています。