ベストアンサー

文字のバイトサイズの取得

2005/03/09 23:41

２５バイト以上ある文字配列を２５バイトまでに切り取りたいのです。全て半角英数ならstr.substring(0 ,25)ですみますが日本語も入っているのでsubstringが使えません。そこで，バイト配列を使おうと思ったのですがうまくいきません。どうかお願いします。例） String E = "AAAAAAAAAAAAAあああああああ"; byte S[] = new byte[100]; S=E.getBytes(); ByteArrayOutputStream out = new　ByteArrayOutputStream(); for(int n = 0; n < 25 ; ++n){ out.write(S[n]); } System.out.println(out.toByteArray()); 結果として"AAAAAAAAAAAAAあああ"が出力されてほしい

ee_bb
お礼率70% (7/10)

Java
回答数3
ありがとう数2

みんなの回答 （3）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

UKY
ベストアンサー率50% (604/1207)

2005/03/10 00:05 回答No.1

> System.out.println(out.toByteArray()); 出力したいのはバイト配列そのものではなくて、バイト配列を文字列に変換したものでは? → System.out.println(new String(out.toByteArray())); ところで、 "AAAAAAAAAAAAAあああああああ" から 25 バイト切り取って "AAAAAAAAAAAAAあああ" になるのがよく分からないのですが……。エンコーディングは何ですか? 文字列⇔バイト配列の変換ではエンコーディングを指定したほうが失敗がないと思います。 // 25 バイト目が文字と文字の間ではない場合はどうしますか?

質問者

お礼 2005/03/11 01:35

ありがとうございます。 //25 バイト目が文字と文字の間ではない場合はどうしますか文字化けのままにしておきます。

その他の回答 (2)

mura333
ベストアンサー率42% (3/7)

2005/03/10 10:33 回答No.3

No1さんにもありますが、エンコード（もしくは対象OS)が分からないと何とも言えません。例えば、Windowsのみをターゲットするのなら、MS932前提のコーディングとなりますが、同じソースをLinuxで動かしたら…。さて、とりあえずWindows前提で回答しますと、No2さんの通り、最後をSystem.out.println(new String(out.toByteArray()));にすれば、結果として「AAAAAAAAAAAAAああああああ」が表示されます。半角13文字、全角6文字（12バイト）で合計25バイトの文字列です。しかし、もし運悪く半角Aが14文字あったらどうなるでしょうか？結果は「AAAAAAAAAAAAAAあああああ?」となります。この時にどういう仕様にしましょうか。あと細かい部分ですが、byte S[] = new byte[100];でnewする必要はありません。次のS=E.getBytes();で参照が切れるので、すぐにgcの対象になります。

osumitan
ベストアンサー率33% (102/307)

2005/03/10 09:03 回答No.2

受け取ったバイト配列から再びStringを作ったらいいのではないでしょうか？ String s = new String(out.toByteArray());

質問者

補足 2005/03/11 01:37

ありがとうございます。指摘されたように String s = new String(out.toByteArray()); でStringの文字列に戻しました。

文字のバイトサイズの取得

質問者が選んだベストアンサー

お礼 2005/03/11 01:35

その他の回答 (2)

補足 2005/03/11 01:37

関連するQ&A

String <=> byte配列の際のエンコード

バイト数の取得について

出力ストリームをバイト配列へ変換するには

サーブレットで文字化け

長さ3のバイト配列

０バイト文字の送信

[再質問]VC#で2進数の文字列をバイト列に変換する方法

javaの文字化けに困っています。

キャラクタ？バイト？

テキストBOXから取得した文字コードの扱いについて

文字化けします。

Androidプログラミング　文字列の切り取り

三つの文字を順に並べるプログラム

日本語が文字コードによってはエンコード出来ない？

Stringオブジェクトの文字コードの変換

byte[]→String変換後の文字列が違うのはなぜ？

数値からバイト配列への変換について

環境に依存しない文字長（日本語含む）の取得方法

文字列について(続き)

文字列の比較について

注目のQ&A

カテゴリ
一覧

専門家に質問してみよう
専門家登録

あなたにピッタリな商品が見つかる！ OKWAVE セレクト

文字のバイトサイズの取得

質問者が選んだベストアンサー

お礼 2005/03/11 01:35

その他の回答 (2)

補足 2005/03/11 01:37

関連するQ&A

String <=> byte配列 の際のエンコード

バイト数の取得について

出力ストリームをバイト配列へ変換するには

サーブレットで文字化け

長さ3のバイト配列

０バイト文字の送信

[再質問]VC#で2進数の文字列をバイト列に変換する方法

javaの文字化けに困っています。

キャラクタ？バイト？

テキストBOXから取得した文字コードの扱いについて

文字化けします。

Androidプログラミング 文字列の切り取り

三つの文字を順に並べるプログラム

日本語が文字コードによってはエンコード出来ない？

Stringオブジェクトの文字コードの変換

byte[]→String変換後の文字列が違うのはなぜ？

数値からバイト配列への変換について

環境に依存しない文字長（日本語含む）の取得方法

文字列について(続き)

文字列の比較について

注目のQ&A

カテゴリ 一覧

専門家に質問してみよう 専門家登録

あなたにピッタリな商品が見つかる！ OKWAVE セレクト

String <=> byte配列の際のエンコード

Androidプログラミング　文字列の切り取り

カテゴリ
一覧

専門家に質問してみよう
専門家登録