- ベストアンサー
UTF-32における改行コードって
表題の通りです。 UTF-32の改行コードってなんなんでしょうか。 UTF-16の場合「0x0d0x000x0a0x00」 UTF-8の場合「0x0d0x0a」 ですよね? UTF-32の場合「0x0d0x000x0a0x000x000x00」? お分かりの方教えてください。m()m
- takataka111
- お礼率52% (72/136)
- C・C++・C#
- 回答数4
- ありがとう数19
- みんなの回答 (4)
- 専門家の回答
質問者が選んだベストアンサー
>UTF-16の場合「0x0d0x000x0a0x00」 >ですよね? ということが前提ならLEであるはずなので以下です。 00 00 0d 00 00 00 0a 00 もしもBEなら以下です。 00 00 00 0d 00 00 00 0a UAX #19: UTF-32 http://www.unicode.org/reports/tr19/tr19-9.html
その他の回答 (3)
- wormhole
- ベストアンサー率28% (1619/5654)
改行コードだとBEだと 00 00 00 0a LEだと 0a 00 00 00 だと思うんですが。 質問でいわれている改行コードは復帰も含むんでしょうか。
お礼
ご連絡が遅くなり申し訳ありません。 ありがとうございました。 参考にさせていただきます。
- pringlez
- ベストアンサー率36% (598/1630)
# さておき LE なら # 0d 00 00 00 0a 00 00 00 # では>#1. そうですね。そのとおりです。 No.1の内容は間違いです。すみません。
お礼
ご連絡が遅くなり申し訳ありません。 ありがとうございました。 参考にさせていただきます。
- Tacosan
- ベストアンサー率23% (3656/15482)
'\n'. さておき LE なら 0d 00 00 00 0a 00 00 00 では>#1.
お礼
ご連絡が遅くなり申し訳ありません。 ありがとうございました。 参考にさせていただきます。
関連するQ&A
- UTF8の和文の行末の改行が二つになる。
UTF8の和文から正規表現で抜き出すと、 行末が「。」の場合に一個の改行コードで二個の改行になってしまいます。 ShiftJISならば、\rを取ればよいのですが、 UTF8では色々やってみても上手く出来ず、どうしたらよいのでしょうか?
- 締切済み
- その他([技術者向] コンピューター)
- 改行コードの変換
TEXTAREAタグの属性wrapにhardを設定したHTMLがあります。 今まで問題はなかったのですが、Window8のIE10だと、なぜか 改行が倍になってしまいます。 調べた所、IE10の特有の問題で、改行が本来「0x0d,0x0a」に したいところ、「0x0a,0x0a」になってしまうようです。 http://answers.microsoft.com/ja-jp/ie/forum/ie10-windows_8/%E5%86%8Die10-textarea/6ee92b5a-46dd-498d-83d8-eede6ec69864 そこで、データ受け側のPHPプログラムで、改行コードを0x0a,0x0aから0x0d,0x0a にしたいと思っていますが、改行コードの変換の仕方がわかりません。 replaseとかだと、\nとか\r\nとかでしか変換した事がないので、0x0aとかの変換 の仕方がわかりません。 また、単純に0x0a,0x0aを0x0d,0x0aに変換すれば解決できるものなのかも疑問です。 本当に改行が複数あった場合などは、どうなるのか? IE10以外のブラウザでは問題ないのか?です。 WindowsのPCはあるので、Windows版のIE10以外のIEやクローム、FireFox、サファリ などは試せますが、マックなどはどういった挙動をするのかも心配です。 ここら辺に詳しい方がおりましたら、アドバイスを頂けると助かります。宜しくお願いします。
- ベストアンサー
- PHP
- Windowsでの改行コード
HTMLを書くのにあたりUNIXサーバが主流なのだから、 UTF-8、改行コードはLFで行うことを勧められました。 Windowsの改行コードはCR LFだそうですが、 LFにした場合、Windows上でJAVAScriptなどのテストをしたときに 何か不都合があるのでしょうか。 改行コードが CR LF でUNIX上でトラブルになった事例は見つけました。 反対のことが良く分かっていません。よろしくお願いします。
- ベストアンサー
- Windows系OS
- ファイル出力の改行コードをLFに
また質問です。よろしくお願いいたします。 WindowsXPでperl5.8.7の環境です。 出力したファイルの文字コードをEUC、改行コードをLFで出力をしようとしています。 なお入力、出力ファイルには日本語が含まれています。 文字コードは希望通りいくのですが改行コードがうまくいきません。 Windowsのデフォルト改行コードCR+LFが出力されてしまいます。 (Terapad(エディタ)の改行コード表示がこうなっています。) (1)binmode(OUT);で行うと、 Wide character in print at jisyo01.pl line 63, <IN> line 97. というエラーが表示され、出力されない。 (2)$xxx[$i] =~ s/\x0D\x0A/\x0A/g; で改行コードを置換しようとしても、置換されず、 CR+LFである。 (3)$/ = pack("C", hex("A"));で 改行コードをchompした後、print OUT "$/";としても、 CR+LFのままである。 上手くいきません。いい方法ないでしょうか。 よろしくお願いいたします。
- ベストアンサー
- Perl
- UTF-8とASCIIコードにおける互換性について
UTF-8とASCIIはそのASCIIコードの範囲のおいて 互換性を持ちます。(と、書籍や多種な文献にはそういった記述があります) たとえば【A】という文字をUTF-8で符号化した際は【41】(16進数で) さらにASCIIコードでも【41】という値がAという文字に割り当てられています。 確かに、一件互換しているようにみえますが、UTF-8っていうことは最終的には Unicode上のコードポイントの値・・・つまり0x0041という値に復元?(というのでしょうか)するわけですよね? でそのUnicodeの文字集合上から復元したコードポイントに対応する文字を参照しAという文字をみつけてくると・・・。 これって【A】という文字をUTF-8で符号化した歳のバイト列はASCIIと一致しているけれど 結局Unicodeコードポイントに直した場合【00】という上位バイトが無駄にくっついてきて【0x0041】となり 互換性がなくなるのではとおもったのですが・・・。 これはどういう意味の互換性なのでしょうか? 識者の方ご教授ください。 お願い致します。
- ベストアンサー
- その他(プログラミング・開発)
- 改行コード変換…
今、ソケットを用いたメール送信プログラムを作成していて、以下のページを 参考にプログラムを組んでいるのですが、次の意味が分かりません。 どなたかご存知の方がいらっしゃいましたら教えて頂きたいのですが。 # -------------------- # 改行コード変換 # -------------------- sub decode{ my $inf = $_[0]; $$inf =~ s/\x0D\x0A|\x0D|\x0A/\n/g; #←特にこの行が } 『Knave Web講座』"http://www.site-cooler.com/kwl/perl/smtp.htm#perl"より
- ベストアンサー
- Perl
- UTF8コードで1バイトの文字が2バイトで表現されているのですが・・・・?
UTF8コードで1バイトの文字が2バイトで表現されているのですが・・・・? とタイトルの通りデータに UTF-8のデータを扱っていて 16進表記で『0xC341』と データが入ってきました。 0xC3…11000011 0x41…01000001 UTF-8の仕様で2バイト目の文字は先頭ビットが 10 から始まる仕様となっていると思いますが 2バイト目の先頭ビットが 0 の場合はUTF-8コードが 壊れていると判定してもいいんですか? それとも、2バイトの先頭ビットが0の場合 次のバイトを1バイト文字とし変換してあげて 0x41 → A として変換するなどといった 特殊な仕様が隠れていたりするのでしょうか? 今のところ壊れていると判断しているのですが、 UTF-8ではないコードだったりする可能性もあるかな? っと思い質問いたしました。 少し不安だったので、しっていましたら、教えてください。 以上 検索ワード UTF-8 2バイト目 1バイト文字
- 締切済み
- その他([技術者向] コンピューター)
- 改行コードとテキストエンコーディングについてお伺い致します。
改行コードとテキストエンコーディングについてお伺い致します。 あるデータファイルの改行コードは「Unix(LF)」, テキストエンコーディングは「UTF-8(BOMなし)」という指定があります。Mac Book (OS X 10.6.4)でテキストエディットで打ち込んだ物を使っているのですが,その指定に該当するのか、もし違うのであれば、どう修正したらよいかわかりません。ご教示いただけたら幸いです。
- ベストアンサー
- Mac
- Smartyで出力したHTMLコードが改行されない
PHPのテンプレートエンジンであるSmaryについて教えてください。 SmartyテンプレートをUTF-8、かつ改行コードLFで作成しました。 (テキストエディタでちゃんと上記の通りなってるかも確認) ◯◯.tplとし、Webサーバを介して描画したところ、出力結果のHTMLのソースが改行されないで出力されてしまいました。 (ブラウザでのHTML自体の描画はできているので、HTMLから改行のみ消えてHTMLがみにくい状態) なぜか<script>タグで区切ったJavascriptのコードの部分だけはちゃんと改行されています。 HTML部分も改行したいのですが、なにか設定が必要なのでしょうか。 (以前、Smarty2.x系を使ったときは出力されたHTMLは改行されていました。) 【環境】 OS:MaxOSX Lion Webサーバアプリ:ZendServerCE5.3.5 Smarty:バージョン3.1.4 テンプレート:UTF-8、改行LFで作成 以上、よろしくお願いします。
- 締切済み
- PHP
- jsp 改行コードで改行させて表示したい
はじめまして。 PostgreSQLから読み込んだ文字列データを表示させるtomcat+struts+servlet/jspを作成中です。 データの文字列に含まれる改行が、クライアントに表示された際に反映されず困っています。 過去ログも調べ、近い質問はありましたが、僕とは内容が微妙に違うようで、改めて質問させていただきました。 例えば、あるテーブルのある項目に、 A B C というデータ(A,Bそれぞれの後に改行のある3行の文字列)があるとします。 これを読み込みaction form bean(と言うのですか?setter/getterを定義する関数です)を介してjspに埋め込むと、できあがるhtmlでは、 ABC と改行されずに表示されます。 htmlで改行させるには「<BR>」が必要なのかと、データ文字列に0x0dや0x0a、または0x0d+0x0aがあれば「<BR>」に置き換えてaction form bean(?)のsetterに渡してjspを作ると、今度は、 A<BR>B<BR>C と「<BR>」が文字列として表示されます。 htmlをソース表示すると、「A<BR>B<BR>C」で、親切にも「<」「>」をそれぞれ「<」「>」に勝手に置き換えあくまで文字列として表示してくれるようです。 試しに改行コードを「<BR>」に置き換えても予想通りその部分は <BR> とそのまま表示され、そのソースは「&lt;BR&gt;」でした。 「<」や「<」等をそれぞれ「<」「&lt;」のように置き換える作業は、どこが行っているのでしょうか。 また、改行位置で改行させるにはどうすればよろしいでしょう。 OSはwindowsXPです。 無知ゆえに、つまらないことで悪戦苦闘しているのかも知れませんが、経験も浅くてよく解りません。 宜しくお願い致します。
- ベストアンサー
- Java
お礼
ご連絡が遅くなり申し訳ありません。 ありがとうございました。 参考にさせていただきます。