ベストアンサー

UTF-32における改行コードって

2014/09/29 09:48

表題の通りです。 UTF-32の改行コードってなんなんでしょうか。 UTF-16の場合「0x0d0x000x0a0x00」 UTF-8の場合「0x0d0x0a」ですよね？ UTF-32の場合「0x0d0x000x0a0x000x000x00」？お分かりの方教えてください。m()m

takataka111
お礼率52% (72/136)

C・C++・C#
回答数4
ありがとう数19

みんなの回答 （4）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

pringlez
ベストアンサー率36% (598/1630)

2014/09/29 12:03 回答No.1

>UTF-16の場合「0x0d0x000x0a0x00」 >ですよね？ということが前提ならLEであるはずなので以下です。 00 00 0d 00 00 00 0a 00 もしもBEなら以下です。 00 00 00 0d 00 00 00 0a UAX #19: UTF-32 http://www.unicode.org/reports/tr19/tr19-9.html

質問者

お礼 2014/10/14 08:33

ご連絡が遅くなり申し訳ありません。ありがとうございました。参考にさせていただきます。

その他の回答 (3)

wormhole
ベストアンサー率28% (1619/5654)

2014/09/29 21:25 回答No.4

改行コードだとBEだと 00 00 00 0a LEだと 0a 00 00 00 だと思うんですが。質問でいわれている改行コードは復帰も含むんでしょうか。

質問者

お礼 2014/10/14 08:33

ご連絡が遅くなり申し訳ありません。ありがとうございました。参考にさせていただきます。

pringlez
ベストアンサー率36% (598/1630)

2014/09/29 18:21 回答No.3

# さておき LE なら # 0d 00 00 00 0a 00 00 00 # では＞#1. そうですね。そのとおりです。 No.1の内容は間違いです。すみません。

質問者

お礼 2014/10/14 08:33

ご連絡が遅くなり申し訳ありません。ありがとうございました。参考にさせていただきます。

Tacosan
ベストアンサー率23% (3656/15482)

2014/09/29 12:43 回答No.2

'\n'. さておき LE なら 0d 00 00 00 0a 00 00 00 では＞#1.

質問者

お礼 2014/10/14 08:33

ご連絡が遅くなり申し訳ありません。ありがとうございました。参考にさせていただきます。

関連するQ&A

UTF8の和文の行末の改行が二つになる。
UTF8の和文から正規表現で抜き出すと、行末が「。」の場合に一個の改行コードで二個の改行になってしまいます。 ShiftJISならば、\rを取ればよいのですが、 UTF8では色々やってみても上手く出来ず、どうしたらよいのでしょうか？
- 締切済み
- その他([技術者向] コンピューター)
改行コードの変換
TEXTAREAタグの属性wrapにhardを設定したHTMLがあります。今まで問題はなかったのですが、Window8のIE10だと、なぜか改行が倍になってしまいます。調べた所、IE10の特有の問題で、改行が本来「0x0d,0x0a」にしたいところ、「0x0a,0x0a」になってしまうようです。 http://answers.microsoft.com/ja-jp/ie/forum/ie10-windows_8/%E5%86%8Die10-textarea/6ee92b5a-46dd-498d-83d8-eede6ec69864 そこで、データ受け側のPHPプログラムで、改行コードを0x0a,0x0aから0x0d,0x0a にしたいと思っていますが、改行コードの変換の仕方がわかりません。 replaseとかだと、\nとか\r\nとかでしか変換した事がないので、0x0aとかの変換の仕方がわかりません。また、単純に0x0a,0x0aを0x0d,0x0aに変換すれば解決できるものなのかも疑問です。本当に改行が複数あった場合などは、どうなるのか？ IE10以外のブラウザでは問題ないのか？です。 WindowsのPCはあるので、Windows版のIE10以外のIEやクローム、FireFox、サファリなどは試せますが、マックなどはどういった挙動をするのかも心配です。ここら辺に詳しい方がおりましたら、アドバイスを頂けると助かります。宜しくお願いします。
- ベストアンサー
- PHP
Windowsでの改行コード
HTMLを書くのにあたりUNIXサーバが主流なのだから、 UTF-8、改行コードはLFで行うことを勧められました。 Windowsの改行コードはCR LFだそうですが、 LFにした場合、Windows上でJAVAScriptなどのテストをしたときに何か不都合があるのでしょうか。改行コードが CR LF でUNIX上でトラブルになった事例は見つけました。反対のことが良く分かっていません。よろしくお願いします。
- ベストアンサー
- Windows系OS
ファイル出力の改行コードをLFに
また質問です。よろしくお願いいたします。 WindowsXPでperl5.8.7の環境です。出力したファイルの文字コードをEUC、改行コードをLFで出力をしようとしています。なお入力、出力ファイルには日本語が含まれています。文字コードは希望通りいくのですが改行コードがうまくいきません。 Windowsのデフォルト改行コードCR+LFが出力されてしまいます。 (Terapad(エディタ)の改行コード表示がこうなっています。) (1)binmode(OUT);で行うと、 Wide character in print at jisyo01.pl line 63, <IN> line 97. というエラーが表示され、出力されない。 (2)$xxx[$i] =~ s/\x0D\x0A/\x0A/g; で改行コードを置換しようとしても、置換されず、 CR+LFである。 (3)$/ = pack("C", hex("A"));で改行コードをchompした後、print OUT "$/";としても、 CR+LFのままである。上手くいきません。いい方法ないでしょうか。よろしくお願いいたします。
- ベストアンサー
- Perl
UTF-8とASCIIコードにおける互換性について
UTF-8とASCIIはそのASCIIコードの範囲のおいて互換性を持ちます。（と、書籍や多種な文献にはそういった記述があります）たとえば【A】という文字をUTF-8で符号化した際は【41】（１６進数で) さらにASCIIコードでも【41】という値がAという文字に割り当てられています。確かに、一件互換しているようにみえますが、UTF-8っていうことは最終的には Unicode上のコードポイントの値・・・つまり0x0041という値に復元？（というのでしょうか）するわけですよね？でそのUnicodeの文字集合上から復元したコードポイントに対応する文字を参照しAという文字をみつけてくると・・・。これって【A】という文字をUTF-8で符号化した歳のバイト列はASCIIと一致しているけれど結局Unicodeコードポイントに直した場合【00】という上位バイトが無駄にくっついてきて【0x0041】となり互換性がなくなるのではとおもったのですが・・・。これはどういう意味の互換性なのでしょうか？識者の方ご教授ください。お願い致します。
- ベストアンサー
- その他（プログラミング・開発）
改行コード変換…
今、ソケットを用いたメール送信プログラムを作成していて、以下のページを参考にプログラムを組んでいるのですが、次の意味が分かりません。どなたかご存知の方がいらっしゃいましたら教えて頂きたいのですが。 # -------------------- # 改行コード変換 # -------------------- sub decode{ my $inf = $_[0]; $$inf =~ s/\x0D\x0A|\x0D|\x0A/\n/g;　#←特にこの行が } 『Knave Web講座』"http://www.site-cooler.com/kwl/perl/smtp.htm#perl"より
- ベストアンサー
- Perl
UTF8コードで１バイトの文字が２バイトで表現されているのですが・・・・？
UTF8コードで１バイトの文字が２バイトで表現されているのですが・・・・？とタイトルの通りデータに　　ＵＴＦ－８のデータを扱っていて　１６進表記で『0xC341』と　データが入ってきました。０ｘＣ３…11000011 　０ｘ４１…01000001 ＵＴＦ－８の仕様で２バイト目の文字は先頭ビットが 10 から始まる仕様となっていると思いますが　２バイト目の先頭ビットが 0 の場合はＵＴＦ－８コードが　壊れていると判定してもいいんですか？　　それとも、２バイトの先頭ビットが0の場合　次のバイトを１バイト文字とし変換してあげて　０ｘ４１　→　Ａ　として変換するなどといった　特殊な仕様が隠れていたりするのでしょうか？　　今のところ壊れていると判断しているのですが、　ＵＴＦ－８ではないコードだったりする可能性もあるかな？　っと思い質問いたしました。　少し不安だったので、しっていましたら、教えてください。　　　　　　　　　　　　　　　　　　　　　　　　　以上　検索ワードＵＴＦ－８２バイト目１バイト文字
- 締切済み
- その他([技術者向] コンピューター)
改行コードとテキストエンコーディングについてお伺い致します。
改行コードとテキストエンコーディングについてお伺い致します。あるデータファイルの改行コードは「Unix(LF)」, テキストエンコーディングは「UTF-8(BOMなし)」という指定があります。Mac Book (OS X 10.6.4)でテキストエディットで打ち込んだ物を使っているのですが，その指定に該当するのか、もし違うのであれば、どう修正したらよいかわかりません。ご教示いただけたら幸いです。
- ベストアンサー
- Mac
Smartyで出力したHTMLコードが改行されない
PHPのテンプレートエンジンであるSmaryについて教えてください。 SmartyテンプレートをUTF-8、かつ改行コードLFで作成しました。（テキストエディタでちゃんと上記の通りなってるかも確認） ◯◯.tplとし、Webサーバを介して描画したところ、出力結果のHTMLのソースが改行されないで出力されてしまいました。（ブラウザでのHTML自体の描画はできているので、HTMLから改行のみ消えてHTMLがみにくい状態）なぜか<script>タグで区切ったJavascriptのコードの部分だけはちゃんと改行されています。 HTML部分も改行したいのですが、なにか設定が必要なのでしょうか。（以前、Smarty2.x系を使ったときは出力されたHTMLは改行されていました。）【環境】 OS：MaxOSX Lion Webサーバアプリ:ZendServerCE5.3.5 Smarty：バージョン3.1.4 テンプレート：UTF-８、改行LFで作成以上、よろしくお願いします。
- 締切済み
- PHP
jsp 改行コードで改行させて表示したい
はじめまして。 PostgreSQLから読み込んだ文字列データを表示させるtomcat+struts+servlet/jspを作成中です。データの文字列に含まれる改行が、クライアントに表示された際に反映されず困っています。過去ログも調べ、近い質問はありましたが、僕とは内容が微妙に違うようで、改めて質問させていただきました。例えば、あるテーブルのある項目に、 A B C というデータ（A,Bそれぞれの後に改行のある3行の文字列）があるとします。これを読み込みaction form bean（と言うのですか？setter/getterを定義する関数です）を介してjspに埋め込むと、できあがるhtmlでは、 ABC と改行されずに表示されます。 htmlで改行させるには「 」が必要なのかと、データ文字列に0x0dや0x0a、または0x0d+0x0aがあれば「 」に置き換えてaction form bean（？）のsetterに渡してjspを作ると、今度は、 A B C と「 」が文字列として表示されます。 htmlをソース表示すると、「A B C」で、親切にも「<」「>」をそれぞれ「<」「>」に勝手に置き換えあくまで文字列として表示してくれるようです。試しに改行コードを「 」に置き換えても予想通りその部分は とそのまま表示され、そのソースは「&lt;BR&gt;」でした。「<」や「<」等をそれぞれ「<」「&lt;」のように置き換える作業は、どこが行っているのでしょうか。また、改行位置で改行させるにはどうすればよろしいでしょう。 OSはwindowsXPです。無知ゆえに、つまらないことで悪戦苦闘しているのかも知れませんが、経験も浅くてよく解りません。宜しくお願い致します。
- ベストアンサー
- Java

UTF-32における改行コードって

質問者が選んだベストアンサー

お礼 2014/10/14 08:33

その他の回答 (3)

お礼 2014/10/14 08:33

お礼 2014/10/14 08:33

お礼 2014/10/14 08:33

関連するQ&A

注目のQ&A

カテゴリ
一覧

専門家に質問してみよう
専門家登録

あなたにピッタリな商品が見つかる！ OKWAVEセレクト

UTF-32における改行コードって

質問者が選んだベストアンサー

お礼 2014/10/14 08:33

その他の回答 (3)

お礼 2014/10/14 08:33

お礼 2014/10/14 08:33

お礼 2014/10/14 08:33

関連するQ&A

注目のQ&A

カテゴリ 一覧

専門家に質問してみよう 専門家登録

あなたにピッタリな商品が見つかる！ OKWAVEセレクト

カテゴリ
一覧

専門家に質問してみよう
専門家登録