• ベストアンサー

このような文字コードはありますか

アドレスの入力に使われているのを見た文字コードなのですが、「%26%2312521%3b」で全角カタカナの「ラ」を表すような文字コードはありますか。 ご存知の方は教えてください。

質問者が選んだベストアンサー

  • ベストアンサー
  • Werner
  • ベストアンサー率53% (395/735)
回答No.1

> %26%2312521%3b の%26、%23、%3bは、それぞれ&、#、;をURLエンコードしたものなのでこれを元に戻すと、 > ラ これはHTML中にかかれた場合は数値実体参照となり「ラ」と表示されます。 12521(16進表現では30E9)はUnicodeでのコード番号です。 http://ja.wikipedia.org/wiki/Unicode%E4%B8%80%E8%A6%A7_3000-3FFF http://ideas.paunix.org/utfrefcon.htm ここで入力に「ラ」を入れると、出力は「ラ」になるのが確認できます。

KanjiTalk
質問者

お礼

なるほど、とてもご丁寧にありがとうございます。

KanjiTalk
質問者

補足

余談ですが、文字列sを一文字ずつ読み込んだときに、 conv=""; for(i=0 ; i < s.length ; i++) { c=s.charCodeAt(i); if (c==1バイト文字) {conv=conv+escape(c);} else if (c==2バイト文字) {conv=conv+unicode(c);} } (unicode()はこちらで用意した関数)を実行したいのですが、1バイト文字と2バイト文字を振り分けるには、どうすればいいのでしょう。

その他の回答 (1)

  • Werner
  • ベストアンサー率53% (395/735)
回答No.2

> 1バイト文字と2バイト文字を振り分けるには、どうすればいいのでしょう。 Unicode(UTF-16)で考えると、すべて1文字2バイト以上になるので 1バイト文字はないということになってしまいますが、 他の文字コードで1バイトになることが多いASCII文字を振り分けるとするなら、 以下のようにコード番号が127以下の文字を1バイト文字とすればよいでしょう。 if (c<128) {conv=conv+escape(c);} else {conv=conv+unicode(c);} 半角カナの文字コードはかなり後の方にありますが、 これも1バイト文字と定義するならその範囲も含めてください。

KanjiTalk
質問者

お礼

なるほど、ありがとうございます。 入力はUnicodeではないので大丈夫です。 半角カナについては無視できる状況です。

関連するQ&A

  • CGI(Perl)の文字化けについて

    WEBフォームからの入力データをHTMLに加工して表示するというシンプルなCGIプログラムなのですが、 全角スペースの後に全角カタカナが入ると、全角スペースの部分から後が文字化けしてしまいます。 他はきちんと表示されているのですが、全角スペースとカタカナが続いているのが良くないみたいで、文字化けしてしまうようです。 全角スペースを取ってしまえばいいのかと思い、WEBで検索して色々と試してみましたが、変わりません。。 このような場合はどういう対処をするのが一番いいのでしょうか。 文字コードはEUCを使っています。(WEBフォーム、CGIとも) 教えてください。よろしくお願いいたします。

    • ベストアンサー
    • CGI
  • この文字コードは?

    大変お恥ずかしいレベルの質問です C#で印刷プログラムを作成しました プリンタ出口(注)で待ち構えて出力ログを取ったところ 半角文字の A ⇒ 0024 半角文字の J ⇒ 002D 半角文字の 1 ⇒ 0014 半角文字の 9 ⇒ 001C 全角文字の 印 ⇒ 0F33 全角文字の 験 ⇒ 3982 全角文字の に ⇒ 50D1 全角文字の る ⇒ 50F1 となって出力されています UNICODEやANSIであれば A は 0041 となると思いますが 0024 なのです これは如何なる種類の文字コードなのでしょうか? C#ですから当然UNICODEコードが使われていると思ったのですが・・・・・ 色々調べましたが分かりません 宜しくご指導お願い申し上げます (注)実際の印刷出力では ExtTextOutW API でプリンタに渡しています そこでこの ExteTextOutW API にフックを仕掛けてパラメータをダンプしたのです

  • コードの大文字・小文字について

    コードの大文字・小文字についての質問です。 たとえば、Text1.Textと入力をしたのに、 Text1.textと小文字にされてしまう事があります。 (そのコントロールは存在しています。) これを直す方法などについてご存知の方いらっしゃましたら、 アドバイス等を宜しくお願いします。m(_ _)m

  • 文字の判定

     こんばんわ。早速ですが、VBにおいて入力、又は取り込んできたデータの文字(1文字)が全角文字(漢字・ひらがな・全角スペース等)か半角文字(半角カタカナ・半角スペース等)かをみわける関数ってあるのでしょうか?

  • エクセル:文字列のバイト数が欲しい

    セルB1に、  半角スペース、全角2文字、半角スペース、 と入力しました。 このシートの別のセルに、 =Len(B1)と入力すると4と表示され、 =LenB(B1)と入力すると6と表示されますので、 間違いなく「半角スペース・全角2文字・半角スペース」がB1に入っているはずです。 このシートのコードに、 Private Sub Worksheet_Change(ByVal Target As Range)   If Target.Address = "$L$1" Then     MsgBox LenB(Cells(1, 2).Value)   End If End Sub と打ちました。 ここでシート上のセルL1に何か入力するとメッセージボックスが出るのですが、 メッセージボックスに出る値は8です。 何が原因でしょうか。 6が表示されて欲しいのですが(文字列のバイト数が欲しい)、 どのようにコードを書けばよいでしょうか。 実際にB1に入れていた文字は、 1B です。 (半角スペース・全角数字1・全角英字B・半角スペース)

  • Access2010 コードウィンドで変換できない

    Access2010 コードウィンドで変換できない お世話になりますm(__)m VBEのコードウィンドにコードを書く時に半角英数字は問題なく 入力できるのですが、その他は変換ができなくて文字化け(?) みたいに変になってしまいます。 入力例:エラー処理 ひらがな …… エrアーsyオリ 全角カタカナ …… エrアーsyオrイ 入力例:アイウエオ 半角カタカナ …… オエウイア この様な症状の原因また対策のわかる方は居りますでしょうか? よろしくお願い致します。

  • 文字コードでについて

    いつもお世話になっております。 以下の文字が、何の文字コードのエンコードか分かりません。 ご存知の方がいらっしゃれば教えて頂けますでしょうか? (文字) %u4f11%u6b62%u30fb%u89e3%u7d04%u30fb%u5fa9%u6d3b

    • ベストアンサー
    • Perl
  • Windows の文字コードで半角、全角のことが詳しく載っているホームページ

    こんにちは。 Windowsのプログラムを作っているんですが、全角で入力されている物を半角に直したいです。 そこで、Windowsの文字コード(Shift_JIS ?)の文字コード一覧が載っている、おすすめのサイトとかは、ないですか? 誰か知っている人がいたら、教えてください。よろしくお願いします。

  • QRコードの読み取り文字数について

    QRコードの使用例としてはサイトへの誘導やアドレス情報の登録などが多いようですが、 (2バイト文字の)テキスト情報のみを保持するQRコードを読み取る場合には だいたい何文字くらいまで読み取り可能なんでしょうか? (もちろん携帯の機種によって違いはあると思いますが) QRコード自体の収納可能文字数は、漢字、全角カナで最大1817文字までとありますが、携帯側でそんなに読み取れるのでしょうか? よろしくお願いします。

  • Excelで文字の長さを揃えるには

    excel95とExcel2000を使っています。 漢字やひらがな全角カタカナ全角英数字は2バイト、 半角カタカナ英数字は1バイト、 2バイトと1バイトの混在入力して20バイトの長さの文字列を比べると見た目の長さが違う。 同じ20バイトの文字列を見た目を揃える方法を教えてください。

専門家に質問してみよう