• 締切済み

Rubyで%uxxxのデコード

JavaScriptで、UnicodeEscapeSequenceなる形式で出力された文字列があります(例えば (%u3053%u3060%u308F)。 これを人間が読める形にRubyでデコードしたいのですが、どんなライブラリを使えばいいのか、皆目見当もつきません。どなたかヒントだけでも教えて頂けないでしょうか。

みんなの回答

  • sholmes
  • ベストアンサー率81% (89/109)
回答No.2

\エスケープ&Ruby1.9だと、そのままの形で利用できそうです。 ちなみに、%から始める形式ってメジャーなんでしょうか? 簡単にまとめてみました。 http://ideone.com/uM8X1

全文を見る
すると、全ての回答が全文表示されます。
  • osamuy
  • ベストアンサー率42% (1231/2878)
回答No.1

検索してこんなのとか。 http://www.ideone.com/OwhPt

参考URL:
http://www.google.co.jp/search?hl=ja&q=ruby+%25u+unicode+escape&lr=lang_ja
全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • URLエンコード(JavaScript)をデコード(JSP)する方法

    JavaScriptでescapeでエンコードした文字列をJSPで取得しデコードするにはどのようにしたらよいのでしょうか? JavaScriptで言うところのunescapeにあたるメソッドはJavaでは何になるのでしょうか? URLDecoder.decodeを利用して String P = ""; P = URLDecoder.decode("%u304A%u306F%u3088%u3046","UTF-8"); としていますが、上手くデコード出来ません。

    • ベストアンサー
    • Java
  • エスケープされたunicodeのデコード

    "\u063A\u0629" 上記のようなエスケープされたUnicodeの文字列を C言語でデコードしなければならないのですが、 何か利用できる関数や、変換ルールなどはないでしょうか? Javascriptなどでは簡単に出来るようなのですが、 C言語の説明は見つけられませんでした。 上記文字列はJSON形式で得られたものなのですが、 どうしてもC言語でデコードする必要があり、困っております。 ちなみにOSはLinuxで、iconvなどはインストール済みです。 エスケープされているせいか、そのままでは変換できないようです…。 ご存知の方がいらっしゃいましたら、是非ご教授お願いいたします。

  • RubyでのUnicode→sjis

    Rubyで、 「\u3053\u3093\u306B\u3061\u306F 」のようなエンコーディングされた文字を、 「あいうえお」とShift-JISで表示するにはどうすればいいのでしょうか JavaScriptでは、 unescapeで一発なんですけど…

    • ベストアンサー
    • Ruby
  • UTF-16のデコード方法

    いつもお世話になっております。 Perlにて、以下のUTF-16の文字コードをデコードしたいのですが、 どのように記述すればデコード出来るのでしょうか? ※PerlのVerは5.8です。 (文字コード) %u4f11%u6b62%u30fb%u89e3%u7d04%u30fb%u5fa9%u6d3b よろしくお願い致します。

  • C# asp.net HTMLタグのエスケープ文字のエンコード・デコード

    htmlタグをエスケープされた文字列を送受信するASPXをC#で作成しています。 .NETでは、エンコード・デコード用のライブラリが用意されていますか?ない場合は どのように実現しますか? ・参考(JavaScriptでHTMLをエスケープ文字へエンコード) http://htmlconverttext.naglly.com/

  • 特殊な文字列のデコードについて

    ご教授願います。 迷惑メールなどに多いのですが、下記の様に記述されている文字列があります。 ↓↓↓↓↓↓ =1B$B"(%a!<%k1\MwL5NA"(=1B(B 上記の文字列をフリーウェアの「MBaker2」でデコードすると ↓↓↓↓↓↓ ※メール閲覧無料※ の様に、読める形の文字列に変換されます。 こうした形で意図的にエンコード(?)された文字列をPHPを使ってデコードするにはどうしたら良いのでしょうか? メールクライアントのOutlook Express6等でも読めるので、一定の法則に則って変換されていると思うのですが、そのアルゴリズム(?)が判りません。 PHPのマニュアルを調べてデコード系の関数を色々と試してみましたが、どうにも上手く行きません。 前述の「MBaker2」のヘルプから、HTML特有の制御文字列と漢字コードが関係している所までは判ったのですが、ココで壁にぶつかってしまいました。 PHPで人が読める形にPHPで処理するにはどうしたら良いのでしょうか? 宜しくお願いします。 P.S PHPのバージョンは 5.2.6 を使い、PHPでの入出力は、UTF-8で統一しています。

    • ベストアンサー
    • PHP
  • ユニコードへの変換について

    JavaScript で %82%A0 ・・・といったデコードされた 文字列から、ユニコード %u3042・・・ へ変換する 方法を教えてください。なにとぞお願いします。

  • メールのデコードについて(RFC2231)

    よろしくお願いいたします。 メーラー(Becky!やALMAIL等)によっては、RFC2231形式で添付ファイル名をエンコードして送信していますが、RFC2231形式で送信された添付ファイル名をデコードする方法をご教授いただきたく。 下記の@ITで紹介された記事によるとRFC2231形式は%の後ろ2文字の16進数がエンコードされた文字コードであるとなっています。 http://www.atmarkit.co.jp/fnetwork/rensai/netpro04/netpro01.html しかし、Becky!等のメーラーでは、下記の【】内のように、%の間が2文字以上の場合や、ASCII文字列は直接埋め込まれてしまうパターンがあります。 【filename*=iso-2022-jp''%1B%24B%24%5B%242%24%5B%242%1B%28B%2Etxt】→元は【ほげほげ.txt】 ASCII文字列が直接埋め込まれている部分は何とかなるとして、%24B%のような部分はどのようにデコードするのでしょうか? もしかしてBはBASE64?

  • Rubyでpdfファイルを読み込む方法

    Rubyでpdfファイルを読み込む方法を探しています。 file = open("sample.pdf", "r") file.each { |f| puts f } というコードを書いて実行すると文字化け?したようになったり、数字ばかりの行が挿入されていたりと、txt形式のファイルを読み込んだ時の様に文字が正しく出力されません。 何かpdfを読み込む正しい方法があるのでしょうか。 また、直接読み込むことはせずにpdftotext.exeを使って予めtxt形式に変換しようと考えたのですが、Rubyのスクリプトの中でpdftotext.exeを使う方法が分かりません。 解決方法をご存じの方がいらっしゃいましたら教えて頂けないでしょうか。 環境はWindowsです。よろしくお願いします。

    • ベストアンサー
    • Ruby
  • JSONエンコードの際の問題

    PHP5.2.6とJavascriptの間で、JSONを用いてデータをやり取りしていますが、JSONエンコードの際に文字列がUnicodeエスケープ(\u3000のような形)されてしまい、データサイズが肥大化して困っています。 本来3バイトで良いところを6バイト消費していますので、全体としては約2倍弱のサイズのデータをやり取りすることとなってしまいます。 UTF-8のまま出力するライブラリ等はありませんでしょうか? php-jsonやJsphon等を試してみたのですが、いずれもUnicodeエスケープされたjson文字列が出力されてしまいました。 宜しくお願い致します。

    • 締切済み
    • PHP