• ベストアンサー

PerlやApacheで各キャリアの絵文字を自動認識するモジュールを探

PerlやApacheで各キャリアの絵文字を自動認識するモジュールを探しています。 printするモジュールはあるみたいなのですが、formタグなどから打ち込まれた絵文字を自動認識してutf8なりsjisに変換して受け取るモジュールが分からなくて困っています。 現在考えうるのはとりあえずformで放り込まれたものをbainaryで受け取って全てマッチングさせるという方法ですが、やはりモジュールで高速したいと考えています。 そのようなモジュールや方法をご存じの方がいればURLだけでも結構なので教えていただ生きたいです。

質問者が選んだベストアンサー

  • ベストアンサー
  • kt_yuka
  • ベストアンサー率53% (8/15)
回答No.1

Encode::JP::Mobile CPANモジュールです。 逆に私はPurePerlのものを探しています。

参考URL:
http://search.cpan.org/~miyagawa/Encode-JP-Mobile-0.26/lib/Encode/JP/Mobile.pm
keeeeeeeen
質問者

お礼

お礼遅れました。 ありがとうございます!! PurePerlのもの探していたんですが、見つからなかったです。 教えてもらったのにお役に立てずごめんなさい。

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • ISO-2022-JPの絵文字の文字コードって!?

    私は今、文字コードについて学習中です。といっても、調べてる最中です^^; そこで絵文字の文字コードでつまずいています。 というのも、SJISとUTF-8の主要3キャリア(ドコモとKDDIとソフトバンク)の携帯用絵文字の文字コードはなんとか調べて見つけたのですが、JIS(ISO-2022-JP)は、何故かなかなか見つかりません^^; KDDIは合ってるのかは解りませんが、なんとか見つかりました! 他のドコモやソフトバンクは見つかりませんでした>o<; 各キャリア(ドコモとKDDIとソフトバンク) ・絵文字のJISコード一覧表をご存知の方は、いらっしゃいませんか? ・私が調べた絵文字のSJISとUTF-8の文字コードが合ってるのか確認するには何か良い方法は無いでしょうか? 長文になりましたが、よろしくお願い致します。

  • apacheでPHPの文字コードの認識について。

    とんちんかんな事を聞いているのかもしれません。 人様の質問に回答した際、分からなくなったのですが・・・。 Apacheってどうやって、PHPの文字コードを判断しているのでしょうか? いろいろな文字コードがあると思いますが、PHPなら、まぁ、SJISとEUCでしょう。 そもそも文字コードは、コードを考えた人が、ここの位置にはこの文字を、っていうお約束ですよね。 とうぜん、コードによって違うので、コードを間違えると文字化けが起こります。 これはブラウザーでも、テキストエディターでも、文字化けが起こります。 ここまでは、知っている知識です。 oeditというエディタは、私が使った中で文字コードの間違いが少ないですが、書かれている内容が短いとコードの自動認識が、うまく働かず、コードを間違えて読むこともあります。(体験 ということは、画像のようにこれはJpegとかGifとか、テキストの見えない部分に書かれてないと言うことでしょうか?(推測 もしそうなら、ApacheはどうやってEUCか、SJISか、他のコードかを区別しているのでしょうか? ローマ字は平気だけど、日本語は文字化けますよね。 たとえば、EUCで書かれているけど、Apacheでご認識してしまって、スクリプトは問題ないのに、エラーが起きることがあるのでしょうか? そもそもApacheはどうやって、文字コードを認識しているのでしょうか?

  • apacheのモジュールについて

    Apache初心者で勉強中です。 Fedoracore5既存のApache2でモジュールを追加する方法がわからず困っています。 具体的には、下記のことががわかりません。 1."mod_perl2"を入れたいが、Fedoracore5既存のApache2がインストールされているディレクトリが、どこを指すのかわからない。  ("/etc/httpd/conf/" or "/usr/sbin/"?) 2."mod_deflate"をコンパイルしたいが、"mod_deflate.c"のあるディレクトリがわからない。 また、よろしければでいいのですが、apacheは、「OS既存」と「ソースをインストールしたもの」、どちらが使い勝手がよいでしょうか。 お答えいただけると幸いです。 初心者ゆえ、もしかしたら、言葉のはき違いがあるかもしれませんが、よろしくお願いいたします。

  • トリガー内でperlモジュールを呼び出したい!

    mysql5.0.27で、テーブルにinsertしたデータ(文字列)をperlモジュールで変換し、変換後の文字列を別のテーブルにinsertしたいのですが、方法がわかりません。 perlを使いたいのは、すでにモジュールがあるということと、他の言語では文字列変換が面倒という理由です。 perlが呼び出せないのなら、Cとかで作り直してもいいのですが、まずはperlの呼び出し方を教えてください。それができなければ、Cでも構いません。 できそう/できないだけでもご存知でしたら教えてください。

  • Unicode-Japaneseでの絵文字変換

    Unicode-Japaneseを使って別キャリアの絵文字を相互変換しようと 思っています。 ソースはShift_JISで作成、画面表示もShift_JISです。 $in{text}はformからの受取です。Softbankの3G端末でテストしています。 入力を受け取り、一度、utf8に変換後、また元に戻しているつもりですが、 $str2を画面に表示しても、絵文字が化けてしまっています。 (普通のテキストなら化けません) 何か考え方が間違っているでしょうか。 以下、変換して戻している部分です。 うまくいった場合には、$str1 をデータとして保存しようと思っています。 $s = Unicode::Japanese->new($in{text},"sjis-jsky"); $str1 = $s->conv("utf8"); $s = Unicode::Japanese->new($str1,"utf8"); $str2 = $s->conv("sjis-jsky"); よろしくお願いいたします。

  • apache apxsによるモジュール追加

    apacheをconfigure時にmod_soを指定しインストールした場合、再コンパイル無しでモジュールの追加ができるという認識でしたが、 apache標準モジュールでも追加の出来ないものがあるのでしょうか? 下記サイトでは、rewrite_moduleの追加方法があるのですが、他のモジュールも同じ方法で出来るのでしょうか? 【参考サイト】 http://kazmax.zpp.jp/apache/apache3.html また、3rdpartyモジュールがあれば、ダウンロードしコンパイルする事で追加可能ですが。。。。 3rdpartyモジュールが無く、apache標準モジュールでも追加の出来ないものがあるのであれば、再コンパイルになると思うのですが.... apache標準モジュールでも追加の出来ないものがあるのか わかる方いらっしゃいましたら教えて下さい。 もし、追加可能であり、上記参考サイトの方法以外であれば、教えて 頂きたいのですが。

  • ~文字が認識されない?

    ActivePerl5.8.8 です。 sjisのファイルを読み込んで、utf8で出力しています。 +++++++++++++++++++++++++++++++++++++++++++ open (IN, '<', ${filename}); my $contents = do { local $/; decode('shiftjis', <IN>)}; close IN; open OUT, '>', "${out}.txt"; print OUT encode('utf8', ${contents}); close OUT; +++++++++++++++++++++++++++++++++++++++++++ "~"というsjisの記号文字が"?"となって出力されてしまいます。 "~"のまま出力する方法がありましたら教えてください。

    • ベストアンサー
    • Perl
  • [perl5.8] utf8で文字出力すると文字化けする

    perl5.8で、テキストをunicode(utf8)で出力したのですが、文字化けします。 ソースは以下のとおりです。 -----ソース----- use open OUT => ":encoding(utf8)"; open(OUT, ">utf8.txt"); print OUT "utf8だよ\n"; close(OUT); ----------------- できたファイルはutf8エンコードなのですが、 エディタで見ると「だよ」が文字化けします。 ちなみにフリーソフトで、SJIS形式の「utf8だよ」が 書かれたファイルをutf8に変換すると、文字化けしません。 フリーソフトで生成したutf8ファイルと、 自作perlで生成したutf8ファイルとを バイナリエディタで読込み比較すると 75746638E381A0E382880D0A (フリーソフト) 75746638C282C2BEC282C3A60D0A (自作perl) という差が出ています。 原因がお分かりになる方、知恵をお貸し願えますか。 よろしくお願いします。

    • ベストアンサー
    • Perl
  • uri_escapeしない方法について

    現在webページを作っているの者です。 (1)sjis設定のhtmlのformタグから(2)utf8で書かれたperlプログラムに送り、(3)その送られた文字をいったんDB(sjis設定のMySQL)に入れた後、(4)再びperlのプログラムでhtmlに吐き出すという、ごく普通のプログラムを書いています。 この際(2)のプログラムでuri_escapeし、(4)でuri_unescapeするという作業を行っています。 エスケープしないと文字化けてしまいます。 前にeucで書いたプログラムではいちいちこのような(escapeに関する)作業をせずともうまくいったのですが、今はこうしないとうまくいきません。 正直入力の度にエスケープするのは面倒なのですが、これを回避する方法はないでしょうか? サーバーはapache(ubuntu)です。 ご指南のほど宜しくお願い致します。

  • 絵文字のやりとりについて

    今、GmailをThunderbirdから利用するかたちで、iモード携帯とメールのやり取りをしています。 携帯側から送られたメールに絵文字が含まれている分については、外字をインストールすることで解決していますが、こちらからメーラーで絵文字を送りたいというとき、どうすればいいのでしょうか。 そうしようとしたとき、thunderbirdからUTFで送るかSJISで送るか聞かれたので、UTFで送ったときの相手の文字化けを考慮してSJISで送っているのですが、Thunderbird側で勝手に絵文字部が疑問符に変換されていて困ります。 要は、iモードページは別として、iモードメールの方はUTFに対応しているのか、ということです。 経験者の方、はたまたdocomoの方、知っている人なら誰でもいいので教えてください。 宜しくお願いします。