• ベストアンサー

文字コードを指定する際sjisなのかshift_jisかshift-jisなのか

お世話になります。 perl5.8において文字コードを指定or変換する際 shift_jis shift-jis Shift_JIS SJIS EUC_JP EUC-JP utf-8 utf8 -と_の違いや大文字小文字の違いなど記述の違いを良く見かけるのですが、実際決まった指定方法などはあるのでしょうか。 逆に文字コードを指定する際、●●のように指定しても無効で●●のように指定しないと有効ではないですよ。。みたいな。 またperlに限らずPHPやHTML、XMLなどではどうなっているのでしょうか どなたかご存知の方いましたら ・上記3つの文字コードについてと ・perlのバージョンの違い、言語の違いなど 文字コードの文字列の指定に関する全般についてご教授願えませんでしょか。 宜しくお願い致します。

  • taku0
  • お礼率80% (160/199)
  • Perl
  • 回答数2
  • ありがとう数2

質問者が選んだベストアンサー

  • ベストアンサー
回答No.2

文字コードを指定するモジュールによって、指定する文字列が違う場合があります。 たとえば、JcodeでシフトJISコードを指定するときはは'sjis'ですが、 Encodeでは次のような正規表現になります。 /\bshift.*jis$/i /\bsjis$/i これは、shift-jisでもShift_jisでもsjisでもSJISでもマッチします。 極端な話、shift(・∀・)jisでもマッチします(多分) 他の文字コードでも同様に正規表現でエイリアスが設定されていますので、詳しくはEncodeモジュールのperldocを参考にしてください。

taku0
質問者

お礼

モジュール毎に文字コードの文字列の指定を正規表現で指定してあるんでしょうかね。確認してみます。 ご教授頂きありがとうございました。

その他の回答 (1)

noname#20378
noname#20378
回答No.1

適当に検索かけて見つけただけなので自信ないですが CHARACTER SETS http://www.iana.org/assignments/character-sets というのがありました。検索かけるとわかりますが Shift_JISはあってもShift-JISは存在しません EUC-JPはあってもEUC_JPは存在しません 大文字小文字の区別は多分無いと思います。 根拠はありませんがそういう話を聞いたことが無いので・・・

taku0
質問者

補足

お返事大変遅くなりましたが、上記URLを参考にさせて頂きました。 とりあえず、EUC_JPは存在しない事とモジュールを呼び出す際 エラーになったケースもあり、エラーにならない場合=OKという あいまいな認識ですが、とりあえずよしとしておこうと思います。 参考URLもご掲示頂きありがとうございました。

関連するQ&A

  • TeraPadの文字コード

    TeraPadの文字コードについて教えてください。 1. TeraPadで扱える文字コードは Shift-JIS、JIS、EUC、Unicode、UTF-8、UTF-8N の6種類あるようですが、このEUCとEUC-JPは 同じものですか? 2. Shift-JISで保存すると、TeraPadの下の部分に 表示される文字コードがSJISとなります。 これはShift-JISのことですか? 3. 短い文章では文字コードを誤認識する場合も あるようですが、どうしたら正しく認識 させられますか? 指定した文字コードで保存できず困っています。

  • Perlの文字コード

    1-2年ほど前、Perl5.8でソース自体をUTF8N(LF)で記述するようになり、 以下のように書いていました。 use utf8; use encoding "utf8"; use Encoding; それからPHPに移り、PHPでは、ソースはEUC-JP、DBもEUC、HTMLに出力する際もEUC-JPで統一していました。 最近またperlを使い出して疑問に思ったのですが、 perlではどのような文字コードで統一すれば一番よいのかということです。 javascriptはUTFだと動作しない端末(ザウルス)などあり、 perlもEUC-JPで統一しようと考えています。 昔、UTF8にこだわったのは、おそらく 「構」という文字は5Cなので、 文字コードによる不具合(ソース,js,cssで)を避けるためと、流行のUTF8にしたと思います。 perlでEUC-JPで文字コード統一させるメリットデメリットが知りたいです。 最近perlで書かれたサイトでHTML出力がShift_JISだったのですが、perlソースもシフトJISかは知りませんが、Shift_JISで統一するデメリットが知りたいです。 あと、WEBでどの文字コードが現在主流で、今後どうなるかも知りたいです。 EUC-JPで安泰なら、話は早いですが・・・

    • ベストアンサー
    • Perl
  • HTMLの文字コードって結局どれがいいの?

    HTML作成の際、文字化けを防ぐためにたいていは使用する文字コードを指定することになると思いますが、種類が沢山あってどれを使っていいのやらよくわかりません。私の知る限り、 Shift_JIS x-sjis EUC iso-2022-jp などが使われていると思いますが・・・。 いったどれがいいんでしょうか?それぞれの特徴や、一般的な傾向など、わかりやすく説明していただけないでしょうか?

    • ベストアンサー
    • HTML
  • FC2は文字コードはShift-JISしか使えな

    FC2は文字コードはShift-JISしか使えないのですか? EUC-JPでもUTF-8でも 日本語部分が��������になってしまいます。 添付画像は、UTF-8の時の例です。

    • ベストアンサー
    • HTML
  • 文字コードの選択

    PHP+HTML(XML)をするにおいて、最も良い文字コードは何にしたら良いでしょうか?さいきん,特に  UTF-8,UTF-16 を聞きますが、  EUC,SJISなどの方が良いのでしょうか? また、それらの特徴とは,どのようなものでしょうか?  ASCIIも良いのでしょうか?

    • ベストアンサー
    • HTML
  • PostgreSQLの標準文字コードをShift_JISにしたい

    CygwinでPostgreSQLを動かしています。 PostgreSQLの標準文字コードをShift_JISにしたいんですが、どうコマンドを打てば良いか分かりません。 本にはEUC-JPを指定する際は $ initdb -D /usr/local/pgsql/data -E EUC_JP と打つと書いてありますが、EUC_JPの部分をShift_JISとするとエラーになります。 Shift_JISに設定するにはどのように打てばよいんでしょうか?

  • 文字コード

    ホームページを作る際の文字コードはどうやって決めればいいですか? 何を基準に決めればいいですか? とりあえず今は暫定的にUTF-8で作っていますが、 Shift_JISやEUC-JPを使う場合、どういう時が適しているのでしょうか?

  • 文字コードsjisをUTF8に書き換えたい

    CGIの勉強中の者です。 文字コードはSJISで保存しているCGIをUTF8コードに換えるには何が必要でしょうか? HTMLならmeta内をSJISからUTF8に変更し、TeraPadなどのテキストエディタでUTF8に保存すればオッケーなんですが。 CGIの場合はHTMLと違って、換えるには複雑なのでしょうか? CGIプログラムの中では以下の「sjis」を「UTF8」に書き換えし、UTF8で保存しましたけど、文字化けが出てます。 <meta http-equiv="Content-Type" content="text/html;charset=shift_jis"> &jcode'h2z_sjis(*contenido) &jcode'convert(*subject,'sjis'); &jcode'convert(*infor,'sjis'); &jcode'convert(*contenido,'jis'); &jcode'convert(*res_msg,'jis'); print "Content-type: text/html;charset=shift_jis\n\n"; 宜しくお願いします。

    • 締切済み
    • CGI
  • 文字コードがUTF-8のサイトにshift_jisの入力フォームを組み込んだのですが、、

    教えて下さい。 同じような質問があったのですが、解決しなかったのでお聞きしたいのですが、現在、文字コードがUTF-8のサイトに、配布されていたcgiを使い、入力フォームを作っているのですが、こちらは文字コードが shift_jisになっています。なので、そのページだけshift_jisでもいいかなと思い、本体に使っているcssをそのまま使おうとしたところ、CSSの文字コードがUTF-8になっており、多少フォントの指定が入っていまして、これを読み込むとIEでおかしなことになってしまいました。こういった場合やはりフォントの指定をはずした方がよいのでしょうか? 後、CSSでUTF-8でフォントファミリーの指定をしていた場合、HTMLファイルの方がshift_jisになっているとやはりフォントはでないのでしょうか? 分かりずらいですが、宜しくお願いします。

  • EUC-JPとShift_JISのどちらがいい?

    ホームページ制作の時に指定する文字コードについて Shift_JISとEUC-JPのどちらがいいのでしょう? 今までは私自身Shift_JISを使っていましたが、会社的にEUC-JPに統一しようという動きになってきていて、デメリットがあればやめようかなとも思っています。 メリットとデメリットがあれば教えてください。 また、各データベースを使ったりもします。

    • ベストアンサー
    • CSS

専門家に質問してみよう