• 締切済み

文字コード

Linux等のUNIX系OSとWindowsを併用している環境で日本語を扱う場合、普通の日本語文字は適切に扱えても半角カナ文字は上手く扱えない場合があります。 知識としては知っており、半角カナを無意識のうちに避けていたりするのですが、なぜなのでしょうか。 ネット上での文字コードに関する項目はよく見かけるのですが、同じことなのでしょうか。 また、「表」や「ソ」等特定の文字が扱えないのはなぜなのでしょうか。

みんなの回答

回答No.1

http://www.zukeran.org/shin/jdoc/hankaku-kana.html http://ash.jp/code/code.htm に一応、説明があります >「表」や「ソ」等特定の文字が扱えないのはなぜなのでしょうか。 sjisの場合、これらの文字は "\" (5c) を含むためです perlスクリプトなどでも例えば print "がんばれ日本代表"; なんて書くと "表" の後ろ2バイト目に \ が有る為後ろ側の " を無効にしてしまうので つまりは print "abcde ; と言うように後ろの " を書き忘れたのと同じ事になり、エラーになります

関連するQ&A

  • 文字コードについて

    宜しくお願いします。 Windows、Linux、UNIX、MAC・・・と色々なOSがあると 思いますが、それぞれで使える文字コードについて 説明が書かれているサイトはありますか? 例えば、Linuxについて検索したりして探してみますと、 日本語EUCがデフォルトということぐらいしか記載がありません。 他には何が対応しているのかという情報を入手するにはどこにアクセスすれば良いのでしょうか? また、書籍などはありますか? どうぞ宜しくお願い致します。

  • ファイルの文字コード

    パソコンの文字コードには、Shift-JISやEUCなど様々な形態があるようなのですが、 日本語(漢字、半角カナなど)を使用していないファイル=英語のみのファイル ではファイルの文字コードというのはどれでも同じなのでしょうか? 初心者な質問ですが、何卒よろしくお願いします。

  • 半角カナ「ヲ」の文字コードはなぜ…

    「技術者向けコンピュータ」には素人の私ですが、掲題の件は此処が適当と勝手に判断して質問いたします。最適なカテゴリーがあれば教えてください。 平仮名も全角カナも概ね五十音順に文字コードが割り当てられています。 だから、コード昇順だと「ぁあぃいぅう・・・わゐゑをん」「ァアィイゥウ・・・ワヰヱヲン」と並びます。 ところが、半角カナの「ヲ」は他のどの半角カナよりも若い文字コードが割り当てられていることに、最近になって気付きました。 調べてみると、半角カナは文字コード昇順で「ヲァィゥェォャュョッ-アイウ・・・ワン」(此処では便宜上 全角カナで示しましたが、すべて半角カナとご理解ください。半角カナの「ヰ」「ヱ」は存在しない)と並びます。つまり、「ヲ」は「ワ」と「ン」の間に来ない! 半角「ヲ」に他のどの半角カナよりも若い文字コードが割り当てられた経緯をご存知の方がいらっしゃいましたら、その理由を教えてください。

  • 文字コードについて

    仕事場のワークステーションがUNIX→Linuxに移行することが決まりました。 そこで現在使用しているUNIXのプログラムをLinuxにコピーしたのですが、文字コードがおかしいのか文字化けして動作しません。 動作としては プログラムを立ち上げる    ↓ 環境設定ファイルを読み込む    ↓ 上手く起動する 正常なら上記の動作ですが、環境設定ファイルが読み込めず停止してしまいます。 そこで環境設定ファイルを開くと文字化けしてました。 その後、今までのUNIX上での環境設定ファイルをlessで表示させ、 新たなLinuxマシンにviでコピー・ぺ-ストして保存したところ 正常に動作しました。 操作は別端末のTeraTaermで行っています。 これはLinuxマシンの文字コードがUTF-8のためEUCが認識できないからでしょうか? 行き詰ってますので、どうかお願いいたします。 Linuxの環境は Red Hat 8.0のエンタープライズ版です。

  • HULFTの英数カナ拡張文字の配信ができない

    AS/400からHULFTでデータを配信すると、半角カナは正しく受信されるのですが英半角小文字が空白になってしまいます。 ASのホストコードページは 「930 日本語英数カナ拡張」です。 受信側はRed Hat Enterprise Linux v5 を使用しています。 HULFTの設定 「EBCDICセット」をすべて試してみたのですがダメでした。 「転送タイプ」は、T:TEXTで設定しています。 どのような設定にすれば半角カナと英小文字が正しく配信・受信できるのか教えていただけないでしょうか。 よろしくお願いいたします。

  • Shift-JISの文字と改行コードについて

    TEXTAREAで入力した値をDBに対して、 .htmlspecialchars(mysql_real_escape_string(stripslashes($_POST["in3"])),ENT_QUOTES) の記述で保存した時、 文字化けコード(「ソ」「表」)が入っている場合に改行を行うと、 改行部に「\r」が文字として保存されてしまいます。 また、文字化けコードがない場合には「\r」は表示されず、 文字化けコードと改行までの間に半角英数字が入っていると「\r」は表示されません。 このような状態になる理由や回避方法についてコメントいただきたく思います。 よろしくお願いいたします。

    • ベストアンサー
    • PHP
  • 文字コードを選択する基準?判断材料?

    どの文字コードを使ってプログラムを開発するか選択するときは どういった基準で選べばよいのでしょうか webサーバがwindowsまたはlinux,unixの場合によって使い分けないと 文字化けするため windowsの場合はshift-jisでlinuxの場合は????とか決まっているのでしょうか どういった基準で文字コードを選択すればよいのでしょうか プログラミングする時のパソコンのOS?それともwebサーバのOS?

    • ベストアンサー
    • PHP
  • gooメールの文字化け

    gooメールで受信したメールが文字化けして読めないものがありました。(メルマガなんですが) 解決方法を、ヘルプにて確認したら、こんなことが書いてありました。 ↓ 送信、もしくは受信したメール本文の中に半角カナ文字や半角特殊文字(句読点等)が入っている際に、文字化けが起こる場合がございます。 メール本文に含まれていないことをご確認の上、送信を行っていただきますようお願い致します。 また、ブラウザの文字コードを「日本語自動判別」にしていただくことで、解決する場合もございますのでお試しいただくようお願い致します。 ブラウザの文字コードを「日本語自動判断」にするには、どうやって設定すればよいのでしょうか? どなたか、詳しい方教えてくださいませ。

  • 文字コード

    unixで記述したファイル(恐らくはEUCコードと思われます)はDOS環境や、場合によってはunix上のviやlessなどでも、 ^M が行末に表示されてしまいうっとうしいことがあります。 1)この制御コードは一体何なのですか? 2)どのような場合、この制御コードが挿入されますか?あるいは、どのような場合、このコードが表示されるのですか? 3)"^M"が表示されてしまっている場合、どのようにすれば表示がされなくなるのでしょうか? (その場しのぎ的ではあるが、nkf -s などとしてSJISに変換させれば、dos系のvi や lessではまともに表示されます。他の方法を教えてください...例えば、vi や lessを文字コードを指定して起動するなど...) #そのほか、文字コード関連でツボが有りましたら教えてください。

  • ネット上での文字コードの取り扱いについて

    あるWebページがあるとそれはそれを作成したOSなどに依存した文字コードで作成されているとおもいます。 それを表示するブラウザは通常自動でその文字コードを認識して人間がわかる「文字」として画面に表示されるとおもいます。 ところで、ブラウザの画面から文字を入力させた場合、その文字コードはどこで決定されるのでしょうか? A(OS 日本語Windows)、B(OS UNIX)というネット上のPCがある場合それぞれから入力された文字コードは異なるのでしょうか? 異なる場合、AとBからの入力情報をデータベースに保存する場合統一した文字コードで保存する必要があるとおもいますが、いちいち文字コードを判断して変換しているのでしょうか? 文章がへたですいませんがご教示ください。

    • ベストアンサー
    • PHP