• ベストアンサー

メディアのフォーマットによる文字の認識

メディアのフォーマットによって異なる文字が同じ文字として認識されることがあったようですが、その理由は何でしょうか。 1、OSが大文字と小文字を混同する。 2、シフトJISの持つ根本的な問題。 3、JISコードとシフトJISコードの変換テーブルによる問題。 4、UnicodeとシフトJISの変換テーブルによる問題。 この中に正解はありますでしょうか?

  • Mac
  • 回答数1
  • ありがとう数1

質問者が選んだベストアンサー

  • ベストアンサー
  • harawo
  • ベストアンサー率58% (3742/6450)
回答No.1

Mac OS 標準(HFS)フォーマットではおっしゃることが起きます。 Mac OS 拡張(HFS+)にすると日本語でファイル名を付けてもそういう問題は起きません。 ※Mac OS XはHFS+のみ読み書きできる。HFSは2GB以上のボリュームを扱えない。HFSは時間をローカルで管理するので、インターネットで世界中のサーバーのデータにアクセスできる環境では、問題が起きる。などなど文字コード以外についても、HFSはすでに時代遅れのフォーマットと考えていいでしょう。 HFSは表面上日本語などの2バイト文字を扱えるように見えますが、内部では1バイトとして扱っており、2バイト文字は分割して1バイト文字ふたつと見なしています。これが一点。 もう一点は、Mac OSは大文字と小文字の区別をしないということ。 「HANABI」「hanabi」「Hanabi」どれも同じと見なします。それはMS-DOSでも同じです。つまりWindows OSも大文字と小文字の区別をしません。 ※HFS+は、内部ではUnicodeで処理しており、1バイト文字を2バイトとして扱い、日本語などの2バイト文字をそのまま扱います。 そういうわけで「1、OSが大文字と小文字を混同する。」が正解となるわけですが、混同しているのでなく、区別していないことは誤解のないようお願いします。 ※Mac OS XはUNIXをベースにしているので、大文字と小文字を区別します。

enoran
質問者

お礼

ありがとうございました。混同ではなく、区別していない・・・ですね。 Mac OS Xのことはまだよくわかっていません。勉強します。

関連するQ&A

  • TeraPadの文字コード

    TeraPadの文字コードについて教えてください。 1. TeraPadで扱える文字コードは Shift-JIS、JIS、EUC、Unicode、UTF-8、UTF-8N の6種類あるようですが、このEUCとEUC-JPは 同じものですか? 2. Shift-JISで保存すると、TeraPadの下の部分に 表示される文字コードがSJISとなります。 これはShift-JISのことですか? 3. 短い文章では文字コードを誤認識する場合も あるようですが、どうしたら正しく認識 させられますか? 指定した文字コードで保存できず困っています。

  • 文字コード体系について

    WINDOWS95の文字コードはシフトJISのみに対応していたと思うのですが、 このときアメリカなど海外で販売されていた WIN95の文字コードは何だったのかご存じありませんか? WINDOWSxpの文字コードはシフトJISと、unicode対応してると思うのですが、 海外で販売されている物は unicodeのみに対応してるのでしょうか。 それとも他に特殊な文字コード体系を持っているのでしょうか。

  • 文字コードを相互変換するには?(JIS,SJIS,EUC,UTF-8,UTF-16,Unicode)

    現在、文字コード一覧を JavaScript を使って動的にリストを作成する事を行っています。 そこで質問します。 『JavaScript』では文字コードの相互変換する方法はありますか? ある場合は関数、メソッドとその使い方を簡単でいいので教えて下さい。 もし標準では出来ない場合は、どのようにすれば相互変換できるのかその方法を教えて下さい。 ●相互変換コード シフトJISコード←→JISコード シフトJISコード←→EUCコード シフトJISコード←→UTF-8 シフトJISコード←→UTF-16 シフトJISコード←→Unicode 最終的に上記の相互変換を考えています。 変換を繰り返すことで実現できると思っています。 以上。相互変換の方法をお願いします。→JavaScript 歴1.5ヵ月です。

  • UTF-8で5~6バイトになる文字コード

    UnicodeのUTF-8で5~6バイトになる文字コードは、どのような場合でしょうか。(サロゲートペアのコードでも4バイトです。シフトJISから変換するとき、どのようなコードが5~6バイトに割り当てられるのでしょうか。) ご存知の方おられましたら、ご教示ください。

  • Windowsの標準文字コードについて

    標準文字コードはシフトJISとされていますが、 例えば、windowsでメモ帳を使って文字を書いて、保存をした時。 保存する時の文字コードは自由に選択できますよね。 この時点だと、どこにシフトJISコードが使われているのかはサッパリ分かりません。 それで考えたのですが、 文章を保存する時では無く、 メモ帳に書いている時に使われている文字が、 シフトJISなのでしょうか?(その文字を16進数としてみた時にシフトJISの文字コードになっている) つまり、 もともと、windows上でwebページのフォームに文字を入力するとか、 メモ帳で文章を書くと、 シフトJISとして書いている事になるのでしょうか?(シフトJISコードに対応した16進数で書いている) それを、例えばメモ帳ならシフトJISコードを違うコードに変換して保存する機能が付いている ブラウザには、その機能は無いから、フォームからはシフトJISコードとしてのデータしか遅れない。 そう考えると、 windows上では入力する全ての文字がシフトJISコードという事になり、 標準文字コードがシフトJISという言葉にも納得がいくのですが、 上記の理解で正解なのでしょうか? よろしくお願いします。

  • UNIXの文字について

    UNIX⇔WINDOWSでのデータのやりとりを実施したいのですが、 1、UINX(UNICODE)とWIN系(JIS)の文字コードの対応はどうすればよいのでしょうか? 2、UINX(UNICODE)とWIN系(JIS)の文字の変換はどうすればよいのでしょうか? 3、外字の対応はどうせうればよいのでしょうか?

  • Unicodeで編集できるテキストエディタってありますか?

    これまで「Unicode対応」を謳ったエディタの多くは 「Unicodeテキストの読み書きが出来る」エディタに過ぎませんでした。 つまりファイルを読み込むときにUnicode→シフトJISに変換し、編集は シフトJIS環境で行う……という。 保存も同様でシフトJIS→Unicode変換したのち保存します。 これだと確かにUnicodeテキストの読み書きは出来ますが、 Unicode最大に特徴であるJIS外文字のが入っているとシフトJIS変換時に 「?」になってしまいます。 編集もUnicode環境で行えて、Unicodeフォントを指定してやればJIS外文字も 表示できる、そんなフリーエディタってありませんか? 最近の「秀丸」で出来るようになったのは知ってるんですが……

  • 文字コード変換ツール

    テキストファイルの文字コード変換ツールを探しています。 変換を行うのは、Shift_JISとUnicode、Unicodeと韓国語、Unicodeと中国語 です。 私が試したのは、1行が512バイトを超えると切れてしまいます。 複数(多数)のファイルをまとめて変換できると尚可です。 (ちなみに、秀丸はあるのですが、何とかして、まとめて変換できないでしょうか。) OSはWindowsXP

  • Servletの文字化けについて

    Servletでブラウザから(1)や(1)などの文字をPostして 処理を行いたいのですが、"?"に変換されてしまします。 ユニコードに変換しなくてはならないまでは、わかったのですが SHIFT_JISから変換がうまく行きません。 このあたりの処理をアドバイスをお願いします。

    • ベストアンサー
    • Java
  • 保存する際の文字コードについて

    まったくの初心者です。 Windows上でエディタ等でVBScriptを書いた場合 保存する際の文字コードは シフトJIS(ANSI)、Unicode、EUC等のうち どれにすべきでしょうか。 どれでも問題ないでしょうか。