UnicodeとUTF-8の違いとは?

このQ&Aのポイント
  • UnicodeとUTF-8は、テキストの保存形式に関連しています。
  • Unicodeは文字コードを表し、UTF-8は符号化方式を表します。
  • iPhone/iPadでテキストファイルを扱う際には、UnicodeまたはUTF-8のどちらかに統一する必要があります。
回答を見る
  • ベストアンサー

保存形式としてのUnicode、UTF-8

「Unicode、UTF-8 違い」などでネットを検索すると Unicode・・・文字コード UTF-8・・・符号化方式 とのことで、同次元のものではないとのこと。 しかし、 さくらエディタ、TeraPadなどのテキストエディタの保存形式に Unicode、UTF-8などがあるのですが、この違いは何でしょうか? 前提として、iPhone/iPadにてテキストファイルを扱おうとすると Gmailの添付ファイル、Dropboxなどで文字化けする(デコードできない)ので どちらかの形式に統一しようと思ったのですが、 あとあと困るといやなので、正確に理解したいと思った次第です。 どうぞよろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • Fushino
  • ベストアンサー率59% (329/550)
回答No.2

おそらく、Unicode=UTF-16だと思います。 そのエディタの保存形式の表記としてUnicode、UTF-8としているだけでしょう。 Windowsのメモ帳の文字コードがUnicodeとUTF-8となっていますからそれに合わせたのではないでしょうか。

yn001ster
質問者

お礼

ありがとうございます! いただいた回答を元に さらに調べることができ解決できました! 「Unicode」=UTF-16でした。 ありがとうございます! http://una.soragoto.net/topics/9.html

その他の回答 (1)

noname#194317
noname#194317
回答No.1

困るも何も、iPhoneなりiPadで化けないのはどれなのかを突き止めて、それに統一するしか道はないのでは?私の方でググったところでは、iPhoneはUTF-8が標準として採用されているとのことでした。 なおUTF-8に関しては、一度wikiの解説にも目を通しておいた方がいいでしょう。これで、なぜUnicodeとUTF-8が別々に用意されているのかが解ります。 http://ja.wikipedia.org/wiki/UTF-8

yn001ster
質問者

お礼

ありがとうございます。 おっしゃる通り、 「iPhoneなりiPadで化けないのはどれなのかを突き止めて、それに統一するしか道はない」 と思います。 SJIS、EUC、UTF-8(BOMあり/なし)、Unicode(BOMあり/なし)でテストしたところ、 閲覧できたのが UTF-8(BOMあり)とUnicode(BOMあり)だったので、質問させていただきました。 wikipediaも読んだのですが、私には難し過ぎてまったく理解できません。 申し訳ありません。 ありがとうございます。

関連するQ&A

  • UTF-8での保存について

     エディットボックスに入力してある日本語の文字列をUTF-8やUTF-8Nでテキストファイルに保存したのですがうまくいきません。  UTF-8の場合はファイルの先頭に3バイトのBOMをつければいいらしいので、 ファイルの先頭に0xEF,0xBB,0xBFの3バイトを追加してテキストファイルに保存しましたがメモ帳で開くと文字化けします(メモ帳で開くときは文字コードをUTF-8にして開いてます)。 作成したテキストファイルをバイナリエディタで開いてみると先頭の3バイトはEFBBBFとなっているので何も問題はないと思うのですが、どうして文字化けするファイルができてしまうのでしょうか? --- 実行環境 --- Microsoft Visual C++ 2010 Express WIN32 ユニコードビルド C言語

  • テキストをUTF-8で保存するため

    テキストをUTF-8で保存するため以下に http://madeinpc.blog50.fc2.com/blog-entry-308.html 『•文字コードを指定できるテキストエディタ(Terapadなど)』を使用するように 『「UTF-8」なので、メモ帳でそのまま保存したテキストファイルは使用できません』 との記述があります。 意味がどうも分かりません。Windowsに標準付属しているメモ帳で「名前をつけて保存→文字コード→UTF-8」としてやれば同じことではないかと思うのですが如何でしょう? よろしくお願いします。

  • GmailでUnicode(UTF-8)をフィルタするには

    Gmailで受信したメールを他の複数のアドレスに条件毎に転送しようとしています。 件名(日本語)で振り分けたいのですが、文字セットがISO-2022-JPの場合は フィルタテストすると検索結果に表示されますが、 文字セットがUnicode(UTF-8)のメールはフィルタにかからないようです。 Unicode(UTF-8)のメールもフィルタする方法があるのでしょうか。

  • Unicodeについて質問です。

    Unicodeについて質問です。 あるテキストファイルからUnicode文字を検索したいと思っています。 Unicode形式で保存したくないテキストファイルがあるのですが、どうやらどこかにUnicode文字を使ってしまったようで検索に手間取っています。 かなりの文章量のテキストファイルなので目で探す事は非常に困難で、仕方なくUnicodeコード表を元に一文字ずつ検索しているのですがなかなかヒットしません。 アラビア語のような特殊な文字を記入した記憶はないのですが、こちらのコード表(http://nurucom-archives.hp.infoseek.co.jp/digital/unicode-table.html)によると半角数字もUnicode文字となっていたりするようで知らずに入力した可能性が高いです。 できればテキスト貼り付け(方言変換サイトなどのように)でUnicode文字を検索できるサイトか、もしくはフリーソフトのようなものはありませんでしょうか。 Unicodeについて教えていただけるだけでも助かります。よろしくお願いします。

  • PythonのUnicode文字について 

    PythonのUnicode文字について  最近pythonを始めました。このサイト(http://www.pythonweb.jp/index.html)でいろいろと勉強しているのですがUnicode文字についてよくわかりません。 #coding: UTF-8 print u"こんにちは" と入力するとなぜか File "test.py", line 2 print u"こんにちは" SyntaxError: (unicode error) 'utf8' codec can't decode byte 0x82 in position 0: unexpected code byteと表示され出力されませんでした。何故でしょうか。unicode文字についても説明をお願いします。

  • UTF-16テキストファイルの作成

    エクセルで作成したデータをUTF-16形式で保存したいのですが、 「名前をつけて保存」でファイルの種類を選ぼうとしても、 該当の形式が見当たりません。 Unicodeテキストで保存してからメモ帳で開いて文字コードを変更しようとしてみましたが、UTF-8しか選択肢がありません。 どなたか方法を知ってる方、教えてください。お願いします。

  • UnicodeでないファイルをUnicode保存

    いつも楽しく勉強させていただいております。環境はWin7Office2010です。 ExcelVBAからFSOを用いてCSV形式のファイルを読み込み、多少の加工をして最終的にはSQLServerに取り込むという作業をしています。 問題はCSVファイルのことなのですが、どうやらUnicodeでないようでFSOで開くと文字化けしてしまうものがあります。 Excelやワードパッドで開くとちゃんと読めます。 StrConv関数でUnicodeに変換しようとしたのになぜかできませんでした。 今回はファイル数が少なかったので、手作業でワードパッドで開き、保存の形式をUnicodeにして事なきを得ましたが、今後同様のファイルを多数処理しないといけないので手作業での変換は難しいです。 そこで、こんなことは可能でしょうか。 ・ExcelVBAで非Unicode形式のファイルを読み、Unicodeで別ファイルに書き出す。 または、 ・ExcelVBAでワードパッドなどを制御し、自動的にファイルを開いてUnicodeで保存しなおす。 ついでといっては何ですが、そのファイルの文字コードが何であるかはどうやって分かりますか。 できればVBAを介して調べる方法があれば教えてくださるとうれしいです。

  • Unicodeの文字がどれか、調べたいです

    ある文章をメモ帳で保存しようとしたら「このファイルはANCIテキストファイルで保存すると失われてしまうUnicode形式の文字を含んでいます。Unicodeの情報を保存するには、[文字コード]から[Unicode]を選択してください」と出ました。どれがUnicodeの文字なのかを調べる方法を探しましたが、アテになるのが全くありません。また、「[文字コード]から[Unicode]を選択する」という言葉の意味も分かりません。文字コード表を開きましたが、その後詰まりました。 限りなく分かりやすい説明をお願いします!

  • ユニコード

    IMEパッドの使い方、保存のしかた IMEパッドのunicodeを入力したのですが保存をしようと思うとこのファイルはANSIテキストファイルとして保存すると失われてしまうunicode形式文字を含んでます。 unicodeの情報を保存するには、下のキャンセルをクリック、文字コードからunicodeを選択してください。続行しますか?OK キャンセルとでます。OK キャンセルをどちらもおしてみたのですが ?としか保存できませんどのようにすると保存できますか?パソコンしょしんしゃです。よろしくおねがいします

  • 【文字コード】UTF-8だとDreamWeaver→terapadコピペで文字化け

    ドリームウィーバー8(Win-XP)使用者です。 PHPを作成しているため、テキストエディターの文字コードをUTF-8に統一しています。(クライアント都合) しかしながら DreamWeaver→terapad で文字をコピペすると文字化けを起こします。どちらもUTF-8にしているのに… 一体どうすれば回避できるのでしょうか? *terapadのかわりに秀丸にペーストするなら文字化けはおきません。(terapadが好きなので極力terapadを使いたい) *DreamWeaverについては、「Ctrl」+「J」→「タイトル/エンコーディング」→「エンコーディング=UTF-8」の設定です お詳しい方、よろしくお願いいたします。

    • ベストアンサー
    • HTML

専門家に質問してみよう