• ベストアンサー

UTF-8でエンコーディングとはどういうことですか

UTF-8でエンコーディングをしたものでないと動作しないので、 UTF-8でエンコーディングしたいのですが、どうしたらいいですか? また、UTF-8でエンコーディングとはどういうことですか?

質問者が選んだベストアンサー

  • ベストアンサー
  • jo-ji
  • ベストアンサー率72% (26/36)
回答No.2

#1の方のおっしゃられるとおり、これだけの内容では判断しにくいのですが、何かに必要なファイルがUTF-8でなければならないと仮定して話を進めます(もし違っていたら、補足して下さい)。 まずエンコーディングについて、ここでは、以下にあるような意味です。 http://www.atmarkit.co.jp/aig/01xml/encode.html もう少し分かりやすく要約すると、文字をコンピュータで扱えるようにコード(数値)を割り振ることです。 この割り当て方にはいくつかの種類があり、WindowsではShift_JISが、UNIX系ではEUCが一般的に使われます。UTF-8もその1つです。 例えばWindowsで普通にファイルを作ると、エンコーディングはShift_JISになっているので、それを変換する必要があります。 Windows 2000またはXPならば、メモ帳でファイルを開いてから、「名前を付けて保存」でUTF-8を選ぶことで変換できます(Windows NTはどうだったか忘れてしまいました)。 それ以外の場合、他のテキストエディタで変換する必要があります。例えばWindowsならば、参考URLにあるTeraPadで開いてから、「漢字/改行コード指定保存」でできます。 さらに、そのファイルがXMLファイルであって、先頭に以下のような記述がある場合、 <?xml version="1.0" encoding="Shift_JIS"?> 以下のように正しい記述に直す必要があります。 <?xml version="1.0" encoding="UTF-8"?> (参考) 本当は、UTF-8の場合は、encoding="UTF-8"を省略しても構いません

参考URL:
http://www2s.biglobe.ne.jp/~t-susumu/toclip/
全文を見る
すると、全ての回答が全文表示されます。

その他の回答 (1)

  • darkside
  • ベストアンサー率53% (8/15)
回答No.1

何について、どんなことをしようとしていて 何がUTF-8でエンコーディングをしたもので ないと動作しないのかがわからないので 適切な答えかわかりませんが、 適当なページ、たとえば以下や参考URLなどで エンコーディングやUTF-8のことを 調べてみてください。 その上で、XMLのエンコーディング指定は 以下を参照してください。 http://www.doraneko.org/xml/xml10/xml10.html#NT-EncodingDecl

参考URL:
http://java.sun.com/j2se/1.3/ja/docs/ja/guide/intl/faq.html#Character Encodings
全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • エンコーディングについて

    htmlのエンコーディング(エンコード)を全てUTF-8で運用しているWebサイトの中で、お問い合わせフォームのページでCGIを使っているのですが、こういう場合、.cgi、.plのエンコーディングもUTF-8に変換したほうがいいのでしょうか? また、上記とは別ですが、外部のJavascript(.js)ファイルも揃えてUTF-8にしておいたほうがいいのでしょうか? ご教授いただければ幸いです。

    • ベストアンサー
    • CGI
  • UTF-8とUTF-16およびUTF-32について

    Unicodeにおける各文字エンコーディングについてですが なぜ、UTF-16およびUTF-32の文字コードがビッグエンディアンとリトル・エンディアンの二通りの組み合わせを許容できてUTF-8が許容できないのかがわかりませんなぜでしょうか?

  • 特殊な文字エンコーディングで困っています。

    特殊な文字エンコーディングで困っています。 エンコーディング名を教えて下さい。 コミック 上の文字列で「コミック」です。 ゲーム 「ゲーム」です。 アンパサンドとシャープから始まるこのエンコーディング名を教えてください。 phpでUTF-8に変換したいと思っています。 mb_convert_encoding で総当りで変換してみたのですが、UTF-8になりませんでした。 もし知っている方がいらっしゃいましたら、教えてください。

    • ベストアンサー
    • PHP
  • encoding="UTF-16" ってUTF-16で書かれても。

     以前からずっと疑問だったのですが。。。  XML宣言の中に、エンコーディングを記述するところがありますが、その宣言文字列自体をそのエンコーディングで記述するというのはおかしくないでしょうか。  たとえば、UTF-16だったら、 encoding="UTF-16" と書くわけですが、これ自体がUTF-16で書かれているわけですよね? UTF-16で書かれているとわかっていたら宣言する必要はないし、宣言読まないとわからないんだったら、この宣言自体も読めないはずです。  今実際に、UTF-16で書かれていて、エンコーディング宣言もしているXML文書をあるソフトで読もうとしているのですが、1バイト目を読んだところで「Unexpected character. position = 0 」と出力されてエラーになります。  強制的にUTF-16で読ませる昨日もあるので、そうすればエラーは起こりませんが、それじゃエンコーディング宣言の存在自体に意味がないのでは? これは、最初の時点で読めないこと自体がこのソフトの不具合なのでしょうか?  これってどういうことなんでしょう。解決できるんでしょうか。

    • ベストアンサー
    • XML
  • UTF-8とUTF-16について質問です。

    まず、【あ】という文字をUTF-16というエンコーディング方式で バイト配列化すると [0] => 66 [1] => 48 というバイト値が帰ってきます。 これはとりあえずC#で処理を行いました。 Encoding encode = Encoding.GetEncoding("UTF-16"); String value = "あ"; Byte [] byteData = encode.GetBytes(value); それでは【あ】という文字の文字集合のコードポイントは右記となります。【0x3042】 これは、出力された 66、48という数値を16進数に変換すると 66=>42 48=>30 となり、リトルエンディアン環境で 0x4230という16進数であらわされるようです。 この点も不思議なのですが今回知りたいのはUTF-16でエンコーディングされた バイト配列はこのように文字集合のコードポイントに復帰?させることができますよね? ではUTF-8でエンコーディングされた【あ】という文字の バイト配列 [0] => 227 [1] => 129 [2] => 130 というバイト配列を上記のような文字集合のコードポイントの値へ復帰させることは できるのでしょうか? それに伴いUTF-8でつかわれる文字集合もUTF-16と同じコードポイントなのでしょうか? 上記 1.UTF-8でエンコーディングされた文字列をバイト配列にした場合 元の文字集合に戻せるのか?戻せるならばその戻し方は? 2.UTF-8がさす文字集合とUTF-16がさす文字集合はおなじものですよね? 上記二点よろしくご教授ください。

  • UTF-8にマップできません???

    今、Atomを愛用しております。 チャンと日本語変換できているのに 後半のようなエラーが出るのはなぜでしょうか??? import java.applet.*; // Applet import java.awt.*; // Label, TextField, TextArea, Color, Button import java.awt.event.*; // ActionListener, ActionEvent import java.io.*; // InputStream, BufferedReader, InputStreamReader etc import java.net.*; // URL, Socket, UnknownHostException import java.util.*; // StringTokenizer //public class Chat extends Applet implements Runnable, ActionListener { // Runnable, ActionListenerインターフェース実装 Label TitleLabel; // タイトルラベル TextField InputField; // 入力フィールド Button SendButton; // 送信ボタン Button QuitButton; // 終了ボタン TextArea DisplayArea; // 表示エリア TextArea MemberArea; // メンバーエリア Thread thread; // スレッド Socket socket; // ソケット String Name = null; // 名前 //AudioClip Chime; // チャイム BufferedReader NetInput; // ネットワーク経由入力 PrintStream NetOutput; // ネットワーク経由出力 C:\JAVA>javac Chat.java Chat.java:9: エラー: この文字(0x83)は、エンコーディングUTF-8にマップできません // Runnable, ActionListener?C???^?[?t?F?[?X???? ^ Chat.java:9: エラー: この文字(0x83)は、エンコーディングUTF-8にマップできません // Runnable, ActionListener?C???^?[?t?F?[?X???? ^ Chat.java:9: エラー: この文字(0x93)は、エンコーディングUTF-8にマップできません // Runnable, ActionListener?C???^?[?t?F?[?X???? ^ Chat.java:9: エラー: この文字(0x83)は、エンコーディングUTF-8にマップできません // Runnable, ActionListener?C???^?[?t?F?[?X???? ^ Chat.java:9: エラー: この文字(0x81)は、エンコーディングUTF-8にマップできません // Runnable, ActionListener?C???^?[?t?F?[?X???? ^ Chat.java:9: エラー: この文字(0x83)は、エンコーディングUTF-8にマップできません // Runnable, ActionListener?C???^?[?t?F?[?X???? ^ Chat.java:9: エラー: この文字(0x83)は、エンコーディングUTF-8にマップできません // Runnable, ActionListener?C???^?[?t?F?[?X???? ^ Chat.java:9: エラー: この文字(0x81)は、エンコーディングUTF-8にマップできません // Runnable, ActionListener?C???^?[?t?F?[?X???? ^ Chat.java:9: エラー: この文字(0x83)は、エンコーディングUTF-8にマップできません // Runnable, ActionListener?C???^?[?t?F?[?X???? ^ Chat.java:9: エラー: この文字(0x8E)は、エンコーディングUTF-8にマップできません // Runnable, ActionListener?C???^?[?t?F?[?X???? ^ Chat.java:9: エラー: この文字(0xC0)は、エンコーディングUTF-8にマップできません // Runnable, ActionListener?C???^?[?t?F?[?X???? ^ Chat.java:9: エラー: この文字(0x91)は、エンコーディングUTF-8にマップできません // Runnable, ActionListener?C???^?[?t?F?[?X???? ^ Chat.java:9: エラー: この文字(0x95)は、エンコーディングUTF-8にマップできません // Runnable, ActionListener?C???^?[?t?F?[?X???? ^ Chat.java:11: エラー: この文字(0x83)は、エンコーディングUTF-8にマップできません Label TitleLabel; // ?^?C?g?????x?? ^ Chat.java:11: エラー: この文字(0x83)は、エンコーディングUTF-8にマップできません Label TitleLabel; // ?^?C?g?????x?? ^ Chat.java:11: エラー: この文字(0x83)は、エンコーディングUTF-8にマップできません Label TitleLabel; // ?^?C?g?????x?? ^ Chat.java:11: エラー: この文字(0x83)は、エンコーディングUTF-8にマップできません Label TitleLabel; // ?^?C?g?????x?? ^ Chat.java:11: エラー: この文字(0x8B)は、エンコーディングUTF-8にマップできません Label TitleLabel; // ?^?C?g?????x?? ^ Chat.java:11: エラー: この文字(0x83)は、エンコーディングUTF-8にマップできません Label TitleLabel; // ?^?C?g?????x?? ^ Chat.java:11: エラー: この文字(0x89)は、エンコーディングUTF-8にマップできません Label TitleLabel; // ?^?C?g?????x?? ^ Chat.java:11: エラー: この文字(0x83)は、エンコーディングUTF-8にマップできません Label TitleLabel; // ?^?C?g?????x?? ^ Chat.java:11: エラー: この文字(0x83)は、エンコーディングUTF-8にマップできません Label TitleLabel; // ?^?C?g?????x?? ^

    • ベストアンサー
    • Java
  • テキストエンコーディングについてお伺いします。

    今、MacBookのMac OS X 10.6.5を使用しています。一つのテキスト•エディットに書き込んでいるデータは、別のパソコンのデータを取り込んだりして、テキストエンコーディングが統一されていません。データファイルの改行コードを「Unix(LF)」にテキストエンコーディングを「UTF-8(BOMなし)」に統一したいのですが,既に書き込んでいるデータを統一する手短な方法があれば、ご教示いただければ幸いです。

  • UTF-8をUTF-16に変換する方法

    UTF-8をUTF-16に変換する方法に関してご教授ください できれば具体的な例を示して頂き、Javaでのサンプルなどを 示して頂けると幸いです。 その場合エンコーディング関連のライブラリは使用できません 自分が知りたいことは、 「どういった考えに基づいて変換を行えばいいか」 という変換規則のほうに重点を置いており、コードの解説そのものよりも 変換の考え方を説明頂ければと思います。 全くの素人ですが何卒よろしくお願いいたします。

  • ダイレクトエンコーディング

    初心者なもんでよく分からないのですが、ダイレクトエンコーディングというのはMDからでも直接デジタルオーディオプレーヤーに取り込めたりするのでしょうか???? もしできるのであればダイレクトエンコーディングできるオススメのデジタルオーディオプレーヤーを教えてください。(できれば1GBのやつがイイですm(_ _)m

  • ダイレクトエンコーディング

    今度、ダイレクトエンコーディング対応のデジタルオーディオ(アイリバーorソニー)の購入を考えています。 そこで質問です。 ダイレクトエンコーディングに対応していないCD/MDプレイヤーはあるのでしょうか? また、それが載っているページがありましたらご教示下さい。 よろしくお願いします。