• ベストアンサー

文字コードについて

楽し (&は半角です。) というような文字コード?で文字が記入されています。これはなんという文字コード名なのでしょうか? これを通常の文字として読めるように変換したいと考えていますが、可能でしょうか?よろしくお願いいたします。

質問者が選んだベストアンサー

  • ベストアンサー
回答No.3

「&#~;」という表現形式は、「数値文字参照」や「文字参照」と呼ばれ、 HTMLやXML内で使用される文字表現方法です。 (参考) http://ja.wikipedia.org/wiki/%E6%96%87%E5%AD%97%E5%8F%82%E7%85%A7#.E6.95.B0.E5.80.A4.E6.96.87.E5.AD.97.E5.8F.82.E7.85.A7.EF.BC.88.E6.96.87.E5.AD.97.E5.8F.82.E7.85.A7.EF.BC.89 例えば、楽は、16進数に変換すると楽になります。 この「697d」が文字コード部分ですが、特定の文字コードが使用されている わけではありません。SJISだったりUTF-16だったりいろいろあり、 使用される文字コードは、どこか別の場所に書かれています。 ただ、SJISやEUCは、たいてい0x8000以上の文字コードが使用される ようになっており、「697d」といった0x8000以下の文字コードを 使用しているのはUTF-16(Unicode)であると推測できます。 それで、 http://ja.wikipedia.org/wiki/Unicode%E4%B8%80%E8%A6%A7_6000-6FFF から「697d」の文字を調べると「楽」という感じであることがわかります。 同様の方法で「し」を調べると、ひらがなの「し」であることが わかります。 その「&#~;」で書かれているデータを「.htm」の拡張子を持つファイル名 で保存して、ブラウザで開けば、結構読めたりします。

TPR_SET
質問者

お礼

ありがとうございます。おかげさまで10進数だということがわかりました。これがわかれば変換も出来そうです。でもバイナリ文字のxmlファイルでもデーターを取得できたので、今は必要なくなりました。

その他の回答 (2)

  • functor
  • ベストアンサー率32% (48/149)
回答No.2

このページで検索してみてください。 http://shimapucchi.blog93.fc2.com/?mode=m&no=261 それと、あなた、至る所で同じ質問をしてませんか? それってルール違反ですよ。

TPR_SET
質問者

お礼

ご回答有難うございます。貴方が確信をもってそのように思われたのでルール違反だと言われているのでしょうけど、私は未だかつて同様の質問を他でしたことはないのです。どこかで同じような質問を私がしていましたでしょうか?

  • aokii
  • ベストアンサー率23% (5210/22062)
回答No.1

以下のHPで変換してみて下さい。 http://seo.atompro.net/webtoolfree_strcnva_.html

TPR_SET
質問者

お礼

ご回答ありがとうございます。すみません、質問の仕方が悪かったです。変換したいのは、perlを使って変換して、変換語の文字をファイルに保存したいと思っています。あと、読み込み元のファイルはRSSでした。

関連するQ&A

専門家に質問してみよう