• ベストアンサー
  • 困ってます

【文字コード】コピー&ペースト時に使われる文字コードはShift-jis?

Win-XP使用者です。 最近文字コードについて勉強しているのですがよくわからないことがあります。 いわゆる「コピペ」にて文字を移動させる場合、その文字はどのような扱いなのかという問題です。 はじめは「UTF-8」なら「UTF-8」のまんまコピーされるのかと思っていましたが、実は「Shift-jis」に変換されてコピーされてはいないかと疑っています。 よくわかっていないので的外れな質問かもしれませんが、解説できる方、よろしくお願いいたします。

共感・応援の気持ちを伝えよう!

  • 回答数4
  • 閲覧数4688
  • ありがとう数5

質問者が選んだベストアンサー

  • ベストアンサー
  • 回答No.4
  • noocyte
  • ベストアンサー率58% (171/291)

> エディタは、DreamWeaver8とテラパッドなのですが、charmapの「まるA」を > 両者にコピペで貼り付けたところ「・」と「?」に化けてしまいました。 DreamWeaver もテラパッドも使ったことはありませんが, 文字コード表からこれらにコピーした時点で化けたんですか? ならば,それらの内部コードはシフト JIS だということがバレましたね. (クリップブックを使うまでもなく.) ご質問に "UTF-8" とありますから,それらは UTF-8 のファイルを 読み書きできるんでしょうが,内部コードがシフト JIS では, シフト JIS にない文字を読み込み・キー入力・ペーストすると 当然化けますね. > メモ帳は正しく「まるA」に表示されました。 WinXP のメモ帳は,機能は最低限のエディタですが, 内部コードは Unicode なので,「○A」もちゃんと表示されます. (ただし初期状態のフォントでは表示できない文字もあるので,  これも「MS P明朝」などに変更してください.) また,メモ帳の中で「○A」 をコピーすると,クリップブックに正しく 表示されるので,メモ帳は Unicode (CF_UNICODETEXT) でコピーしている ことになります.

共感・感謝の気持ちを伝えよう!

質問者からのお礼

なんと!メモ帳はShift_JISだと思って馬鹿にしていたのにベースがUTF-8だったなんて! 上記の方法ですべてのソフトの内部コードが判明するってことでしょうかね。実にありがたい。 ありがとうございました。

関連するQ&A

  • コピー&ペースト時の文字コードは何に依存しますか?

    コピー&ペースト時の文字コードに関して質問させてください。 Webページの本文などをコピーし、テキストエディタやブラウザ上のPHPで作ったスクリプトページにコピーなどして、データベースなどに保存した場合、 その文字コードは何になるのでしょうか? ある場所で質問した際、LANG変数の値じゃないかと言われました。 なのでLinuxを使用している自分の環境でやってみたところ、 $ echo $LANG ja_JP.utf8 となりました。 このページ(http://www.itmedia.co.jp/help/tips/linux/l0176.html)を参考に/etc/profile内を見てみたのですが、LANGに関するものは見当たりませんでした。 ま、UTF-8で設定されているのでUTF-8で統一したい自分にとってはそれで良いのですが。 で、もし対象のWebページのHTMLが例えEUC-JPやShift-JISで書かれていたとしても、 Linuxでコピペした場合は文字コードはUTF-8と考えてもいいのでしょうか? こういうページ(http://okwave.jp/qa/q2940513.html)にも質問ありましたが、環境がWindowsの為分かりませんでした。

  • UTF-8からShift-JISへの文字コード変換について

    文字コードがUTF-8のファイルをShift-JISに変換する方法についてご存知の方がいらっしゃれば教えていただきたいです。 仕事上で、UTF-8のファイルをしばしば受領するのですが、Shift-JISに変換しないと、その後の処理ができない作業があり、今は秀丸で開いて、文字コードを変換して保存し直してます。 私以外のメンバも今後同じ作業を実施するようになり、引継ぎ手順書を作成しているのですが、ツール等を使わないWindows標準機能を用いた手順を要求され、どうすればいいかわからなくなって質問させていただきました。 よろしくお願い致します。

  • 文字コード表をコピーしても正しくペーストされない

    Windowsのことはよくわからない者です。 普段はMacを使っています。 Win98で文字コード表をコピーしてFrameMaker上にペーストすると、正しく表示されません。コピーしようとしているのはラテン文字です。 コピーしようとしたラテン文字とは違う文字がペーストされた上に後ろにゴミのようなものが何文字かくっついてきてしまいます。

その他の回答 (3)

  • 回答No.3
  • noocyte
  • ベストアンサー率58% (171/291)

#1 です. > charmap にて「○の中にA」というのが見つかりませんでした。 > 一体どうすれば・・ フォントを「MS P明朝」にして U+24B6 (Circled Latin Capital Letter A) です.

共感・感謝の気持ちを伝えよう!

質問者からのお礼

なるほど!ありがとうございます。 「まるA」はcharmapに表示されました。 エディタは、DreamWeaver8とテラパッドなのですが、charmapの「まるA」を両者にコピペで貼り付けたところ「・」と「?」に化けてしまいました。メモ帳は正しく「まるA」に表示されました。 これはどう解釈すればいいのでしょうか?

  • 回答No.2
  • noocyte
  • ベストアンサー率58% (171/291)

#1 です. > UTF-8のエディタ→別のUTF-8のエディタで文字化けを起こす場合がある どちらのエディタに問題があるのかは,WinXP についている 「クリップブック」と「文字コード表」で調べられます. (1) コピー側エディタに,シフト JIS にない Unicode 文字を入力してコピーする.   (文字コード表から,例えば「○で囲まれた 'A'」を選択してそのエディタに    ペーストした後,そのエディタでコピーする.) (2) クリップブックのメニューで「表示 → Unicodeテキスト」を選び,   「○A」が正しく表示されているか確認する.   文字化けしていれば,コピー側エディタはシフト JIS で渡していることになる. なお老婆心ながら,クリップブックと文字コード表は,「ファイル名を指定して実行…」 からそれぞれ clipbrd,charmap で起動できます.

共感・感謝の気持ちを伝えよう!

質問者からのお礼

ありがとうございます。 しかしながら charmap にて「○の中にA」というのが見つかりませんでした。 一体どうすれば・・

  • 回答No.1
  • noocyte
  • ベストアンサー率58% (171/291)

クリップボードを扱うプログラムを書いたことがないのでよく知りませんが…. クリップボードでテキストを渡す場合,次の形式が定義されています. ・CF_TEXT (シフトJIS?) ・CF_UNICODETEXT (UTF-16(LE))  (Windows が内部で扱う Unicode は,UTF-8 ではなく UTF-16(LE) です.) (なお,これら以外に CF_OEMTEXT というのもあります.) なので,シフト JIS / UTF-16LE のどちらででも渡される可能性があると思います. あとは,カット/コピー側アプリケーションがどちらで渡しているか, ペースト側アプリケーションが両方に対応しているか否かの問題でしょう. 「クリップボード CF_TEXT CF_UNICODETEXT」で検索 http://www.google.co.jp/search?q=%E3%82%AF%E3%83%AA%E3%83%83%E3%83%97%E3%83%9C%E3%83%BC%E3%83%89+CF_TEXT+CF_UNICODETEXT&sourceid=navclient-ff&ie=UTF-8&rls=GGGL,GGGL:2006-34,GGGL:ja

共感・感謝の気持ちを伝えよう!

質問者からのお礼

なるほど。やはりそのままの文字コードで飛んでくわけではないのですね。 この辺は目に見えないものだけに厄介です。 UTF-8のエディタ→別のUTF-8のエディタ で文字化けを起こす場合があるのでおかしいな~と思っていました。 ありがとうございました。

関連するQ&A

  • 文字コードshift-jisへの変換について

    お世話になります。 .NET C#にて開発をしております初心者です。 C#からテキストデータにデータの書き出しを行っており、 文字コードをUTF-8からSHIFT-JISへ変換したいのですが、 ネット等で確認し、記述したのですが、データの中には 半角カナ文字もあり、どうも変換がうまくいきません。 どなたかサンプルコードまたは、参考になるサイトなどを お教え頂きたく宜しくお願い致します。

  • 【フォルダ名の文字コードを変換したい】

    【フォルダ名の文字コードを変換したい】 Windows Vistaです。 Windowsではフォルダ名にShift-JISを使っていますが、とあるプログラムが日本語を読み込む際、文字コードがUTF-8でないと読み込めないようで、フォルダ名に日本語を含むフォルダを参照すると文字化けしてしまいます。 なのでフォルダ名をUTF-8に変換したいです。 検索するとLinux上でShift-JISのフォルダ名をUTF-8にしたり、Windows上でもファイルの内容をShift-JISからUTF-8に変換したりする方法は見つかるのですが、Windows上でフォルダ名をUTF-8に変換する方法が見つかりません。 UTF-8に変換するとエクスプローラ上では文字化けするので、需要がないのでしょうか。 コマンドプロンプトとか苦手なので、何かフリーソフトでもあればいいのですが…

  • 文字コードを指定する際sjisなのかshift_jisかshift-jisなのか

    お世話になります。 perl5.8において文字コードを指定or変換する際 shift_jis shift-jis Shift_JIS SJIS EUC_JP EUC-JP utf-8 utf8 -と_の違いや大文字小文字の違いなど記述の違いを良く見かけるのですが、実際決まった指定方法などはあるのでしょうか。 逆に文字コードを指定する際、●●のように指定しても無効で●●のように指定しないと有効ではないですよ。。みたいな。 またperlに限らずPHPやHTML、XMLなどではどうなっているのでしょうか どなたかご存知の方いましたら ・上記3つの文字コードについてと ・perlのバージョンの違い、言語の違いなど 文字コードの文字列の指定に関する全般についてご教授願えませんでしょか。 宜しくお願い致します。

    • ベストアンサー
    • Perl
  • Webサイトの文字コードについて

    日本のWebサイトの文字コードはShift-JISが多いようですが、UTF-8との違いってなんなんでしょうか?表示できない文字があるんでしょうか? また、MovableTypeのテンプレートはデフォルトでUTF-8になっていますが、Shift-JISに変更すると何か不具合があるんでしょうか? 投稿するカテゴリが間違っていたらごめんなさい。

    • ベストアンサー
    • HTML
  • PHPの文字コード変換について

    PHPで mb_convert_encodingを用いて UTF-8で記述されたPHPスクリプトファイルの PHPファイル内の任意の文字列の文字コードを変換する場合、 $value = "文字列"; $str = mb_convert_encoding($value ,"UTF8","UTF8"); print $str; この場合、特に問題なく、変換がおこなわれます というか、意味のないで処理ではありますが。 次に $str = mb_convert_encoding($value,"EUC-JP","EUC-JP"); とした場合 うまく文字列の文字コードの変換がおこなわれず 出力内容は文字化けします。 次に $str = mb_convert_encoding($value,"SJIS","SJIS"); とした場合 EUC-JPと同じく文字コード変換に失敗し 文字化けするだろうとおもいましたが おもいのほかブラウザの文字コードUTF-8のままで文字化けしていないのです。 これはどういう現象でしょうか? たとえば一つ目は UTF8で記述されたPHPファイルの文字列をそのままUTF-8として 変換されせるのですから、問題ないはずです。結果問題ありません。 二つ目は UTF-8でかかれたPHPファイルの文字列をEUC-JPでかかれたファイルとして EUC-JPという文字コードに変換しなさいという命令ですよね? これは思う通りにいかなくて文字化けした文字列が出力されるのはわかるのですが 三つ目はUTF8で記述された文字列をSHIFT-JISとしてSHIFT-JISに変換しようとしているにも かかわらず、結果問題なくブラウザのUTF-8で文字列と表示されてしまいます。 これはいったいどういう事なのでしょうか? これが仮に $str = mb_convert_encoding($value,"SJIS","UTF-8"); なら話は簡単んです。 UTF-8で記述されたファイルの任意の文字列を UTF8からSJISに変換しようとしているのですから問題なく SHIFT-JISでエンコーディングされた文字列が帰ってくるはずです。 こ乃原因をご存知のかたよろしくご教授ください。 お願い致します。

    • ベストアンサー
    • PHP
  • UTF-8で書かれたファイルをshift-jisに変換したい

    あるフォルダの下にある複数のファイル(文字コード:UTF-8)を、shift-jisに変換するおすすめツールがありましたら教えてください。

  • JAVAでのShift-JISとEUC-JP間の文字コード変換ができません

    Windows環境で作成した「Shift-JIS(CP932)」のファイルを、 JAVAを使用して「EUC-JP」のファイルに変換したいのですが、 NEC選定文字(13区)等の追加された機種依存文字の変換ができません。 いろいろ調べてみたのですが、 文字コードの呼び方がサイトによってあいまいで、 どのページが正しいのかがわかりません。 ・「Shift-JIS(CP932)」「EUC-JP」の正確な情報が記述されたサイト ・JAVAにおける文字コードの変換のノウハウ に関しての知識をお持ちの方がいましたら、教えてください。 以下は変換に使用したJAVAのソースコードです。 InputStreamReader ins = new InputStreamReader(new FileInputStream(iFile), "windows-31j"); OutputStreamWriter outs = new OutputStreamWriter(new FileOutputStream(oFile), "euc-jp"); int c; while ((c = in.read()) != -1) { out.write(c); } 以上です。 よろしくお願いします。

    • ベストアンサー
    • Java
  • テキストファイル 文字コード変換

    Mac OSX 10.9にて、pagesを使って文章作成をしています。 この文章をポメラDM5で閲覧・編集をしたいと思っています。 DM5はテキストファイル(shift-jis)のみを扱えるので、pagesの文章を標準テキストとして書き出したものをmiで開き、文字コードを変換しています。 ところが、文字コード変換を試みてもUTF-8にしかない文字があるので変換できない旨が表示され、変換ができないファイルがいくつかあります。 具体的にどの文字がひっかかるのかがわかれば対処のしようもあるのですが、miでは表示されません。 ネット上でUTF-8にしかない文字を調べ、元の文章内を検索してみましたが、らちがあきませんでした。 そこで、お聞きしたいのですが、 1.UTF-8のテキストファイルをshift-jisに変換するソフト等 その際、文字コードに依存する文字があったら自動変換、または強制的に変換(その文字だけ文字化けするなど)するもの ※なお、multi text converterというソフトはエラーで落ちてしまい、使えませんでした。 http://www.rk-k.com/software/mtc 2. テキストファイル中のUTF-8にしかない文字を発見して教えてくれるソフト等 3. その他の解決手段 のいずれか、有用なものを教えていただけると幸いです。 なお、windows系のPCも持っていますのでソフト等はMacにこだわりません。 できれば無料のソフトが良いのですが、難しければ有料のものでも構いません。 よろしくお願いいたします。

    • ベストアンサー
    • Mac
  • dreamweaverで文字コードを変換して保存するには

    xpでdreamweaver8を使用しています。htmlファイルをdwで編集後、文字コードを変換して(具体的にはもとのshift-jisからISO-8859-1)そのファイルを保存しなおすことは可能でしょうか。 海外のサーバーにアップしていて、shift-jisだと日本語をインストールしていないPCから接続すると、ブラウザ上でアラートみたいのがでてしまうのでそれを避けたいです。 ファイルには日本語文字列はいっさい入っていませんが、どうもいろんなテキストエディタからコピー、ペーストをくりかえしていたら元ファイルがshift-jisになってしまったようです。 htmlソース内へのメタタグ挿入での変換ではなく、ファイルそのものを文字コードかえて保存したいです。 新規ドキュメント製作内にあるデフォルトエンコードの設定を変えても、またページプロパティでエンコードをかえて適応でもだめでした。 もしくは、別名保存で保存しなおそうにも、文字コード選択のタブがありません。 そして変換可能であるならば、ファイルを一括で変換することはできるでしょうか。 また考えたのですが、dwのFTPで転送するときに文字コードのみを変換して転送することは可能でしょうか。 そのほか、メモ帳、wordpad、sakura editor、notepad++、などのテキストエディタで保存時に変更しようと企みもしましたが、 どれもutf-8は選択にあるのですが、ISO-8859-1のみありません。また、ANSIで保存しようとすると、なぜかshift-jisになってしまいます。 解決方法があれば、よろしくお願いします。

  • 各キャリアの文字コード

    プログラマー初心者です。 サイトの開発を計画中なのですが、 PC(OS)、スマホ、携帯すべてのブラウザに対応している文字コードはなんでしょうか? 調べてみると携帯3社は"UTF-8","Shift-JIS"などバラバラに書かれていたので。 (UTF-8が使えないauのみmb_convert_encodingを使い、文字エンコードを変換?) PC・スマホも(データベースも)含め全て統一したいのでやはりUTF-8が適切でしょうか? HTML5で<meta charset="UTF-8">とだけ指定しています。 またサーバからメール送信などを行う際はShift-JISで全て文字化けしないでしょうか?