テキストファイル 文字コード変換

このQ&Aのポイント
  • Mac OSX 10.9でのテキストファイル文字コード変換について質問です。文章作成はpagesを使っていますが、DM5で編集したいためにテキストファイルに変換しようとしています。しかし、UTF-8にしかない文字があるため変換できず、どの文字が問題なのかもわかりません。そこで、UTF-8をshift-jisに変換するソフトや、UTF-8にしかない文字を発見するソフトなど、解決手段を教えていただきたいです。
  • Mac OSX 10.9でのテキストファイル文字コード変換について質問です。文章作成はpagesを使っていますが、DM5で編集したいためにテキストファイルに変換しようとしています。しかし、UTF-8にしかない文字があるため変換できず、どの文字が問題なのかもわかりません。解決策がわかる方、教えていただけませんか?
  • Mac OSX 10.9でのテキストファイル文字コード変換について質問です。文章作成はpagesを使っていますが、DM5で編集したいためにテキストファイルに変換しようとしています。しかし、UTF-8にしかない文字があるため変換できず、どの文字が問題なのかもわかりません。どなたか解決策を教えていただけませんか?
回答を見る
  • ベストアンサー

テキストファイル 文字コード変換

Mac OSX 10.9にて、pagesを使って文章作成をしています。 この文章をポメラDM5で閲覧・編集をしたいと思っています。 DM5はテキストファイル(shift-jis)のみを扱えるので、pagesの文章を標準テキストとして書き出したものをmiで開き、文字コードを変換しています。 ところが、文字コード変換を試みてもUTF-8にしかない文字があるので変換できない旨が表示され、変換ができないファイルがいくつかあります。 具体的にどの文字がひっかかるのかがわかれば対処のしようもあるのですが、miでは表示されません。 ネット上でUTF-8にしかない文字を調べ、元の文章内を検索してみましたが、らちがあきませんでした。 そこで、お聞きしたいのですが、 1.UTF-8のテキストファイルをshift-jisに変換するソフト等 その際、文字コードに依存する文字があったら自動変換、または強制的に変換(その文字だけ文字化けするなど)するもの ※なお、multi text converterというソフトはエラーで落ちてしまい、使えませんでした。 http://www.rk-k.com/software/mtc 2. テキストファイル中のUTF-8にしかない文字を発見して教えてくれるソフト等 3. その他の解決手段 のいずれか、有用なものを教えていただけると幸いです。 なお、windows系のPCも持っていますのでソフト等はMacにこだわりません。 できれば無料のソフトが良いのですが、難しければ有料のものでも構いません。 よろしくお願いいたします。

  • Mac
  • 回答数2
  • ありがとう数3

質問者が選んだベストアンサー

  • ベストアンサー
  • dezimac
  • ベストアンサー率56% (2365/4208)
回答No.2

nkfは自分でソースコードをコンパイルしてインストールする必要があり面倒です。 「iconv」という文字コードを変換するターミナルコマンドが標準で入っているのでそちらを使った方が楽でしょうね。 hoge.txt(UTF-8)をShift-JISに変換してhoge-sjis.txtにする。 iconv -f UTF8 -t SJIS hoge.txt >hoge-sjis.txtx

参考URL:
http://itpro.nikkeibp.co.jp/article/COLUMN/20131209/523510/

その他の回答 (1)

  • notnot
  • ベストアンサー率47% (4848/10262)
回答No.1

nkf がMacでも使えるようです。 http://qiita.com/kou_bacchus/items/6448608ee03b0a71dcd4 nkf -I -s で、Shift_JISに変換して変換出来ない文字を「 〓 」にします。

leshed
質問者

お礼

ありがとうございます。 Linuxから遠のいて久しいので、nkfは少し敷居が高く感じてしまいますが、便利そうですね。 良い物を教えていただいて、ありがとうございました。

関連するQ&A

  • 文字コードが変わってしまう

    Webページ作成関連の市販のテキストについているサンプルコードを自分のマシンにコピーして勉強しています。WindowsXPとWindows7を使っています。 たとえば、【今日問題なく使った】のに、翌日同じHTMLファイルのソースを見たら、文字コードが矢印に変わってしまっています。 改行コード変換ソフトで変換して、また元に戻して作業をしました。 翌日、他の部屋のマシン(WinXP)でそのファイルを開いたら、また文字コードが矢印に変わっていました。 詳しいことはわからないレベルですが、状況だけ書いてみました。 文字コードが変わってしまうタイミングってあるのでしょうか。関係ないかもしれませんが、書籍についてきたサンプルファイルの文字コードはUTF-8なので、文字コード変換ソフトでShift_JISに変更しました(なぜShift_JISにしたかは、特に意味はありません。UTF8がいいというのは聞いていますが、とりあえずShift_JISでやっています)。 難しい理論は理解できないと思いますが、どうしてそうなるかを教えていただける方がいたらお願いします。

  • テキストファイルの文字コードが

    フォルダの中にあるテキストファイルの文字コードが UTF-8なのかShift_JISなのか どうやって調べれば良いですか? プロパティを見てもわかりません。

  • ファイルの文字コード変換

    一度Shift-JISコードで作成したファイルを、そのままの状態でEUCコードに変換することはできないのでしょうか? ◇試したこと 1)文字コード変換ツール(フリーソフトを2,3種類) 2)インターネットエクスプローラで開いて文字コード変換 ◇結果 1)いずれも変換されなかった 2)変換されたが元のファイルのテキストが崩れた かなりたくさんShift-JISファイルがあるので困っています。 いい方法を御存知の方がいらっしゃいましたら御教授いただければ幸いです。

  • JAVA 文字コード変換

    こんにちは。 JAVAの文字コード変換のところで教えて頂きたい所があります。 はしご高(髙)  の文字をUTF-8からJISコードに変換してテキストファイルに書き込んでいるのですが、文字化けして"?"という文字になっています。 "髙"の文字をUTF-8からJISコードに変換の仕方のコーディング方法を教えて頂けないでしょうか。 現在下記の様に変換を行って書き込んでいます。  String str = "髙";  byte[] buf = str.substring(0, 1).getBytes("JIS0208"); OS:WindowsXP DB:Oracle10g  宜しくお願い致しますm(__)m

    • ベストアンサー
    • Java
  • UNIXなどで、テキストファイルの文字コードを、utf-8 → S-J

    UNIXなどで、テキストファイルの文字コードを、utf-8 → S-JIS に変換するコマンドがあれば教えてください。

  • ファイルコードの変換の問題

    現在、shift-jis ファイルをUTF-8に変換するところです。 使っているソフトはGNU の iconvです。バージョン1.10です。 iconv -f SHIFT_JIS -t UTF-8 a.txt > b.txt で文字コードが変換されていない 詳しい方が教えていただけないでしょうか

  • テキストファイルの文字コードMS932(Windows-31J)を読み

    テキストファイルの文字コードMS932(Windows-31J)を読み込んで、 それをUTF-8に丸ごと変換してテキストファイル出力する方法を教えてください。 (直接MS932→UTF-8に、単純に変換出来るのでしょうか?  それとも途中(間)に、何か別の文字コードに変換してからでないと、  UTF-8に変換出来ないのでしょうか?) お世話になります。 宜しくお願い致します。

    • ベストアンサー
    • Java
  • htmlファイルの文字コードを変換するマクロ

    フリーソフトで変換することはできますが、エクセルのVBAで可能でしょうか? shift_jisから、UTF-8に変換したいです。 htmlファイル自体も、エクセルの内容をマクロで出力して作ったもので、 その次のステップとして、ファイル生成後に文字コードを変換したいのです。 マクロでhtmlファイル生成する時に文字コードを指定する方法もあるようですが、 今のマクロが複雑なので、そこへ組み込むことは諦めました。 ファイルのあるDドライブにあるフォルダを指定して、htmlファイルの文字コードを変換するマクロを教えて下さい。 お願い致します。 エクセルは2003、Window7です。

  • cookieのテキストファイル%u3036などをshift-jisに変換

    htmlでボタンを作り、onclickでjavascriptを実行しました。 javascriptの中で、htmlのinputボックスの中身をcookieに保存しました。 その後、mydocumentの中のバッチファイルを用いてcookie内のテキストファイルを加工したいのですが、エディタで開くと%u3083というようなテキストで表示されてしまいます。 どうしたら普通に読める文字になるでしょうか? ・%u以降のコードはUTF-16であるように思います。 ・VectorにあるUTF-16→shift-jis変換をするソフトを利用しても  上手く変換できませんでした。  同じように、UTF-8→shift-jis変換も上手く変換できませんでした。 ・Windows2000でGAWKを使ってテキストを加工します。 よろしくお願いします。

  • 【フォルダ名の文字コードを変換したい】

    【フォルダ名の文字コードを変換したい】 Windows Vistaです。 Windowsではフォルダ名にShift-JISを使っていますが、とあるプログラムが日本語を読み込む際、文字コードがUTF-8でないと読み込めないようで、フォルダ名に日本語を含むフォルダを参照すると文字化けしてしまいます。 なのでフォルダ名をUTF-8に変換したいです。 検索するとLinux上でShift-JISのフォルダ名をUTF-8にしたり、Windows上でもファイルの内容をShift-JISからUTF-8に変換したりする方法は見つかるのですが、Windows上でフォルダ名をUTF-8に変換する方法が見つかりません。 UTF-8に変換するとエクスプローラ上では文字化けするので、需要がないのでしょうか。 コマンドプロンプトとか苦手なので、何かフリーソフトでもあればいいのですが…