ベストアンサー

diffコマンドでのjisとsjisの漢字項目の扱いについて

2004/06/27 05:34

HP-UXで使用文字コードをsjisで設定しています。漢字項目を含むsjisで作成したファイルと、同内容のjisで作成したファイルをdifｆコマンドで比較した場合、 jisの漢字項目にエスケープシーケンスがつくと思っているのですが、相違点として表示されるのでしょうか？また、このjisで作成されたファイルをcpコマンド等で、別ファイルにした場合にsjisのファイルになるのでしょうか？仮にsjisとなった場合に、漢字のエスケープシーケンスはどのような扱いになるのでしょうか？ (現在、近くに環境がなく確認できませんので、この場を借りて質問致しました。)

kiyoto
お礼率79% (163/205)

その他（プログラミング・開発）
回答数2
ありがとう数3

みんなの回答 （2）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

notnot
ベストアンサー率47% (4854/10269)

2004/06/27 18:04 回答No.2

＞HP-UXで使用文字コードをsjisで設定しています。これはおそらく、端末の扱う漢字コードがsjisであると環境変数に設定したということだと思います。日本語のメッセージはコマンドからsjisコードで出てくると思うので、sjisに設定した端末から使うとうまく読めるし、euc-jisに設定した端末から使うと文字化けします。＞また、このjisで作成されたファイルをcpコマンド等で、＞別ファイルにした場合にsjisのファイルになるのでしょうか？端末に結果を表示するコマンド以外には関係しませんので、cpコマンドは純粋にコピーだけを行います。漢字コード変換コマンドはiconvだったはず。＞漢字項目を含むsjisで作成したファイルと、＞同内容のjisで作成したファイルをdifｆコマンドで比較した場合、＞jisの漢字項目にエスケープシーケンスがつくと思っているのですが、相違点として表示されるのでしょうか？ HP-UXのdiffコマンドを使ったことはありませんが、おそらく異なった漢字コードのファイルを比較すると漢字コード部分が全部不一致で出てくると思いますので、最初にiconvコマンドでjisコードのファイルをsjisコードに変換してからsjis同士で比較すればいいと思います。

質問者

お礼 2004/07/04 09:16

お礼が遅くなり申し訳ありませんでした。参考にさせて頂きます。

全文を見る

ログインすると、全ての回答が全文表示されます。

その他の回答 (1)

terra5
ベストアンサー率34% (574/1662)

2004/06/27 13:57 回答No.1

同じく環境がなくて試せませんが、過去の経験や知識からの推測です。(昔、hp-uxも使った事はあります) diffは行単位で単純に内容を比較するだけですから、内容が異なればそれをそのまま表示するでしょう。漢字コードはおそらく意識せず動作しているでしょう。 cpはファイルをコピーするだけですから、漢字コードが変わることはまず無いでしょう。通常、漢字コードを変換する場合はなんらかの専用のコマンドがあります。この辺の基本的なコマンドはどのunix系OSでも変わらないと思いますので, Linuxでもcygwinでも使って確かめてみては?

質問者

お礼 2004/07/04 09:15

お礼が遅くなり申し訳ありませんでした。参考にさせて頂きます。

全文を見る

ログインすると、全ての回答が全文表示されます。

関連するQ&A

SJIS→JIS漢字コード変換の制御コマンドの扱い
JIS→SJISへの変換の際に、制御コマンドとして <ESC>$Bや<ESC>(Bが入っている事で漢字かそうでないかの判断ができますが、逆にSJIS→JISへの変換の際に、制御コマンドはどのようにして埋め込む事が出来るのでしょうか？ fprintf(fp,"？",0x1b,0x24,0x42); ？にはどういれたらよいのでしょう？ %cだと表示されてしまいますし・・
- ベストアンサー
- C・C++・C#
UNIXのdiffコマンドについて
UNIXのdiffコマンドは、ファイルを比較するときに同じテキストであっても時々は違っていると出力されるケースがあると聞きましたが、詳しく内容をご存じの方教示願います。（OS[solaris,HP-UX,AIX,Linux]の違いにも関係があるようですが？）
- 締切済み
- その他(OS)
JIS漢字コード
どなたかご教授下さい。現在、産業用のラベルプリンタでラベルを作成しておりますがそのラベルプリンタは、JIS漢字コードでの入力しかできません。 JIS漢字コード表を見ながら、項目を入力していかなければならない為、非常に時間がかかってしまいます。 PCであらかじめ項目を入力して、JIS漢字コードに変換するような事は可能でしょうか？（例：あいう→2224,2424,2624）もしくは、そういうフリーのソフト等はあるのでしょうか？ご解答お待ちしております。宜しくお願い致します。
- 締切済み
- その他([技術者向] コンピューター)
ＩＢＭ漢字コードのＳＪＩＳ変換方法
こんにちは。現在ＩＢＭホストのデータをＦＴＰしてＵＮＩＸ上にて使用しています。ファイルの内容はcsvファイルで、ある項目は英数字のみ、ある項目は漢字のみというような物です。現在、英数字は上手くいってますが、漢字の部分が化けてしまっています。今やっているやり方は、ホストのファイルをbinaryモードでＦＴＰして、ddコマンドにてEBICDICコードをASCIIコードに変換します。しかし、漢字の部分が化けているという状況です。ＩＢＭのホームページをみると、「IBM漢字コードとシフトJISとの変換は、オペレーティング・システム標準の iconvコマンドとiconv()サブルーチンで可能ですので、こちらをご利用下さい。」と書いてありますが、まったく要領を得ません。 iconvをmanのコマンドで見ましたが、書いてある内容が理解できません。どなたか同じような経験をしたかた、アドバイスをよろしくお願いします。 iconvのオプションはこう付ければ上手くいくとか、変換表を自前で作成したなどなど、他にこんな方法があるなどヒントをいただけると助かります。
- 締切済み
- その他(OS)
独自コード変換方法について
UNIX-Cにて独自でファイルから読みこんだ文字をSJIS→JISまたはJIS→SJISに変換する関数を作成したいのですがどのように作成すべきか全く検討がつきません。色々なHPも探してみたのですが変換プログラムの紹介やコマンド(nfk)などの使い方などがほとんどで・・・。何か参考になるHPをお知りのかた、または簡単に作成できるヒントを下さればと思います。よろしくお願いします。
- ベストアンサー
- C・C++・C#
VB2005でJIS拡張漢字の各文字コードを取得する方法
ある関数に文字列を渡して各文字コードを取得するプログラムを作成しようとしています。基本的な文字のコードは取得できるのですが、JIS拡張漢字のほとんどが正しく取得できません。失敗している文字は内部的に「?」（3F）となってしまいます。例：拡張漢字のコード値（SJIS：81B2）を変換するとコード値が「3F」になってしまう。（テキストエディタなどで文字化けすると「?」に化けるのと同じなのかな？）正しく文字コードを取得する方法をご存知の方、またヒントなどありましたらよろしくお願いします。【環境】WindowsXP 　　　　VisualBasic2005 【プログラムの流れ】例：SJISコードを取得する場合文字列を受取る→1文字取得→System.Text.EncodingでSJIS指定のバイト型配列文字に変換（文字コードを取得）
- 締切済み
- Visual Basic
diffコマンドの無視条件指定方法(改行コード, 特定行)
Unix等のDiffコマンドの結果で、いくつかの条件を無視したいのですが方法がわかりませんでした。よろしければどなたか教えていただけないでしょうか。１．改行コードを無視したい　テキストの内容は同じだけど、改行コードが異なったファイルを扱う場合、すべての行が差分として扱われてしまいます。改行コードを無視したdiffのとりかたはないでしょうか？　２．特定の行を無視したい　CVSのRCSキーワードが異なる行は無視して差分をとりたいのですが、上手くいきません。。。-Iオプションで正規表現が指定できるとのことですが、挙動がどうも不明です。　上手くいかない例：diff -I '\$Date' a.c b.c ちなみに試みた環境は、cygwinでdiffは以下のバージョンです。 $ diff -v diff (GNU diffutils) 2.8.7 どちらか片方でもわかるかたいらっしゃいましたら、よろしくお願いいたします。
- ベストアンサー
- Linux系OS
dosコマンドプロンプト％０の扱いですが、
dosコマンドプロンプト％０の扱いですが、この度dosのbatファイルを作成しましたが、ａｂｃ．ｂａｔのようなファイル名で、％０を使うと、「ａｂｃ．ｂａｔ」と全てが参照されてしまいます。「ａｂｃ」のみを取り込みたい（.batを落としたい）のですが、どう書けば宜しいのでしょうか。宜しくお願いします。
- ベストアンサー
- その他(OS)
Becky2 mboxでのエクスポート
Becky! 2 (ver2.58)で、エクスポート UNIX mbox 形式で作ったファイルの日本語部分が読めません。ASCIIの部分は読めます。エディタは秀丸でエンコード形式を日本語(JIS)にしていますが、本文の漢字の部分が「=1B$B0f4X$G$9!#=1B(B」というように文字化けします。ファイルの中身をバイナリエディタで調べてみると、漢字コードはＪＩＳに合っているようですが「ESC $ @」などのエスケープシーケンスのコードが正しくないようです。また、他のＰＣで試すと正しく表示できますので、私のＰＣの設定に原因があるように思われるのですが、何がいけないのかが分かりません。アドバイスお願いします。
- ベストアンサー
- その他(業務ソフトウェア)
ファイルのチェック
教えて下さい。 UNIX上でデータベースのバックアップを行なっています。毎日コールドバックアップで、データベースファイルを別領域（ディレクトリ）へコピー（cp)しています。その時、実際、元のファイルとコピーしたファイルが同じものか、チェックをしたいのですが？「find」コマンドと「diff」コマンドを組み合わせてできる事を調べたのですが、どういう風に組み合わせていいかわかりません。その他の簡単なやり方でも構わないので教えて下さい。宜しくお願いします。
- ベストアンサー
- Solaris系OS

diffコマンドでのjisとsjisの漢字項目の扱いについて