- ベストアンサー
重複行があるファイル一覧を取得したい
とあるディレクトリ以下(サブディレクトリも含め)に重複行があるファイル一覧を抽出したいです。 Linuxでして、コマンドベースで処理したいです。 お力添えいただけますと幸いです。 宜しくお願いいたします。
- みんなの回答 (4)
- 専門家の回答
質問者が選んだベストアンサー
間違いが有りました。すいません find ./hoge -type f|while read line do echo -n $line " " echo -n `cat $line | sort | uniq -c|sort -k1nr |head -n 1|awk '{print $1}'` echo "" done
その他の回答 (3)
- muuming2001
- ベストアンサー率23% (202/847)
てきとーにつくってます・・・ hogeディレクトリ以下を調べると仮定してとりあえず調査できそうなレベルで作ってます。 ------------------------------- find ./hoge -type f|while read line do echo -n $line " " echo -n `cat $line | sort | uniq -c|head -n 1|awk '{print $1}'` echo "" done -------------------------------------- これでファイル名と重複行の最大値が表示されると思います。 あとは工夫しておくんなまし
- t_hirai
- ベストアンサー率28% (222/788)
ファイル名の重複ってことですかね?
補足
ありがとうございます。 わかりにくくてすみません。 ファイル名の重複ではなく、ファイルの中身に重複行があるものの一覧を得たいです。
- muuming2001
- ベストアンサー率23% (202/847)
重複行があるとはどういう事でしょう? 例1) AAAAAXXX とある決まった文字列一行が存在するファイルがあるファイル一覧がほしい 例2) AAAAAXXXE CDEFFGFAS AAAAAXXXE とファイル内に同じ行が2つ以上あるファイルの一覧が欲しい どっちでしょ?
補足
ありがとうございます。 例2のパターンです。
お礼
ありがとうございます。 助かりました。 最初にいただいた方も、uniq -dcでそれらしいものはとれましたので 早速活用させていただきました。 ありがとうございます。