• 締切済み

テキストファイルにURLが5.000個程羅列されて

テキストファイルにURLが5.000個程羅列されていますが、重複しているURLを削除して整理したいのですが、このような作業をしてくれるフリーソフトがごさいましたら、ぜひ教えて下さいませ。 エクセルでもできると聞いた事がございますが、エクセル2000しか持っておりません。

みんなの回答

  • Nobu-W
  • ベストアンサー率39% (725/1832)
回答No.4

データ→フィルタ→フィルタオプションの設定の「重複するレコードは削除」 ってのをいじって できませんか?

kiran369633
質問者

お礼

ありがとうございます。

  • skp026
  • ベストアンサー率45% (1010/2238)
回答No.3

Excelにはテキスト形式を読み込む機能があります。 手順としては以下のような感じになります。 http://enterprisezine.jp/iti/detail/675 今回のテキストファイルはURLのみとのことです。 上記の例では複数列に区切られてましたが、 今回のデータは1列のみになります。 ウィザード画面で調整は必要ないはずですから、 すぐに完了を押しても差し支えないです。 読み込んだあとは、並べ替えをして、 重複を目で確認し、必要ないものは行削除します。

kiran369633
質問者

お礼

ありがとうございます。

  • kawais070
  • ベストアンサー率52% (2242/4283)
回答No.2

秀丸マクロで重複行の削除をするやつがあります。 http://hide.maruo.co.jp/lib/macro/erasesameline213.html 秀丸は有料ソフトですが、短期間であれば試用も可能です。

kiran369633
質問者

お礼

ありがとうございました。 頑張ってみます。

  • bardfish
  • ベストアンサー率28% (5029/17766)
回答No.1

Perlという言語で可能です。 Perlには連想配列という他の言語にはない独特の仕様があり、配列番号に文字列を使用できます。 配列番号にURLが格納された変数を使い、一応件数をカウントさせる。 URLが記述されたファイルから読み込んでこの処理を行わせる。 読み込みが終わったら、配列の終わりまでループさせて配列番号である文字列を新しいファイルに書き出せば重複行がなくなっているはずです。 Excelでもシートにインポートしたらソートかけてピポットテーブル?か何かで重複行をまとめさせてエクスポートすればいいだけのはずです。 Excel2000でも出来るはずですよ。 Excelは手元にないので詳しい操作は説明できないので試行錯誤してみてください。

kiran369633
質問者

お礼

ありがとうございました。 挑戦してみたいと思います。

関連するQ&A

専門家に質問してみよう