- ベストアンサー
Windows10エクスプローラーのバグ?ダウンロードしたファイルに重複が発生
- Windows10のエクスプローラーでIZ*ONEのインスタグラムのファイルをダウンロードし、Falconアプリで再生中に通信の切断が発生しました。エラーが発生し、再起動するたびに同じファイル数になるかは不明ですが、ファイルのダウンロード時に重複が発生しています。
- Tablacus Explorerを使用して同じ操作を試したところ、重複が解消されました。Windows10のエクスプローラーにバグがあるのか、Falconアプリとの相性の問題なのかは不明です。
- 利用環境はWindows 10 Homeの20H2バージョンであり、Falconのバージョンは2.4.0.3、Tablacus Explorerのバージョンは21.4.19.0です。問題の原因を特定するためには詳細な調査が必要です。
- みんなの回答 (1)
- 専門家の回答
質問者が選んだベストアンサー
専門家ではありません。 クローラー(スクレイピングツール)が、たどるディレクトリー構造から、同じファイルが見つかり、それをクローラーが同じものかどうか判断しかねてクロールしてしまっているのか? それとも重複しているものを回避するというルーチンが甘いのか? いずれにせよどのサイトもグーグルさんにクロールされやすい構造にしようとしているので、グーグルさんのクロール変更に伴い変更したサイト構成に他のクローラーが惑わされているのかもしれません。 ”大規模で定常的にクローリングするための手法” https://codezine.jp/article/detail/10400 ”クローラーとは?サイト巡回の仕組みを解説” https://cluster-seo.com/blog/crawler.html 後から重複ファイルを削除するとかで対応してみては・・・ ”複数フォルダの重複ファイルを検索して削除できるソフト。” https://forest.watch.impress.co.jp/library/software/filemany/ ”無料重複ファイル・類似画像検索ソフト” https://freesoft-100.com/pasokon/duplication.html (画像引用) https://pixabay.com/ja/photos/search/%E8%91%89%E3%82%92%E7%86%8A%E6%89%8B%E3%81%97%E3%81%BE%E3%81%99/ こちらも参考に! ”Webスクレイピングツールにオススメの10選【2021年更新】” https://www.octoparse.jp/blog/the-10-best-web-scraping-tools/ 「クローリングソフト」に関する質問と回答 https://okwave.jp/search?word=%E3%82%AF%E3%83%AD%E3%83%BC%E3%83%AA%E3%83%B3%E3%82%B0%E3%82%BD%E3%83%95%E3%83%88 「スクレイピング」に関する質問と回答 https://okwave.jp/search?word=%E3%82%B9%E3%82%AF%E3%83%AC%E3%82%A4%E3%83%94%E3%83%B3%E3%82%B0%E3%80%80 良いデータ収集ができますように! 参考になれば幸いです。
お礼
kanekanetoさん、回答ありがとうございます。 また、お礼が遅くなり申し訳ございません。 重複ファイルを探してくれるアプリは便利ですね。 目視でチェックしてたのがバカみたいです。 いくつものアプリを試していると、お礼もそっちのけで夢中になり・・・ はい、言い訳です。m(__)m (笑)