- ベストアンサー
大量ファイルから特定項目を一括抽出したい
大量にあるhtmlファイルの中から特定の項目だけを抜き出したいのですが、一括して実行できるフリーソフト、あるいは方法はないでしょうか。 すべてのhtmlファイルはまったく同じフォーマットで作成されており、以下のような形で顧客氏名が入力されています。 <span>氏名:</span><span>だれそれ</span> この「だれそれ」にあたる部分を一括して別の1つのテキストファイルに抽出して吐き出すソフトウェアや方法がないものでしょうか。 ちなみにテキストエディタ(TeraPad)でこれらのhtmlを開くと当該箇所はすべて同じ行に記述されているようです。
- みんなの回答 (2)
- 専門家の回答
質問者が選んだベストアンサー
- ベストアンサー
どんぴしゃのソフトはオーダーしないとないでしょう。一般的な需要が考えられません。で、比較的ご希望に添いそうなのが「ウェッブパトロール」です。 http://www.vector.co.jp/soft/winnt/net/se348133.html 本来、多数のURLを巡回して指定箇所の変化を監視するソフトですがURLとして c:\myfile\. . . .\kokyaku1.html みたいな指定も可能です。 ファイルの数だけ(数百?)ターゲットとして指定しなければなりませんが、クリップボードからインポートできるので 1.当該ファイル名群をテキストファイルにする 2.メモ帳などでこれを開き、すべてをコピーする 3.ウェッブパトロールでクリップボードからインポートする ような手順でできます。 顧客氏名を切り出すのは簡単に指定できそうです。 結果はMDBファイルに残るので、アクセスなどで開けば、色々加工できます。
その他の回答 (1)
HTMLならブラウザ上で表示すれば「氏名:××××」 となってるはずですからそれをまとめてコピーすれば良いのでは その後でテキストから「氏名:」だけを一括削除すれば良いのでは
補足
説明が足りなかったようで申し訳ありません。 1枚のhtmlファイルは一人の顧客情報に対応していまして、そういうhtmlファイルが何百枚とあります。一つのファイルをブラウザで表示させますと顧客氏名だけではなく、購買品目やら担当者やら雑多な情報が表示されてしまいます。複数のファイルの必要な項目だけを一度に表示できるのなら話は別なのですが。 (と言うかそれが可能なら理想的な解決策なのですが) 引き続きよろしくお願いいたします。
お礼
これ、どんぴしゃです。 ソフトを開いたときは何が何やらさっぱり分からず添付のマニュアルを読んでさえも設定にかなり戸惑いましたが、最終的には検索結果をエクセルに吐き出すこともできましたので私のやりたいことは完全にカバーできました。 すばらしいソフトウェアだと思います。 本当にありがとうございました。