• ベストアンサー

大量ファイルから特定項目を一括抽出したい

大量にあるhtmlファイルの中から特定の項目だけを抜き出したいのですが、一括して実行できるフリーソフト、あるいは方法はないでしょうか。 すべてのhtmlファイルはまったく同じフォーマットで作成されており、以下のような形で顧客氏名が入力されています。 <span>氏名:</span><span>だれそれ</span> この「だれそれ」にあたる部分を一括して別の1つのテキストファイルに抽出して吐き出すソフトウェアや方法がないものでしょうか。 ちなみにテキストエディタ(TeraPad)でこれらのhtmlを開くと当該箇所はすべて同じ行に記述されているようです。

質問者が選んだベストアンサー

  • ベストアンサー
noname#182251
noname#182251
回答No.2

どんぴしゃのソフトはオーダーしないとないでしょう。一般的な需要が考えられません。で、比較的ご希望に添いそうなのが「ウェッブパトロール」です。 http://www.vector.co.jp/soft/winnt/net/se348133.html 本来、多数のURLを巡回して指定箇所の変化を監視するソフトですがURLとして c:\myfile\. . . .\kokyaku1.html みたいな指定も可能です。 ファイルの数だけ(数百?)ターゲットとして指定しなければなりませんが、クリップボードからインポートできるので 1.当該ファイル名群をテキストファイルにする 2.メモ帳などでこれを開き、すべてをコピーする 3.ウェッブパトロールでクリップボードからインポートする ような手順でできます。 顧客氏名を切り出すのは簡単に指定できそうです。 結果はMDBファイルに残るので、アクセスなどで開けば、色々加工できます。

nyan-twins
質問者

お礼

これ、どんぴしゃです。 ソフトを開いたときは何が何やらさっぱり分からず添付のマニュアルを読んでさえも設定にかなり戸惑いましたが、最終的には検索結果をエクセルに吐き出すこともできましたので私のやりたいことは完全にカバーできました。 すばらしいソフトウェアだと思います。 本当にありがとうございました。

全文を見る
すると、全ての回答が全文表示されます。

その他の回答 (1)

noname#150436
noname#150436
回答No.1

HTMLならブラウザ上で表示すれば「氏名:××××」 となってるはずですからそれをまとめてコピーすれば良いのでは その後でテキストから「氏名:」だけを一括削除すれば良いのでは

nyan-twins
質問者

補足

説明が足りなかったようで申し訳ありません。 1枚のhtmlファイルは一人の顧客情報に対応していまして、そういうhtmlファイルが何百枚とあります。一つのファイルをブラウザで表示させますと顧客氏名だけではなく、購買品目やら担当者やら雑多な情報が表示されてしまいます。複数のファイルの必要な項目だけを一度に表示できるのなら話は別なのですが。 (と言うかそれが可能なら理想的な解決策なのですが) 引き続きよろしくお願いいたします。

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • 大量のテキストファイルに対して、一括して置換や挿入ができるソフト

    大量のテキストファイル(HTML)に対して、一括して置換や挿入ができるソフトを探しています。 どのくらい大量かというと100個かそのくらいです。私はそれらのテキストファイルすべてに同様な操作(挿入や置換)をしなければなりません。毎日やらなければならないので一括してそういった作業を行えるソフトを探しています。

  • HTMLファイルから、特定の部分だけ抽出する

    下記のようなHTMLファイルがあるのですが、テキストエディタなどを使い、特定の部分だけを抽出することは可能でしょうか? ---------------------------------------------- <h1>sample h1</h1> <h2>sample h2</h2> <p>h2に対する説明文</p> <h2>sample h2</h2> <p>h2に対する説明文</p> ---------------------------------------------- 上記のうち、「h2に囲まれた部分である”sample h2”の文字列だけを抽出し、sample h2以外の部分は全て削除」という処理をしたいのですが、テキストエディタなどで可能でしょうか? テキストエディタは、テラパッドを利用しています。

  • TeraPadで関連付けしたファイル開かない

    こんにちは!!お世話になります。 テキストエディタにTeraPadを使っています。関連づけ したはずですがファイルを開こうとすると「無題」で 起動します。その無題で開いた上に当該のファイルを ドラッグすると支障なく見られます。 ダブルクリックだけで開く方法を教えて下さい。 よろしくお願いします。

  • パワーポイント2007のテキスト一括抽出方法

    パワーポイント2007を使用しています。全てのテキストボックスを選択した後、全てのテキストボックス内のすべてのテキストを一括抽出して、そのテキストをワードに貼りつけたいのですが、その抽出方法がわかりません。教えてください。

  • TeraPadに一括置換のプラグインは?

    TeraPadに一括置換のプラグインは? フリーウェアのテキストエディタ、TeraPadは大変便利なソフトですが、文字列の置換について「一括置換」の機能がありません。 それを補うプラグインはないのでしょうか。 ご存じの方はお教え下さい。

  • テキストファイル内の特定行の一括変換

    テキストファイルがたくさんあります。 そのすべてのテキストファイルの中の特定の行を一括で変換する方法をご存じありませんでようか。 よろしくお願いします。

  • 大量のフォルダの中にあるファイルを一括で取り出す

    大量のフォルダの中にあるファイルを一括で取り出す 方法はないでしょうか。 大量のフォルダで何層にも区分けした一番底に、大量の音楽ファイルが眠っていて、 それを、一つのフォルダにまとめたいのです。

  • テキストファイルに特定の文字を・一気に追加していく方法について

    テキストファイルに特定の文字を・一気に追加していく方法について ------------------------ テキスト1 テキスト2 ~ テキスト100 ------------------------ といった具合に、箇条書きになったファイルが大量にあるのですが、行頭・行末それぞれに、特定の文字列を追加していきたいと思っています(行頭には□マーク、行末には。を追加したいです)。ただ、手作業で行っていたのでは時間が掛かるので、一括で追加したいです。 可能であれば方法を教えてください。 また、そのような機能を備えたテキストエディタ・又は置き換えツール(両者ともフリーソフトでお願いします、、、)をご存じないでしょうか? 現在、使用しているテキストエディタはテラパッドで、OSはvistaです。

  • 特定文字の右側を抽出する方法(関数など)

    数が多いので、Excelやテキストエディタなどを使用して、特定文字の右側すべてや右側3文字などを抽出する方法を教えてください。 @以降の文字を抽出したいときなど 1行目 1345@678 2行目 1346@834 3行目 134@3464

  • テキストファイルの一部分を抽出する方法について

    ログファイルのようなテキストファイルの中から一部分だけ抽出することは可能でしょうか。 たとえばタイトルやSQL文、それに結果がダラダラと並んでいる一連のログファイル(テキストファイル)の中から、使いたい結果の部分だけ使用したいと考えております。 具体的には次のような感じです(テキストファイル部分は一字下げています):  --------------------  18,購入年月  SQL>******(省略します)*******  SQL>******(省略します)*******  SQL>******(省略します)*******  顧客番号  購入年月   購入個数  ----------------------------------  0000012   2010/01   4  0000530   2009/12   16  0001234  2009/11  398  3行取得しました。  ----------------------  19,顧客層  SQL>******(省略します)*******  SQL>******(省略します)*******  SQL>******(省略します)*******  ・・・ 以上のテキストファイルの中から、 (1)「顧客番号  購入年月   購入個数」 から (2)「3行取得しました。」 までを抽出したいです。 検索して範囲指定して切り取り…というのが原始的な方法ですが 対象ファイルが数個あるので、Excelで開き、VBA等で対応できればと思っています。 ちなみに(1)の項目名の間は複数スペースで区切られており、顧客~個数まで固定で、同一ファイル内に同じ文字列はないので、検索の条件に使えると考えています。(2)は抽出件数によって「*行」の箇所が変わるうえ、同一ファイル内の他の部分にも登場する文字列です。 (1)から次に初めて出てくる(2)までを抽出 といったことができればと思うのですが、なかなか良い方法が浮かびません。 何か良い方法がありましたらご教示いただければ幸いです。

専門家に質問してみよう