- ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:複数のファイル(html・txt)から文字抽出)
複数のファイルから文字を抽出する方法
このQ&Aのポイント
- 特定の文字を抽出する方法を考えています。50000を超えるファイル内部の特定の記述部分を抜き出したい。
- ファイルの中に記述されている残したい文字はuser="*****"の*****部分であり、*****は数字が連番で振られている。
- 複数のファイルから文字を抽出するためのToolや方法はありますか?参考となるサイト等でもお伝えください。
- みんなの回答 (3)
- 専門家の回答
質問者が選んだベストアンサー
OSが不明なので具体的な回答が難しいですが、UNIX系だとgrepという有名なツールがあります。 Windowsでも同様のものがあるのでgrep Windowsで検索して探してみて下さい。
その他の回答 (2)
- oboroxx
- ベストアンサー率40% (317/792)
回答No.3
PowerShellでのスクリプトはどうでしょうか。 http://www.oborodukiyo.info/PowerShell/v20/PS-Grep.aspx grepのような感じで使えます。 例えば、 grep.ps1 -in *.txt -filter user= > out.txt という感じで使えると思います。
- ki073
- ベストアンサー率77% (491/634)
回答No.2
ファイルがあちこちのフォルダに散らばっているのならfindで探して、No.1に書かれているようにgrepで該当する行を切り出して、sedか何かで文字列を取り出す方法で、*****の部分は簡単に取り出せます。一行で書けます。 該当する行だけ取り除きたい場合もgrepで可能です。 もう少し複雑なことをしたければ一部の機能をRubyやPerlなどのスクリプト言語で書きます。 Windowsならスクリプト言語で全部書いた方が早いと思います。正規表現の使えるRubyやPerlだと10~20行程度で書けると思います。