締切済み

正規表現にマッチした文字列の抽出

2016/09/03 22:45

閲覧頂きありがとうございます。 Linuxのsedコマンドに該当するwindowsコマンドは存在しますでしょうか？存在しない場合、batやマクロでの長い記述となってしまっても構いません。検索で調べたところ、特定のdllを入れればsedを使用できるとあったのですが、その方法は取りたくありません。 100万行以上あるテキストファイル（一行＝一レコード）の中から、正規表現とマッチする文字列の抽出作業です。 1行に1つ、不特定な場所にその文字列が存在するという形です。その抽出した文字列を、別のテキストファイルへ吐き出す…といった処理を想定しています。どうかご教示いただけると幸いです。環境 windows7、EmEditor使用

shinoex
お礼率50% (3/6)

Windows系OS
回答数3
ありがとう数0

みんなの回答 （3）
専門家の回答

みんなの回答

oboroxx
ベストアンサー率40% (317/792)

2016/09/04 05:22 回答No.3

Powershellでregexを使うと正規表現で検索できます。ただ、regexは.Net Frameworkの機能を使うのでそちらを調べないといけません。

notnot
ベストアンサー率47% (4847/10260)

2016/09/04 02:07 回答No.2

grep 相当なら、findstr です。全機能はカバーしてませんが、基本機能はあります。 sed相当、しかも正規表現でとなると、VBScriptかJScriptで作る事になるかと思います。

noname#223623

2016/09/04 00:45 回答No.1

EmEditor を使ってるなら「ファイルから検索」でよさそうな気もする。Windows 標準のコマンドがいいなら findstr かな。

関連するQ&A

バッチファイルで文字列を順番問わずマッチさせたい
バッチファイルで、2個以上の文字列を順番問わずマッチさせたいと考えています。例えば、「111 222 333 444 555 666 777」という内容のテキストファイルがあったとして、 sedコマンドを使って「222」と「444」と「666」がこの順番で含まれている行を置換したい場合、 sed -e "s/.*222.*444.*666.*/置換後の文字列/" in.txt > out.txt とすれば、問題なく置換されると思います。しかし、上記の例では、「777 666 555 444 333 222 111」という内容のテキストファイルは置換されません。文字列の順番を問わず、「222」と「444」と「666」が含まれている行ならば、その行を置換する、といった事は出来ないでしょうか。 sedコマンド以外でも構いませんので、何かいい方法をご存知の方がおられましたらお教え頂けないでしょうか。
- ベストアンサー
- その他（プログラミング・開発）
sedなどで、特定の文字列の後の文字列を抽出したい
sedなどで、特定の文字列の後の文字列を抽出したいシェルスクリプト内で、sedなどを使って特定の文字列の後の文字列を抽出したいのですが、どうすればいいでしょうか？たとえば、abcXYZ123defghiのなかから、XYZの後の「123」を抜き出したいです。 echo abcXYZ123defghi | sed ... のようにして実行させたいです。
- ベストアンサー
- その他（プログラミング・開発）
テキストファイルの特定行、特定列に文字を挿入
テキストファイルがあるとします。ある特定の行、特定の列に文字を挿入したいです。又は、あらかじめ、特定の文字を書いておき、置換により文字を置き換える方法でも良いです。これを、コマンドを使用し、batファイルで自動的に実行したいです。どのような方法があるでしょう？
- ベストアンサー
- Windows系OS
正規表現でマッチさせたい文字列の指定方法
正規表現でマッチさせたい文字列の指定方法についてこんにちは。正規表現について教えてください。秀丸エディタでgrepする時に先頭行に『ファイル名(行数): 』という文字列が先頭行に入りますが、これを正規表現を使用して消したいと思っています。具体的には以下のような表現ですが、どのように指定するのが正しいでしょうか。いくらかテストしているのですが、なかなかうまくできず困っています。消したい文字列 test.log-110411-01.bak.text(38): よろしくお願いします
- 締切済み
- その他（プログラミング・開発）
特定文字列間の文字列の抽出の際についての質問なのですが、
特定文字列間の文字列の抽出の際についての質問なのですが、例 xxxxxaiueoyyyyyaiueoyyyyy となっている場合aiueoだけを抽出したいのですが、 sed -n 's/.*xxxxx$.*$yyyyy.*/\1/p' とすると aiueoyyyyyaiueo が出力されてしまいます。エンド文字が複数あった場合最初にマッチしたものまでの抽出はどのようにしたら宜しいのでしょうか？
- ベストアンサー
- Linux系OS
正規表現を使った文字列の抽出方法について
正規表現を使った文字列の抽出方法について RHELを使っています。テキストデータの中に、以下のようなデータが百万行単位で並んでいます。（カンマ区切り、2列構成） 1, 1.24425 2, 3.25252 （中略） 13, 6.25365 14, 8,36222 （中略） 103633, 252525.0 最終的にやりたいことは2列目のデータのみの抽出です。考え方として、正規表現で「<任意の文字列の連続><カンマ>」という文字列を認識させ、それを「空欄」で置換したいと考えています。文字列の最後の文字をマッチさせる指定子が「$」という情報をWebで見つけたのでまず、grepで見つけられるか以下のようにやってみたのですが、 grep -i ",$" test.txt $が環境変数と取られ、構文エラーとなってしまいます。使い方がおかしいのでしょうか？ちなみに、うすうす感じている疑問として、「$」は文末にくるものしかマッチしなかったりしますでしょうか？カンマ区切りなので、表計算ソフトを使えなくもないですが、行数がExcel2007の限界をよく超えるので、それ以外の方法で考えています。アドバイスよろしくお願いいたします。
- ベストアンサー
- Linux系OS
正規表現にマッチする文字列の一括出力
任意の正規表現を与えてやり、そのパターンに合致する文字列を１行１文字列でテキストファイルに一括出力したいと考えています。例えば、 [a-z][a-z][a-z] を与えてやると、 aaa aab aac aad ... ... zzx zzy zzz と、26の3乗で17576行の文字列をテキストファイルなどに出力。 LINUXのコマンドラインなら多少分かるのですが、プログラミングはさっぱりで、上記の目的につかえそうなユーティリティも探してみたのですが、見つけることはできませんでした。よい方法がありましたら、ご教授よろしくお願いいたします。
- ベストアンサー
- その他([技術者向] コンピューター)
ある文字列を含む行の抽出
お世話になります。いくつかのテキストファイルがあり、それらのファイルのなかの、特定の文字列を含む行をすべて抽出して、別ファイルに集めて保存するようなことを、自動的に行うことはできますでしょうか？？ officeソフトでできればよいのですが、ほかの方法でもかまいません。お願いいたします。
- ベストアンサー
- オフィス系ソフト
sedなどで、特定の文字列内の数値を抽出したい
sedなどで、特定の文字列内の数値を抽出したいシェルスクリプト内で、sedなどを使って特定の文字列内の文字列を抽出したいのですが、どうすればいいでしょうか？たとえば、job 999 at 2016-09-28 00:00のなかから、job ～ at内の「999」を抜き出したいです。 echo job 999 at 2016-09-28 00:00 | sed -e 's///g'... のようにして実行させたいです。
- 締切済み
- その他（プログラミング・開発）
DOS　特定の文字列を含むファイルのみの抽出方法
C直下に2つのテキストファイル「A.txt」「B.txt」が存在するとします。 Aには「Start」、Bには「Second」という文字列が含まれているとします。これらのテキストを、BATを使って『テキスト内に特定の文字列が含まれているファイル』のみをDOSプロンプト上に表示する方法をご教示願います。 ■想定するコマンド実行結果・Start.BATを実行→DOSプロンプトにて「A.txt」のみが表示する。・Second.BATを実行→DOSプロンプトにて「B.txt」のみが表示する。よろしくお願いします。
- 締切済み
- その他（プログラミング・開発）

正規表現にマッチした文字列の抽出

みんなの回答

関連するQ&A

注目のQ&A

カテゴリ
一覧

専門家に質問してみよう
専門家登録

あなたにピッタリな商品が見つかる！ OKWAVEセレクト

正規表現にマッチした文字列の抽出

みんなの回答

関連するQ&A

注目のQ&A

カテゴリ 一覧

専門家に質問してみよう 専門家登録

あなたにピッタリな商品が見つかる！ OKWAVEセレクト

カテゴリ
一覧

専門家に質問してみよう
専門家登録