ベストアンサー

【正規表現】コメントアウトされていない文字列のマッチ

2010/01/22 10:47

お世話になっております。あるファイル群にgrepをかけて結果を取得したいのですがあと半歩という所でつまづいています。正規表現の考え方のご示唆をいただけませんでしょうか。宜しくお願い致します。 ■やりたいことコメントアウトされていない文字列のマッチ ■対象文字列 1行目：ほげ 2行目：//ほげ 3行目：// これは否定ほげ 4行目：ほげ //ここにコメントがはいるとひっかからない（＞＜） ■コメントアウト文字 // 1行目と4行目の「ほげ」をマッチさせたいのです。正規表現の先読み否定を使って ^(?!//.*)ほげ$ 行頭から、「//」が後に続かなくて「ほげ」がある行末とやってるのですが、 4行目がひっかかりません。 (?!//.*)の部分で、「//」から「ほげ」までを否定している為だと思うのですが、どのように考え、どのように記載すればスマートでしょうか。お忙しい所恐縮ですがアドバイスいただければ幸いです。宜しくお願い致します。

あんらいぷぜろいち（@Unripe01）
お礼率100% (16/16)

Perl
回答数2
ありがとう数5

みんなの回答 （2）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

ORUKA1951
ベストアンサー率45% (5062/11036)

2010/01/22 11:56 回答No.1

＞ほげ$ 　これだと、"ほげ"の後に文字があるとダメだね。 4行目：ほげ //ここにコメントがはいるとひっかからない（＞＜）だけじゃなく　ほげ　ほげ // 　ほげじゃないすべて引っかからないはず。 /(?!\/\/).*ほげ.*$/

質問者

お礼 2010/01/22 13:08

ご指摘ありがとうございます！質問の正規表現そのものが間違ってました。お恥ずかしい。いただいた正規表現で期待する文字をマッチさせる事ができました。この場合1文字ずつまっちさせている感じですね。行マッチさせたい場合は ^(?!//).*ほげ.*$ にて解決です。ありがとうございました。

その他の回答 (1)

airiell
ベストアンサー率0% (0/1)

2010/01/22 11:57 回答No.2

^(?!.*'.*ほげ).*ほげ.*$ とかわいかがでしょうか

質問者

お礼 2010/01/22 12:25

ありがとうございます！質問部分の、「//」から「ほげ」までを否定ではなく、「ほげ」までを含むことで回避・・・ということですね。しかしそれだと、　 (?!.*'.*ほげ)　部分で、コメントの最後までをマッチした為ほげ //ほげがひっかかりませんでした・・・

関連するQ&A

正規表現でマッチさせたい文字列の指定方法
正規表現でマッチさせたい文字列の指定方法についてこんにちは。正規表現について教えてください。秀丸エディタでgrepする時に先頭行に『ファイル名(行数): 』という文字列が先頭行に入りますが、これを正規表現を使用して消したいと思っています。具体的には以下のような表現ですが、どのように指定するのが正しいでしょうか。いくらかテストしているのですが、なかなかうまくできず困っています。消したい文字列 test.log-110411-01.bak.text(38): よろしくお願いします
- 締切済み
- その他（プログラミング・開発）
正規表現。行頭が○○以外にマッチさせたい。
正規表現を勉強しています。行頭がxyzという文字列以外をマッチさせたいと思っています。行頭にマッチさせるには"^xyz"と理解できます。[^xyz]とやるとx,y,z以外の文字列にマッチするのもわかります。ただ、これだと 123 xyz の文字にもマッチしていまいます。行頭がxyzで続く文字列以外にマッチさせる正規表現はどうかけばよろしいでしょうか？
- ベストアンサー
- その他（プログラミング・開発）
grepにマッチした正規表現の文字列を取得したい
grepにマッチした正規表現の文字列を取得し、マッチした文字列を一覧で取得したいのですが、方法がわかりません。 ※例 grep [0-9][0-9][0-9][0-9][0-9] 検索ファイル名 > 出力ファイル名不明点あればお知らせください。よろしくお願いします。
- ベストアンサー
- その他（プログラミング・開発）
''で囲まれていない文字列にマッチする正規表現
下記のような文字列($str)に対して置換を行い、 my $str = qq{ AAA = BBB - 'CCC' }; $str =~ s/★正規表現★/sprintf("DDD(%s)",$1)/xmsge ; 変換後 $str = DDD(AAA) = DDD(BBB) - 'CCC' ; を実現する★正規表現★を書きたいと思っています。　・AAA,BBB,CCCは[\w]で構成される文字列です。ですが、シングルクォーテーション('')で囲まれていない文字列にマッチする正規表現が書けなく困っています。一度、シングルクォーテーションで囲まれているものも含めて全てDDD()をつけて、そのあとで、シングルクォーテーションを含むものは元に戻すことでやりたいことは実現できているのですが、1行で実現できる方法を探しています。アドバイスよろしくお願いします。
- ベストアンサー
- Perl
正規表現を使った文字列の抽出方法について
正規表現を使った文字列の抽出方法について RHELを使っています。テキストデータの中に、以下のようなデータが百万行単位で並んでいます。（カンマ区切り、2列構成） 1, 1.24425 2, 3.25252 （中略） 13, 6.25365 14, 8,36222 （中略） 103633, 252525.0 最終的にやりたいことは2列目のデータのみの抽出です。考え方として、正規表現で「<任意の文字列の連続><カンマ>」という文字列を認識させ、それを「空欄」で置換したいと考えています。文字列の最後の文字をマッチさせる指定子が「$」という情報をWebで見つけたのでまず、grepで見つけられるか以下のようにやってみたのですが、 grep -i ",$" test.txt $が環境変数と取られ、構文エラーとなってしまいます。使い方がおかしいのでしょうか？ちなみに、うすうす感じている疑問として、「$」は文末にくるものしかマッチしなかったりしますでしょうか？カンマ区切りなので、表計算ソフトを使えなくもないですが、行数がExcel2007の限界をよく超えるので、それ以外の方法で考えています。アドバイスよろしくお願いいたします。
- ベストアンサー
- Linux系OS
正規表現否定先読み問題
正規表現の本で以下の否定先読み問題が解答を読んでもよくわかりません。【問題】次の文字列で、最後のスラッシュ（「/」）の後ろに続く部分にマッチする正規表現を書きなさい。　　/usr/home/gihyo/hoge.txt 【マッチする個所】 hoge.txt 【解答】 (?!.*/).+ 【解説】「最後のスラッシュ」とは、それ以降にはスラッシュが無いという意味です。このことから否定先読みを利用して「(?!.*/)」と書くことで最後のスラッシュの位置を特定できます。「.*/」はスラッシュ迄の任意の文字列にマッチする正規表現です。これが否定先読みの条件になっているということは、後ろにスラッシュまでの任意の文字列がない位置にマッチするということです。言いかえればそれ以降にスラッシュは存在しないことになります。(解説ここまで) 上記解説がよくわかりません。 (「後ろにスラッシュまでの任意の文字列がない位置」ってなんですか?) 分かる方、是非解説の解説をお願いいたします。
- ベストアンサー
- Java
[15]にマッチする正規表現
[15]にマッチする正規表現 [15] にマッチする正規表現を書きたいのですが、うまくいきません。。。。簡単だ、と思ったのですが。。。 expr "$DATA1" : .*\[15\].* と書くと、中の数字が15じゃなくてもマッチしてしまいます。 expr "$DATA1" : .*15.* であれば"15"にマッチしますが、対象の文字列の都合上、カッコでも識別する必要があり困っております。[と]をエスケープする目的で\をつける、と思っているのですが、何か思い違いをしているのでしょうか。
- ベストアンサー
- その他（プログラミング・開発）
Linuxの正規表現について
Linuxの正規表現について教えてください。正規表現を使うと、文字列のパターンを表す事ができる。例えば、行頭が「＃」で始まる行は＿＿＿＿、aもしくはfで始まる三文字の文字列は＿＿＿＿となるという問題なんですけど＿＿＿＿の部分をだれか教えてください。明日テストなんだけどわからくて… お願いします。
- ベストアンサー
- その他([技術者向] コンピューター)
「マッチしない」正規表現の書き方
正規表現について、おたずねします。文字列 abc，def，ghi のいずれかにマッチする正規表現は (abc|def|ghi) ですよね。それでは、「abc，def，ghi のいずれにもマッチしない」正規表現は、どう書けばいいのでしょうか？あちこち調べましたが、どうしてもわかりません。ただし、if $a =~ /(abc|def|ghi)/ などで、=~ を !~ に直す、というのはナシです。あくまでも右辺の式の中で表現したいのですが…
- 締切済み
- Perl
正規表現　　マッチさせれない　C#
下記のもの全体にマッチさせる表現を考えていたのですが、どぉしても思いつきません。まだまだ正規表現についてわかっていないのでご教授いただけないでしょうか。 /// <summary> /// メソッド１ /// </summary> /// <param name="Out">1:入力文字,2:出力文字)</param> ///　文字列　　　　　の部分は行が増えたり減ったりするので /// と文字列と改行文字で1つのくくりにしてそれを任意の回数繰り返しでマッチさせようとしています。 ([/// .*] \r\n)*　　 (///[.<>/]* \r\n)*　など試しましたがマッチしません。　そもそもこのようなものをマッチさせること自体無理なのかもしれませんが　その点も含めご教授お願いいただけますでしょうか。言語はC#です
- 締切済み
- その他（プログラミング・開発）

【正規表現】コメントアウトされていない文字列のマッチ

質問者が選んだベストアンサー

お礼 2010/01/22 13:08

その他の回答 (1)

お礼 2010/01/22 12:25

関連するQ&A

注目のQ&A

カテゴリ
一覧

専門家に質問してみよう
専門家登録

あなたにピッタリな商品が見つかる！ OKWAVEセレクト

【正規表現】コメントアウトされていない文字列のマッチ

質問者が選んだベストアンサー

お礼 2010/01/22 13:08

その他の回答 (1)

お礼 2010/01/22 12:25

関連するQ&A

注目のQ&A

カテゴリ 一覧

専門家に質問してみよう 専門家登録

あなたにピッタリな商品が見つかる！ OKWAVEセレクト

カテゴリ
一覧

専門家に質問してみよう
専門家登録