締切済み

正規表現が意図しているより余計にマッチしてしまう

2013/04/04 10:46

perl の正規表現について質問いたします。末尾に記載したスクリプトを実行すると、入力中(__DATA__)の --- <subheadword>ccccc</subheadword> ccccc ccccc ccccc ccccc ccccc --- が、正規表現中の --- ( <subheadword>.+?</subheadword>\n .+?\n <p\stype="A">.+?\n <p\stype="B">.+?\n )+ --- の部分にマッチしてしまいます。なぜマッチするのか、どなたか教えていただけませんでしょうか ---ここから末尾までがソース--- use strict; local $/ = "</dic>\n"; while (my $block = <DATA>) { if ($block =~ m{ <dic>\n <headword>.+?</headword>\n ( <subheadword>.+?</subheadword>\n .+?\n <p\stype="A">.+?\n <p\stype="B">.+?\n )+ </dic>\n }x) { print STDERR "NG\n"; } else { print STDERR "OK\n"; } } __DATA__ <dic> <headword>AAAAAA</headword> <subheadword>aaaaa</subheadword> aaaaa aaaaa aaaaa <subheadword>bbbbb</subheadword> bbbbb bbbbb bbbbb <subheadword>ccccc</subheadword> ccccc ccccc ccccc ccccc ccccc </dic>

aaaammmm
お礼率0% (0/4)

Perl
回答数4
ありがとう数0

みんなの回答 （4）
専門家の回答

みんなの回答

dekopon_0329
ベストアンサー率83% (5/6)

2013/04/07 10:03 回答No.4

この正規表現が意図するところって、各<subheadword>の下にタグがABの2つ以外入ってくるような場合はNGにしたいのにOKが出てしまうので困ってる、ということではなかったですか？であれば、単純にNGとOKが逆になってるだけってことはないでしょうか・・？正規表現的には問題ないようが気がします。 -------------------- print STDERR "NG\n"; } else { print STDERR "OK\n"; } -------------------- ↓ -------------------- print STDERR "OK\n"; } else { print STDERR "NG\n"; } -------------------- 違ってたらスイマセン。

kmee
ベストアンサー率55% (1857/3366)

2013/04/04 14:04 回答No.3

あ、そっか。通常は . が改行文字にマッチしないのを失念してました。ということで、その例では、「マッチしません」

kmee
ベストアンサー率55% (1857/3366)

2013/04/04 13:48 回答No.2

Lazy matchは、「複数候補があった時に、最短のものを選ぶ」ものだから。 <p\stype="B">.+?\n の.+?は、続く「\n」がなるべく近くなるようにマッチしますが、「\n」に「マッチしない」のではありません。

Tacosan
ベストアンサー率23% (3656/15482)

2013/04/04 13:27 回答No.1

手元の ActivePerl 5.16.0 ではマッチしない. OK が表示される.

正規表現が意図しているより余計にマッチしてしまう

みんなの回答

関連するQ&A

連想配列を変数にする？

テーブル結合のSQL文について

sedで特定の文字列を抜き出す方法

３つ以上の外部結合から抽出するSQL構文

csvデータの番号付加について。

グループ化+最大値

Excelシート内の行の統合（圧縮）について

VBAでマクロを作りたいのですが、、、困ってます

データの内容に1フィールド追加する方法

【Excel2007】A列の値がB列に存在しないことを確認したい

複数のＰＫを持つテーブル同士の結合について

jQuery.ajaxのdata部分を共通化したい

PHPでDBからデータを抽出してHTMLで表示する

セルの値を転記

テーブルAにあって、テーブルBにないデータ抽出

PHPでDBからデータを抽出してHTMLで表示

正規表現　誤入力にもマッチ

正規表現について

Dreamweaver現状維持したまま編集不可能領域を編集可能領域へ

正規表現の書き方に困っております。

注目のQ&A

カテゴリ
一覧

専門家に質問してみよう
専門家登録

あなたにピッタリな商品が見つかる！ OKWAVE セレクト

正規表現が意図しているより余計にマッチしてしまう

みんなの回答

関連するQ&A

連想配列を変数にする？

テーブル結合のSQL文について

sedで特定の文字列を抜き出す方法

３つ以上の外部結合から抽出するSQL構文

csvデータの番号付加について。

グループ化+最大値

Excelシート内の行の統合（圧縮）について

VBAでマクロを作りたいのですが、、、困ってます

データの内容に1フィールド追加する方法

【Excel2007】A列の値がB列に存在しないことを確認したい

複数のＰＫを持つテーブル同士の結合について

jQuery.ajaxのdata部分を共通化したい

PHPでDBからデータを抽出してHTMLで表示する

セルの値を転記

テーブルAにあって、テーブルBにないデータ抽出

PHPでDBからデータを抽出してHTMLで表示

正規表現 誤入力にもマッチ

正規表現について

Dreamweaver現状維持したまま編集不可能領域を編集可能領域へ

正規表現の書き方に困っております。

注目のQ&A

カテゴリ 一覧

専門家に質問してみよう 専門家登録

あなたにピッタリな商品が見つかる！ OKWAVE セレクト

正規表現　誤入力にもマッチ

カテゴリ
一覧

専門家に質問してみよう
専門家登録