preg_matchのキャプチャ用サブパターンにマッチした文字列について

2023/08/09 01:56

このQ&Aのポイント

preg_matchのキャプチャ用サブパターンにマッチした文字列について、条件を満たすかどうかについての質問です。
条件1では、[*DATA: *]で囲まれたデータ（以下DATA）を取得することが目的です。
しかし、条件2において、oXoまたはoYoが順不同で、それぞれ1回または0回出現するという条件を満たす結果を得る方法を知りたいとのことです。

ベストアンサー

preg_matchのキャプチャ用サブパターンにマッチした文字列について

2009/09/08 09:52

お世話になります preg_matchのキャプチャ用サブパターンにマッチした文字列について意図した動作が、試行錯誤しても全く得られませんので分かる方にお教えいただきたく存じます条件1 [*DATA: *]で囲まれたデータ（以下DATA）を取得条件2 DATAにはoXoまたはoYoが順不同で、それぞれ1回または0回出現する $test = '[*DATA: A oYo B oXo C *]'; $reg = '/\[\*DATA:(.*?)(oXo|oYo)(.*?)(oXo|oYo)?(.*?)\*\]/u'; preg_match($reg,$test,$match); $matchの結果 $match[0] => [*DATA: A xYx B xXx C *] $match[1] => A $match[2] => oYo $match[3] => $match[4] => $match[5] => B oXo C 期待した結果 $match[0] => [*DATA: A oYo B oXo C *] $match[1] => A $match[2] => oYo $match[3] => B $match[4] => oXo $match[5] => C 1回または0回を表す「(oXo|oYo)?」が「0回」という条件が先に評価されてしまっているようなのですが「1回」を先にするすべはあるのでしょうか？「(oXo|oYo)?」を「(oXo|oYo)」にすると期待した結果になりますが、条件２の「oXoが0回」「oYoが1回」出現した場合マッチしなくなります。識者の方、お忙しい中恐縮ですがご教授いただけたらうれしいです。

susan-styl
お礼率86% (181/210)

PHP
回答数1
ありがとう数1

みんなの回答 （1）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

karumakaruma
ベストアンサー率65% (65/100)

2009/09/09 17:38 回答No.1

非格納グループで１つのまとまりをグルーピングすればできると思います。 $reg = '/\[\*DATA:(.*?)(o[XY]o)(.*?)(?:(o[XY]o)(.*?))?\*\]/u'; (?:(o[XY]o)(.*?))? この部分が非格納グループによるグルーピングで ?で0回か1回にしているのでマッチしなければ格納されません。テストパターンとして $test = '[*DATA: A oYo B oXo C *]'; Array ( [0] => [*DATA: A oYo B oXo C *] [1] => A [2] => oYo [3] => B [4] => oXo [5] => C ) $test = '[*DATA: A oYo B *]'; Array ( [0] => [*DATA: A oYo B *] [1] => A [2] => oYo [3] => B ) となりました。

関連するQ&A

preg_replace()でマッチ文字列に関数を
PHPでのpreg_replace()でマッチした文字列に関数を適用したいのですが、上手くいきません。 $str = "hogeHoge"; $pattern = '/(h.ge)/i'; $replacement = strtoupper("$1"); echo preg_replace($pattern, $replacement, $str); // 期待する結果 : HOGEHOGE // 実行した結果 : hogeHoge 根本的に間違っているかもしれませんが、ご指南いただければ幸いです。
- ベストアンサー
- PHP
preg_matchでの　コンマ　について　
phpでの正規表現で「もしも変数$wordへ入力した文字列が Japan's という文字列に一致すれば」というスクリプトを作成しましたが、うまくいきません。 if(preg_match("/japan\'s/i",$word,$match)){ この Japan's におけるカンマの取り扱いをこのケースではどうしたらいいかよくわかりません。 \' としてみましたが、うまくいきません。なにかアドバイスやヒントがありましたら、よろしくお願いします。ああでもない、こうでもないとやってみましたが、その過程で唯一 Japan's にヒットしたのは、次のスクリプトでした。 if($word=="japan\'s") ただし、これは正規表現は使っていないわけですよね。なにか、自分のローカル環境に問題があるのかと思い、レンタルサーバーに同じものをuploadして試して見ましたが、やはり結果は同じで、ヒットしませんでした。別のパソコンでもやってみましたが、結果は同じでした。整理しますと、 (preg_match("/japan's/i",$word,$match)　ではヒットせず、よって　コンマの前に\をつけて(preg_match("/japan\'s/i",$word,$match)　としましたが、これもヒットしなかったということになります。 1) (')は正規表現の特殊文字でないはずですから、そのまま使えるはずだと思いましたが、なぜかこれが使えない。 2) しかも、その前にエスケープの \　をつけても、そのエスケープ　が効かないのはなぜか。追記: 最近分かったこと。　おもしろいことに、 'j すると、hitする。でも、j' とするとヒットしない。　ということは、コンマ自体には問題ないのだろうと推測しています。でも、文字の後にコンマがつくと、preg_matchにとって特別な意味を持つ文字列に変わるのではないか。
- ベストアンサー
- PHP
正規表現　preg_match_all　
$c = preg_match_all('@href="/Top/World/Japanese/(?P<query>.*?)">(?:<b>|)(?P<cate>.*?)(?:</b>|)</a>@s', $buf,$match,PREG_SET_ORDER); print_r($match); の(?:<b>|)と(?:</b>|)の部分がまちがっているので、<b></b>タグがあってもなくてもいい場合にマッチさせることができないと思っています。どうか教えてくださいませ。ちなみにＰＨＰの5.2.2です。
- ベストアンサー
- PHP
正規表現の文字化け？で困っています。
preg_matchで、条件を変数で定義したいのですが、うまくいきません。すみませんが、教えてください。 $str = "hoge.php?a=10&b=3"; から"a=10"をマッチさせる場合。 preg_match('/^(.*(\?|&))(a=.*)(&.*)*$/', $str); で、一応うまくいきます。マッチ条件を状況により変更させるため、まずは、 $con = "'/^(.*(\?|&))(a=.*)(&.*)*$/'"; preg_match($con, $str); のようにしたいのですが、なぜかマッチしてくれません。すみませんが、対策方法の分かる方がいらっしゃましたら、ご教授の程、よろしくお願いいたします。
- ベストアンサー
- PHP
PHP：preg_match_allで複数条件指定
preg_match_allで複数条件を設定する方法についてお尋ねします。環境 PHP:5.1.6 MySQL：5.0.77 --------ソース例------------------------------------------ <a href="1000/23">1: 【国語】接続後について　(授業１) (20)</a> <a href="1000/26">2: 【数学】分数 (206)</a> --------------------------------------------------------- 上記のようなHTMLソースを分解してMySQLに登録することを考えています。（１行目） 1000/23　| 1 | 【国語】接続後について　(授業１) | 20 （2行目） 1000/26　| 2 | 【数学】分数 | 206 という形に a hrefの中身　｜スレッド番号 | タイトル | コメント数 4つに分解してMySQLに登録します。正規表現を学んで、個別にデータを取り出すことはできました。以下に作成したソースを記載します。 $contents='<a href="1000/23">1: 【国語】接続後について　(授業１) (20)</a><a href="1000/26">2: 【数学】分数 (206)</a>'; preg_match_all( '/<a href="(.*?)">/su', $contents, $match ); foreach ( $match[ 1 ] as $var ) { echo htmlspecialchars($var)."<br>"; } preg_match_all( '/">([0-9]*?):/su', $contents, $match2 ); foreach ( $match2[ 1 ] as $var2 ) { echo htmlspecialchars($var2)."■<br>"; } preg_match_all( '/[0-9]: (.*?)$[0-9]*$<\/a>/su', $contents, $match3 ); foreach ( $match3[ 1 ] as $var3 ) { echo htmlspecialchars($var3)."■<br>"; } preg_match_all( '/$([0-9]*?)$</su', $contents, $match4 ); foreach ( $match4[ 1 ] as $var4 ) { echo htmlspecialchars($var4)."●<br>"; } 【実行結果】 1000/23 1000/26 1 2 【国語】接続後について　(授業１) 【数学】分数 20 206 1行ずつMySQLに登録したいので preg_match_all( '/条件1,条件2,条件3,条件4/su', $contents, $match ); のような形で指定して個々の値を下記の変数に入れることは可能でしょうか？ループ処理開始{ $url $num $title $res //MySQLに接続 //データ登録 }
- ベストアンサー
- PHP
preg_matchの正規表現で
空白があってもなくてもマッチするようにするにはどうやって表現したらよいでしょうか。マッチ条件："佐藤ヨシオ" 対象："佐藤ヨシオ","佐藤ヨシオ","佐藤ヨシオ"; これらすべてにマッチするようにしたいです。 x：拡張正規表現（空白が無効）と他サイトで見かけたのですが、これをどうやって使えばいいのかわかりません。 preg_match("佐藤ヨシオ",$val); このようにやってみてもうまく動いてくれません。ヒントでもいいので教えていただけたらと思います。
- 締切済み
- PHP
正規表現で文字列の抜き出し
PHP4で、文字列の中からマッチしたものを抜き出したいのですが、なかなか上手いこといきません。 $str = "<a href=http://www.abc.com/><b>ABC</b>company</a>"; preg_match("/<a href=(.*)>(.*)<\/a>/i",$str,$str_reg); http://www.abc.com/ と <b>ABC</b>company の2つを抜き出したいのですが、 <b>タグが邪魔をして抜き出せません。どうすれば上記2つを抜き出せるのでしょうか？
- ベストアンサー
- PHP
excel関数　matchの使い方について
早速質問します。行　Ａ　Ｂ　Ｃ１　２　２２　４３　５４　３５　８６　２ C1セルにMATCH(B1,A1:A6,0)を式を入れるとA1セルに「２」という値があるので、C1には戻り値として「１」が返ると思うのですが、続けてC2セルに続きの検索を行いたい（A6セルに「２」というデータが入っているのでC2セルには「５(=6-1)」という結果を期待してます）のですが、うまくいく方法が思いつきません。知恵をお貸しいただけないでしょうか？ MATCH(B2,A1:A6,0)と第１セクションに手動で「B2」といわれと、目的の結果が得られますが、汎用性を持たせるため自動で結果が入れれるようにしたいのでお願いします。
- ベストアンサー
- オフィス系ソフト
preg_match_all 複数の文字列を取得
preg_match_all で複数の文字列を取得したい。正規表現について勉強している者です。 preg_match_allを使って複数の文字列を取得したいのですが、パターンの書き方に苦戦しています。取得したいデータは以下の５つです。一つずつであれば、どのデータも問題なく取得できますが、２つ以上組み合わせると、抽出した結果に余計な文字が入ったり、何も結果を返さなかったりとなってしまいます。皆様お知恵を貸してください。よろしくおねがいします。 ///////////取得したいデータ/////////// １つめ→○△□○△□○日本語や英語や数字△□○△□○△□○△□ ２つめ→2010/03/04(日) 16:33:48.21 ３つめ→Reg1046H2556USAsantaclala ４つめ→score995 ５つめ→●▲■<br> ●▲■●日本語や英語や数字▲■●▲■●<br> ▲■●▲■●▲■●▲■●<br> ▲■●▲■●▲■ ５つめには改行が入ることもあります。 /////////////////////////////////////// HTMLコード↓ <div class="cell" material="\1"></div></div> ： <span style="grey"><b>○△□○△□○△□○△□○△□○△□</span></b> DATE 2010/03/04(日) 16:33:48.21 <div class="gj"><a href="www.hoge.com" class="Reg1046H2556USAsantaclala"><span class="well">domestic</span></a><div class="hollywater" name="BUFFALO"></div></div>bridge</div><div id="score995">●▲■<br> ●▲■●▲■●▲■●<br> ▲■●▲■●▲■●▲■●<br> ▲■●▲■●▲■</div>
- 締切済み
- PHP
preg_matchでのマッチが正しくされない
メールヘッダを解析して処理させるプログラムを作成しています。ヘッダから件名を取得するために以下のコードを記述しました。 $head = 'Return-Path: Delivered-To: hoge@hogehoge.com Received: from docomo.ne.jp (mail102.docomo.ne.jp [203.138.203.2]) by www.hogehoge.com (Postfix) with ESMTP id C73904003B for ; Fri, 25 Mar 2011 16:32:19 +0900 (JST) Date: Fri, 25 Mar 2011 16:32:24 +0900 (JST) From: huga@hogehoge.com To: hoge@hogehoge.com Subject: =?iso-2022-jp?B?GyRCJFskMiRbJDIkVSQsJFUkLBsoQg==?=hogehogehugahuga =?iso-2022-jp?B?GyRCJFskMiRbJDIkVSQsJFUkLBsoQg==?= Message-ID: MIME-Version: 1.0 Content-Type: text/plain; charset="iso-2022-jp" Content-Transfer-Encoding: 7bit X-Virus-Scanned: clamav-milter 0.96.3 at MCN X-Virus-Status: Clean' $ptrn = '/Subject:([\s\t]*=\?iso-2022-jp\?[BQ]\?([^\?]+)\?=)+.* Message\-ID/i'; preg_match($ptrn, $head, $regs); var_dump(regs[0]); $headに別関数で取得したメールのヘッダ情報、$ptrnに正規表現での一致条件を書き出しました。 PHPの正規表現チェッカーでは正常にマッチしたのですが、preg_matchで動作させるとマッチしてくれません。何がまずいのでしょうか？正しくマッチさせる方法をご回答お願いします。
- ベストアンサー
- PHP