ベストアンサー

正規表現について

2010/12/13 13:55

正規表現を使用して文字列の置換（ereg_replace）をしたいと思うのですが、うまくいかず悩んでおります。。以下の文字列があったとします。【AAA】【BBB】【CCC】DDD 文字列の中から先頭から始まる【】でくくられたものだけ（【AAA】）だけ削除して、結果を【BBB】【CCC】DDDとしたいのですが、正規表現でどのようにヒットさせればよいのか分りません。 ※【】の中にくる文字はAAAとは限りません。お手数ですがご教授頂けますでしょうか。

m_flower_s
お礼率42% (6/14)

PHP
回答数5
ありがとう数2

みんなの回答 （5）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

yambejp
ベストアンサー率51% (3827/7415)

2010/12/13 14:51 回答No.2

先頭の【】で囲まれたものというと単純に「^【.*?】」になりますねちなみにereg系の正規表現は非推奨です。また元データが複数行になることも考慮するとこんな感じ <? $str=<<<eof 【AAA】【BBB】【CCC】DDD 【EEE】【FFF】【GGG】HHH WWW 【XXX】【YYY】【ZZZ】 eof; $pattern="/^【.*?】/mu"; $replacement=""; $str=preg_replace($pattern,$replacement,$str); print $str; ?>

質問者

お礼 2010/12/14 17:48

ご丁寧に教えて頂きありがとうございました。別の方からもアドバイスもあり、とても勉強になり、また助かりました。今後とも宜しくお願い致します。

その他の回答 (4)

yuu_x
ベストアンサー率52% (106/202)

2010/12/13 16:46 回答No.5

UTF8 はデータ自体が UTF8 であるかどうかまで検証できる、プログラマにとってはありがたい仕様になっている。 u オプションを指定することで関数内で、正確に UTF8 の文字コードを扱えるわけだ。別に指定しなくても、動作自体にほとんど違いはない。 u オプションは、渡されたものがバイナリでも他の文字コードでもなく、UTF8 であることを保証してくれる。そういったオプションだ。重箱の隅かもしれないが、データの全てが UTF8 にというわけにはいかない。 UTF8 でのシングルバイト関数の利用もだましだましやっているに過ぎない。

質問者

お礼 2010/12/14 17:46

求めていた回答以上に色々勉強をさせて頂きました。ありがとうございました。

yambejp
ベストアンサー率51% (3827/7415)

2010/12/13 15:49 回答No.4

あれ？u修飾子はPCRE8でPerl非互換としてUTF8に妥当性があると認識していましたがそうではない？

参考URL：: http://www.php.net/manual/ja/reference.pcre.pattern.modifiers.php

yuu_x
ベストアンサー率52% (106/202)

2010/12/13 15:13 回答No.3

ちなみに preg_ はマルチバイト対応ではない。

Tacosan
ベストアンサー率23% (3656/15482)

2010/12/13 14:37 回答No.1

【】のネストが可能かどうかによって恐ろしく難易度が変わるんだけど, どうなんでしょうか? ネスト不可なら最短一致を使ってもいいし「】じゃないもの」という指定でもいい.

質問者

補足 2010/12/13 14:55

すみません。説明が足りませんでした。ネストはしません。

関連するQ&A

VBAの正規表現
VBAで正規表現による置換をしたいです。以下のような行が複数あります。 1 aaa bbb ccc ddd 2 aaa bbb ccc ddd 3 aaa bbb ccce ddd 4 aaa bbb eccc ddd ccc の部分のみ置換したいです。 dim hensuu as string dim replace as string replace = eee hensuu = ccc (省略) strPattern = "(\s*)" & hensuu & "(\s+)" rep = RegExpObj.Replace(buf, "\1" & replace & "\2") 行数1,2 のみを置換したのですが、4も置換されてしまいます。 (\s*) の "*" が良くないのは理解していますが、"+" にしてもうまくいきません。どなたかどのようにしたら1,2のみ置換できるようになるかをご教授お願いできませんでしょうかよろしくお願いいたします。
- ベストアンサー
- その他（プログラミング・開発）
''で囲まれていない文字列にマッチする正規表現
下記のような文字列($str)に対して置換を行い、 my $str = qq{ AAA = BBB - 'CCC' }; $str =~ s/★正規表現★/sprintf("DDD(%s)",$1)/xmsge ; 変換後 $str = DDD(AAA) = DDD(BBB) - 'CCC' ; を実現する★正規表現★を書きたいと思っています。　・AAA,BBB,CCCは[\w]で構成される文字列です。ですが、シングルクォーテーション('')で囲まれていない文字列にマッチする正規表現が書けなく困っています。一度、シングルクォーテーションで囲まれているものも含めて全てDDD()をつけて、そのあとで、シングルクォーテーションを含むものは元に戻すことでやりたいことは実現できているのですが、1行で実現できる方法を探しています。アドバイスよろしくお願いします。
- ベストアンサー
- Perl
Perlの正規表現について
Perlの正規表現について質問です． ■質問 aaa bbb aaa bbb ccc "ddd" aaa bbb ccc "ddd eee" aaa bbb ccc ddd eee "fff ggg hhh iii" というような，文字列が書かれているファイルがあるとします． ※ダブルクォーテーションが無い行もあります． ※ダブルクォーテーション内のスペースの数は，行によってそれぞれ異なります．これを，ダブルクォーテーションの中にあるスペースだけアンダーバーに置換する場合の正規表現を教えて下さい．つまり，下記の出力にしたいです． aaa bbb aaa bbb ccc "ddd" aaa bbb ccc "ddd_eee" aaa bbb ccc ddd eee "fff_ggg_hhh_iii" ■条件 ※ちょっと古いPerlでも動くよう，ゼロ幅肯定/否定後読((?<),(!<))は使わないでください． ※単に実現するだけなら， # cat inputfile | print -pe 'sub f(){}(shift;s/ /_/;return $_;); s/(\".*\")/&f($1)/e;' みたいな感じで置換できそうですが，「正規表現だけで簡単に書けるかどうか」が知りたいのです(正規表現だけで実現出来る場合，そのアルゴリズムを知りたいです)．そのため，関数と/eオプションは使わないでください．
- ベストアンサー
- Perl
正規表現の前後の^と.*$の意味
インターネットの情報で、テキスト検索で使用する場合、 ^(?=.*aaa)(?=.*bbb)(?=.*ccc).*$とすると「同一行の中に全ての文字列が含まれている場合」ヒットすると書かれていたのですが、前後の^と.*$がない場合とどのような違いがあるのでしょうか。 (1) ^(?=.*aaa)(?=.*bbb)(?=.*ccc).*$ (2) (?=.*aaa)(?=.*bbb)(?=.*ccc) powershell でログの文字列検索するスクリプトを作成していて (1)だと正規表現がうまく働いていないのか"match"で検索がヒットしせず、(2)だと検索ヒットするため前後の^と.*$がないものとの違いが気になりました。
- ベストアンサー
- その他([技術者向] コンピューター)
正規表現での置換えについて
正規表現を使った置換えでどうやったらいいのか悩んでいます。やり方は、カンマで区切られた数字や英字の列をその先頭だけ残して別の記号(?など)に変換するというものです。変換例 222,1,33333 は 2??,1,3???? へ置換え 55,22aa は 5?,2??? へ置換え 6 は 6 へ置換え(つまりそのまま) このような置換えをすることは可能でしょうか。こういう置換えはand条件が使えないと無理なのかなとも思ったりしています。ただ正規表現にはand条件は無いようですし。（or条件はあるようですが） mb_ereg_replaceを使って明示していただけると助かります。もちろん複数行になっても問題ありませんし、mb_ereg_replaceでは無理という場合に別の関数を使っていただいても結構です。よろしくお願いします。
- ベストアンサー
- PHP
秀丸の正規表現を使って置換
三番目の引数が0かNULL、nullならば、以下のように秀丸で置換したいのですが、やり方がわかりません。正規表現を使って置換したいです。 abcmethod(aaa, bbb, 0, ccc)やabcmethod(aaa, bbb, null, ccc) 　　　↓↓↓↓↓↓ abcmethod(aaa, bbb, ccc) aaa,bbb,cccは任意の文字半角アルファベットや数値です。 abcmethod(.+,.+,.+,.+)で、検索できますが、置換の仕方がわかりません。どうぞよろしくお願いします。
- 締切済み
- その他（プログラミング・開発）
正規表現について
正規表現で、最初に出てきた条件に合うものだけマッチさせて置換したく、それ以降に条件に合うものがあってもマッチさせたくないのですが、どうすればいいでしょうか？現在、オプションはつけてないのですが、最後にマッチしたものがとりだされてしまいます。 ---------------------------------------- s/aaa(.*)ccc/$1/;　・・・・・正規表現 ---------------------------- aaabbbccc : : aaadddccc : aaaeeeccc ---------- だと、eeeに置換されるのですが、bbbに置換したいです。よろしくお願いします。
- ベストアンサー
- Perl
正規表現
テキストファイルからコメント行以外から文字列"bbb"を含む行をgrepで抽出したいと思っております。コメント行→"#"で始まる行と"--"で始まる行先頭にスペースがある場合もあるので、結局先頭に「0個以上のスペース+（"#"or"--"）」がある行は対象外として、文字列"bbb"を含む行をgrepで抽出したいと思っています。下記、foo.txtの中から下記の抽出対象の2行のみを抽出したい場合、どういった正規表現を書けばいいか教えてください。【foo.txt】 aaa bbb → 抽出対象 aaa bbb →抽出対象 # aaa # bbb →抽出対象外 #aaa # aaa --aaa --aaa -- aaa -- bbb →抽出対象外 -aaa -bbb - aaa ご存じの方がいらっしゃいましたら、よろしくお願い致します。
- 締切済み
- Linux系OS
正規表現
正規表現 a=/home/aaa/bbb/ccc/ddd.abc echo ${a%.abc}実行したら /home/aaa/bbb/ccc/ddd が表示されますが、 home/aaa/bbb/ccc/ddd　に表示したいですがうまくいきません。ネットで正規表現さがしてみたけど理解できませんでした。教えていただきたいです。なお　説明文も簡単に記入していただいたら幸いです。
- ベストアンサー
- その他（プログラミング・開発）
さくらエディタでの正規表現マクロ
正規表現でタブ区切りの文字列の順序を入れ替える作業を試みています。 AAA　BBB　CCC PPP　QQQ　RRR のような文字列を BBB　CCC　AAA QQQ　RRR　PPP のように2列目、3列目、1列目のように順番を入れ替えたいです。 VBScriptで1行ずつ読み込み、タブを区切り文字として、配列に放り込み、配列の順番を指定して出力すればなんとか対応できるのですが、どうしてもさくらエディタで実装したいのですが、正規表現を駆使して対応できないものでしょうか? 検索により、パターンにマッチする部分は正規表現で2列目とか3列目というのは書けるのですが、パターンマッチだけで、置換後の文字列に変数などを使用できず苦しんでいます。正規表現を用いていれればいいし、無理なら、さくらエディタで秀丸のように配列やFOR文などを使いたいのですが、使い方がわからず、質問しました。ご存知の方がいらっしゃれば、教えてください。
- ベストアンサー
- その他（プログラミング・開発）

正規表現について