締切済み

正規表現に関する質問

2006/10/22 18:26

NAMAZUの設定をしていて、設定のサンプルに以下のような正規表現があり分からなかったので質問させて下さい。 ".*\\.(gif|png|jpg|jpeg)|.*\\.tar\\.gz|core|.*\\.bak|.*~|\\..*|\x23.*" \\となっているところエスケープならが\が一つでいいのでは？と疑問に思いました。自分の間違いと思いますが教えてください。

noname#24489

Linux系OS
回答数3
ありがとう数3

みんなの回答 （3）
専門家の回答

みんなの回答

notnot
ベストアンサー率47% (4848/10262)

2006/10/22 23:41 回答No.3

例えば、引用符を含む文字列は、 "\"" と書きます。通常なら文字列の終端を表す " ですが、直前に \ を書くことで終端の意味を打ち消して文字列中の普通の文字という意味を表します。また、例に出ている "\x23" というのも文字コードが16進で23の文字(#)を表します。このように、文字列中で \ は特別な意味を持つため、\ という文字自身を表したい時は "\\" か、文字コードを使って "\x5C" と書く必要があります。つまり、「正規表現としては \ だが、正規表現を文字列で表記する場合は、\ は言語によっていろいろな表現の仕方がある」です。

質問者

お礼 2006/10/23 23:36

ありがとうございます。今回は拡張子の.を表すには\.ではなく\\.が正解ということでしょうか？

BLUEPIXY
ベストアンサー率50% (3003/5914)

2006/10/22 18:58 回答No.2

エスケープ記号は、それ自体が特殊な意味があるために、自身を表すために\\ のようにする必要があります。

春原なの（@ymda）
ベストアンサー率37% (668/1777)

2006/10/22 18:47 回答No.1

二重に正規表現が評価されるために、二重に\\のようにエスケープをすることがあります。これはnamazuに限らず、シェルスクリプトにも起こりえることです。＃bash上でsedを使う等・・・

質問者

お礼 2006/10/23 23:31

ありがとうございます。この場合拡張子の.を表すのに\\がいるということでしょうか？ \\だと\自身という気がして\.が正解のような気がするのですが。

関連するQ&A

この検索を正規表現にするにはどう書けばいいでしょう？
(name.gif)、('name.jpg')、(name_a.png)があってその中身のback.gifだけを検索で拾いたいのです。自分なりに調べて \w+\w+(.gif|.jpg|.png) で ()、('')を除いた中身だけを拾えるようになったのですが、時々 (name-b.gif)、('n-ame.jpg')、(n-a-m-e.png) のようにハイフンが混じっているものが拾えなく困っています。ハイフンも混じっても大丈夫な正規表現の書き方をどなたか教えてください。
- ベストアンサー
- PHP
.htaccessの正規表現
.htaccessの正規表現で質問があります。 <Files ~ "\.(html|gif|jpeg|png)$"> 例えばこのような場合最後のファイル名が「html」「gif」「jpeg」「png」に適用されますが、~（チルダ）はパターンマッチ、(||)（カッコとパイプライン）はパイプラインで区切ってそのいずれか、$（ドルマーク）は行末のマッチングと分かったのですが、\.（円マークとドット）が分かりません。どういう意味なんでしょうか？例えば、次のように記述すると間違いなんでしょうか？ <Files ~ "(html|gif|jpeg|png)$"> また、 <Files password.html> このような記述が載っていたのですが、ファイル名がこのような場合ダブルクォーテーション（"）で囲まなくていいのでしょうか？また、*（アスタリスク）と?（クエスチョンマーク）は必ず1文字以上でなければいけないのでしょうか？0文字ではダメなんでしょうか？回答よろしくお願いします。
- ベストアンサー
- HTML
正規表現によるチェック
wikiのような掲示板のサイトを作っているのですが、フォームへの入力値をチェックするところで、困っています。正規表現を使えばよさそうなのですが、正規表現がよく理解できていないので、申し訳ないのですが、教えてください。フォームへの入力が #ref(ファイル名1) #ref(ファイル名2) .... という形式に合致しているかをjavascriptでチェックし、合致しない場合はエラーを出したいと考えています。ここで、ファイル名は　18桁の数字＋拡張子　(jpg、pjpeg、gif、png、x-png)　から成ります。以上、すみませんが、ご教授の程よろしくお願いいたします。
- 締切済み
- JavaScript
Javaの正規表現を使った画像URLの自動リンクができません
Java(version 1.5.0_05)の正規表現を使った画像URLの自動リンクで行き詰っています。通常のリンクタグは pattern = Pattern.compile("(http://|https://){1}[\\w\\.\\-/:&?,=#]+",Pattern.CASE_INSENSITIVE); でうまく変換できているのですが、画像の場合、 pattern = Pattern.compile("(http://|https://){1}[\\w\\.\\-/:&?,=#]+(jpg|jpeg|gif|png|bmp)",Pattern.CASE_INSENSITIVE); としてもマッチせず、変換ができません。正規表現が間違えているのは分かっているのですが、どこをどう変えたらよいのか教えてください。宜しくお願いいたします。
- ベストアンサー
- Java
正規表現が解読できません。
ツールが対象ファイルを認識する規則が正規表現で記載されているのですが、正規表現について無知なため、解読することができずに困っております。ネット等で検索し、[A-Z0-9]や{4,4}など部分的には解読することができたのですが・・・ FILE_COPY.REGEX1=<ABC>\t.+\\\\ABC(\\\\.*)?\\\\[A-Z0-9]{4,4}[0-9]{3,3}[A-Z0-9]+\\\\[A-Z0-9]{4,4}[0-9]{3,3}[A-Z0-9]+\\.gz FILE_COPY.REGEX2=<DEF>\t.*\\\\[^\\\\]*(?<\!\\.tar) FILE_COPY.REGEX3=<GHI>\t.+\\.xml\\.gz どなたかお時間のある方がいらっしゃいましたら、ご教示いただけないでしょうか。どうぞよろしくお願いいたします。
- ベストアンサー
- その他（プログラミング・開発）
正規表現について
HTMLファイルを読み込み、特定の文字列にリンクを付けて出力したいのですが上手くいきません。例： <img src="./seiki_hyougen.gif" alt="正規表現についての説明">更に正規表現を知りたい方は、<a href="special.html">正規表現の詳しい説明</a>をクリックして下さい。　↓正規表現をキーワードにしてリンクを付けたい。正：<img src="./seiki_hyougen.gif" alt="正規表現についての説明">更に<a href="seiki_hyougen.html">正規表現</a>を知りたい方は、<a href="special.html">正規表現の詳しい説明</a>をクリックして下さい。誤：<img src="./seiki_hyougen.gif" alt="<a href="seiki_hyougen.html">正規表現</a>についての説明">更に<a href="seiki_hyougen.html">正規表現</a>を知りたい方は、<a href="special.html"><a href="seiki_hyougen.html">正規表現</a>の詳しい説明</a>をクリックして下さい。尚、下記URLのサンプルを参考にしてスクリプトを作成しています。 http://php.oss.eznetsols.org/manual/ja/function.preg-split.php $r = preg_split('((\/a>)|(<a))', $html, -1, PREG_SPLIT_DELIM_CAPTURE); for ($i = 0; $i < count($r); $i++) { if ($r[$i] == "<a") { $i++; continue; } $r[$i] = preg_replace( "/(正規表現)/i", "<a href='seiki_hyougen.html'>\\1</a>", $r[$i] ); } return join("", $r); この(正規表現)の部分で上手い正規表現を使えばalt="×××"の中にリンクタグが入らないようにできるのでは？と思っているのですが・・・。どうか、良い方法を教えて下さい。よろしくお願いいたします。
- ベストアンサー
- PHP
正規表現の利用方法
Perlで指定ディレクトリ内の画像を一覧表示しするプログラムを作っています。画像は日記に使用しているもので、画像のファイル名を2007121601.jpgつまり、年・月・日・番号の様に命名ルールを決めておき、表示した画像から該当記事にリンクしたいのです。（記事はHTMLファイルで、200712.htmlの様に、年・月という命名ルールにしてあります）そのために、正規表現を使って試みているのですが、上手く該当記事にリンクさせるところが出来ません。 ↓yyyymmddnn形式の画像を正規表現で表現 grep{ /([0-9]{4})([0-9]{2})([0-9]{2})([0-9]{2})\.+(jpg$|gif$|png$)/ } ↓画像表示＆記事へリンク print "<a href=\"★\"><img src=\"img/$file\"></a>\n"; ★の部分に、上の正規表現から年・月の部分、つまり、([0-9]{4})([0-9]{2})を何らかの形で抜き出して記事URL(年・月.html）を表現したいのです。どなたかお分かりでしたらご教授下さい。
- ベストアンサー
- Perl
PHP正規表現の難題・preg_replaceでイメージタグをリンクタグに…
PHPのpreg_replaceを使用して、 imgタグをaタグに置換するプログラムで躓いています。全てのパターン$hogeで適用される正規表現をかけません。（※現在パターン１のみ出来ない状況で困っています）間違い箇所ありましたらご教授下さい。 ■パターン１ $hoge = '<img src="http://test.jp/test.gif" class="test" style="border:none;" />'; ■パターン２ $hoge = '<img src="http://test.jp/test.gif">'; ■パターン３ $hoge = '<img width="100" src="http://test.jp/test.gif">'; preg_replace('/\<img(.*)src=\"?(http[\-_\.\!\~\*\'a-z0-9\;\/\?\:@&=\+\$\,\%\#]+(jpg|jpeg|gif|png|bmp))\"(.*)\>/i',"<a href='\\2'>link</a>",$hoge); どうぞよろしくお願い致します。
- ベストアンサー
- PHP
preg_match_allで正規表現
preg_match_allにて、次のように<img>が連続したソースから、 ※URLは全てダミーです <img src="http://a.com/a/a.jpg"><img width="10" src='http://b.com/b/b.gif' height="10"><img width="10" height="10" src='http://c.com/c/c.png"><img src=http://d.com/d/d.jpg><img src="http://e.com/hogefuga/e.jpg"> 個々のimgタグ全体と"<img～>"、個々のsrc="～"のURLを抽出したいのですが、下記の条件でマッチさせることはできるでしょうか？ 1. imgの属性位置・有無に問わず 2. 属性のくくりが、'" のどちらでも、または有無に問わず 3. src=～内に、"hogefuga"を含まないものにだけマッチ（否定形）次のような正規表現で試したところ、 $pattern = '/<img.*?src=(\'|")?((?(?!hogefuga).)*\.(jpg|gif|png))(\'|")?.*?>/i'; 下のようにimgタグが1行づつ並んでいる場合は上手くいったのですが、連続して並んでいる場合は個々の、"<img～>"でマッチされませんでした。 ※URLは全てダミーです <img src="http://a.com/a/a.jpg"> <img width="10" src='http://b.com/b/b.gif' height="10"> <img width="10" height="10" src='http://c.com/c/c.png"> <img src=http://d.com/d/d.jpg> <img src="http://e.com/hogefuga/e.jpg"> 最終的にはsrc="～"のURLに応じて、画像をテキストリンクへ置換する、ということをしたいのですが、正規表現がよくわからず試行錯誤しています。このような場合はどのような正規表現を書くべきなのでしょうか？どうぞよろしくお願いします。
- ベストアンサー
- PHP
CSVデータを正規表現で抜き出せません・・・。
お疲れ様です。初投稿になります。どうぞ宜しくお願い致します。 CVSデータ（囲い文字："（ダブルコーテーション））を正規表現でマッチングさせ、抜き出そうと考えています。エスケープ文字を以下のように設定しています。・""（ダブルコーテーション * 2）　⇒　"（ダブルコーテーション）・\"（円記号 + ダブルコーテーション）　⇒　"（ダブルコーテーション）・\\（円記号 * 2）　⇒　\（円記号）例えば・・・ "A",""",BB,"",\",CC,\\,DD""","EEEE","", ですと、「"A"」「""",BB,"",\",CC,\\,DD"""」「"EEEE"」「""」と取れる想定になります。特に2番目の「""",BB,"",\",CC,\\,DD"""」は、「"""（←escape）,BB,""（←escape）,\"（←escape）,CC,\\（←escape）,DD""（←escape）"」という想定です。 PHP関数ではエスケープ文字の問題により取得しきれず、自力での取得を行っております。私が考えた正規表現は「"[^"]*((""|\\")[^"]*)*[^\\]",|"",」となりますが、カンマが入り乱れる上記パターンを満たすことができません。これは、正規表現での解決は不可能でしょうか？何日も解決できず、困っています・・・。是非、皆様のお力添えのほど、宜しくお願い致します。 PS. このサイトで動作確認を行っておりました。参考になれば幸いです。 http://www.rider-n.sakura.ne.jp/regexp/regexp.php
- ベストアンサー
- PHP

正規表現に関する質問