• ベストアンサー

正規表現

http://www.***/ というHPで http://www.***/index.cgi?page=1 http://www.***/index.cgi?page=2 : : :       : http://www.***/index.cgi?page=10 という風になっていて これをひとつにまとめる正規表現はどうやるのでしょうか?正規表現でDLできるソフトを使いたいのです また例として\.(htm|html|cgi|php)$ こんな風に書いてありました

質問者が選んだベストアンサー

  • ベストアンサー
  • ARC
  • ベストアンサー率46% (643/1383)
回答No.2

>あと[0-9]のあとに付いている+というのは 秀丸では「直前の文字の1個以上の連続」っていう意味です。 先の例では、「数字([0-9])の並び」ってな感じで使っています。 この辺はソフトによって微妙に違ってくるところなんで、お使いのソフトのマニュアル等も見られたほうがベターかと思います。

shoshosho
質問者

お礼

なるほど~一個以上ってことなんですね 再度のご回答本当にありがとうございました!!

その他の回答 (2)

  • terra5
  • ベストアンサー率34% (574/1662)
回答No.3

正規表現は細かいところはソフトによって違うので, 確実なところを知りたい場合はソフトを明記しないとだめですよ。 あと、ページも[0-9]+とした場合は、かなりマッチする範囲が広いですがいいのでしょうか? (0,000000等にもマッチする) 1~10だけにしたい場合は,例えば([1-9]|10)のようにする必要があります。

shoshosho
質問者

お礼

詳しい回答ありがとうございます! ソフトによっても違うんですね ちなみにソフトはBerryという画像収集ソフトです 今度から記入するようにいたします すいませんでした

  • ARC
  • ベストアンサー率46% (643/1383)
回答No.1

秀丸でしたら http://www\.XXX/index\.cgi\?page=[0-9]+ で出来ました。 「.」や「?」といった意味のある記号をエスケープ文字で打ち消す必要があるんですね。 どれがメタキャラクタか判らない場合は、 http[:][/][/]www[.]XXX[/]index[.]cgi[?]page[=][0-9]+ みたいな感じで、記号類を全部キャラクタクラス化してしまえばいけるんじゃないかと思います。

shoshosho
質問者

お礼

ご回答ありがとうございます! ?や.などは前に¥をつけるんですね あと[0-9]のあとに付いている+というのは なんでしょうか?

関連するQ&A

専門家に質問してみよう