• ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:【正規表現】欠けた文字列にも合致させたい)

正規表現で欠けた文字列にも合致させたい方法とは?

このQ&Aのポイント
  • RSSリーダーで収集した保存フォルダ名に不要なデータが付けられる場合、正規表現を使用して削除する方法について解説します。
  • 正規表現パターン(ABCDEFG|ABCDEF|ABCDE|ABCD|ABC|AB|A)$を使用すると、後ろに長い文字列がある場合にも一致させることができます。
  • ただし、Aだけでは他のファイルも引っかかってしまう可能性があるため、適切なパターンを作成する必要があります。アドバイスとしては、具体的なルールに基づいた正規表現パターンを作成し、それに合致するフォルダ名を削除することです。

質問者が選んだベストアンサー

  • ベストアンサー
  • ORUKA1951
  • ベストアンサー率45% (5062/11036)
回答No.3

>新OS発表! Apple iPhone! www.AA.BB.com → 新OS発表!                         ( Apple iphone!がない) とはならないはずですが、[]内に半角スペースかいてませんか??  URLには半角スペース含みませんから、もし必ずURLの前に半角スペースがあるなら ^(.*)\s+[^\s]*$  → \1  → $1  perl方式の場合 で良いかと

actaeon
質問者

補足

ごめんなさい、実際にPC上のデータはURL部分の直前に半角がありました! ということでやってみたら、やった、処理できました! 有り難うございます。 ページタイトルと、URL部分との分けるところに注目すればよかったんですね。 あ~。気が付いたんですが、当たり前のことなんですが、 URL部分がないものに関しては必要な部分の文末をけずってしまいました(^_^;

その他の回答 (2)

  • ORUKA1951
  • ベストアンサー率45% (5062/11036)
回答No.2

POSIXだと、 文末にURLが書かれているということは、$(文末から逆方向にマッチさせれば良いです。 とりあえずURLに使用できる文字-_.!~*'()a-zA-Z0-9;/?:@&=+$, [-_.!~*'()a-zA-Z0-9;/?:@&=+$,]*$ でマッチするでしょう。

actaeon
質問者

補足

やってみました。 新OS発表! www.AA.BB.com → 新OS発表! 望んだ結果です! が、 新OS発表! Apple iPhone! www.AA.BB.com → 新OS発表!( Apple iphone!がない) となってしまいます。 それと、 条件について不足がありましたことをお詫びします。 URLの方にも、日本語が入る場合があり、その場合 新OS発表! www.うわさ.BB.com → 新OS発表! www.うわさ となってしまいます。 任意のURLではなく、www.うわさ.BB.com は手入力して、それを後ろから一文字づつ削ったもののマッチなどの手法はありますでしょうか?

回答No.1

お聞きの事は、ツール、言語に依存します。

actaeon
質問者

補足

失礼しました。 Flexible renamerというソフトで抽出、削除します。

専門家に質問してみよう