- 締切済み
ruby でhtmlタグ
rubyでhtmiのタグを外すプログラムを作成しようとしているのですが、どのように書いてよいのかわからないので教えてください。 お願いいたします。
- みんなの回答 (1)
- 専門家の回答
みんなの回答
- notnot
- ベストアンサー率47% (4900/10359)
回答No.1
「HTMLタグ 正規表現」で検索すると、HTMLタグにマッチする正規表現を書いたページが見つかります。 本当は、%r{</?\w.*?>}m というような簡単な正規表現でいいはずなのですが、HTMLの文法に反した書き方をしたページもあるので、そういうのにも対応しようとすると複雑な正規表現が必要になります。 で、text に元のテキストが入っているとすると、test.gsub!(HTMLの正規表現,"") で削除出来ます。