- ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:HTMLの解析手段について)
HTML解析方法と効率的なライブラリについて
このQ&Aのポイント
- PHP5.3にて自分のサイトのページを取得して、HTMLを解析というか分離したいと思っています。DOMDocument()などあるようですが、もっと効率的なライブラリや関数などないのでしょうか?処理速度にもこだわりたいので、アドバイス頂けたらと思います。
- XPathやCSSセレクタを使用すると、htmlSQLのような階層に弱いものよりも簡単にHTML解析ができます。自分の用途に合った方法を選んで試してみると良いでしょう。
- 正規表現は汎用性がなく、自分の用途には厳しいです。DOMDocumentはPHPに標準で入っているので利用できますが、もっと効率的な方法を求めるなら他のライブラリや関数も調べてみる価値があります。
- みんなの回答 (1)
- 専門家の回答
質問者が選んだベストアンサー
PEARのXMLライブラリなどもありますが 結局問題のあるHTMLを書いている限り解釈がぶれるので すくなからず文法エラーのワーニングは出ると思いますが・・・ javascriptが気になるなら外部化するなど基本に立ち返ることです