• ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:HTMLの解析手段について)

HTML解析方法と効率的なライブラリについて

このQ&Aのポイント
  • PHP5.3にて自分のサイトのページを取得して、HTMLを解析というか分離したいと思っています。DOMDocument()などあるようですが、もっと効率的なライブラリや関数などないのでしょうか?処理速度にもこだわりたいので、アドバイス頂けたらと思います。
  • XPathやCSSセレクタを使用すると、htmlSQLのような階層に弱いものよりも簡単にHTML解析ができます。自分の用途に合った方法を選んで試してみると良いでしょう。
  • 正規表現は汎用性がなく、自分の用途には厳しいです。DOMDocumentはPHPに標準で入っているので利用できますが、もっと効率的な方法を求めるなら他のライブラリや関数も調べてみる価値があります。

質問者が選んだベストアンサー

  • ベストアンサー
  • yambejp
  • ベストアンサー率51% (3827/7415)
回答No.1

PEARのXMLライブラリなどもありますが 結局問題のあるHTMLを書いている限り解釈がぶれるので すくなからず文法エラーのワーニングは出ると思いますが・・・ javascriptが気になるなら外部化するなど基本に立ち返ることです

関連するQ&A

専門家に質問してみよう