- ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:特定のサイトからの情報の取得について)
特定のサイトからの情報の取得について
このQ&Aのポイント
- 特定のサイトから情報を取得する方法について調査しています。サイトがリニューアルした場合でも改修が発生しない方法はあるのでしょうか?
- 現在、許可を得て、あるサイトから商品名等の情報を取得しています。取得方法としては、PHP cURL関数を用いてページ情報を取得し、正規化して必要な情報を取得しています。
- しかし、サイトがリニューアルするごとに正規化の改修が必要となっており、固定のタグやid、class名をつけることが難しい状態です。改修が発生しない方法があれば教えてください。
- みんなの回答 (2)
- 専門家の回答
質問者が選んだベストアンサー
元サイトがリニューアルされたら 処理の書き直しが発生するのは不可避だけど simple html dom 使えばリニューアルへの対応が ある程度は簡単になるかも? でも処理がクソ重たいのでアクセスのたびに スクレイピングするような仕様にはしないのが吉
その他の回答 (1)
- t_ohta
- ベストアンサー率38% (5253/13739)
回答No.1
cURL 以外なら file_get_contents(); を用いて取得する方法もあります。 http://jp2.php.net/manual/ja/function.file-get-contents.php HTMLの解析は DOM ライブラリを使うと言った方法もありますが、そもそもの構造が変わってしまうような変更をされると対応できないのは仕方ないと思います。 http://php.net/manual/ja/book.dom.php
質問者
お礼
ご回答ありがとうございます。 参考にいたします。
お礼
ご回答ありがとうございます。 参考にいたします。