- ベストアンサー
phpで外部サイトの更新履歴を表示する方法
- phpでランキングサイトの運営をしている場合、他のサイトの更新情報を取得して表示する方法はありますか?
- 具体的には、更新された記事の時間、タイトル、リンクを取得したいです。また、複数のサイトの更新履歴を表示する予定です。
- リクエストの負荷が大きかった場合は、一時間ごとの更新でも問題ありません。参考になるサイトがあれば教えてください。
- みんなの回答 (3)
- 専門家の回答
質問者が選んだベストアンサー
RSSを利用すれば? 相手側から外部にむけて更新された情報が発信されていなければ かなり面倒な処理になるので、無理だと思った方がいいですね
その他の回答 (2)
- yambejp
- ベストアンサー率51% (3827/7415)
#2さんの件補足です 岡崎図書館事件ですね。ろくに調べもせずに20日も拘留されたとかで 起訴されるよりよっぽどやっかいです。 http://www.google.co.jp/search?hl=ja&q=%E5%B2%A1%E5%B4%8E%E5%9B%B3%E6%9B%B8%E9%A4%A8%E4%BA%8B%E4%BB%B6
- magicalpass
- ベストアンサー率58% (378/648)
pingでサイトの更新情報が取得できるような話は寡聞にして聞いたことがありませんが、私の知識が乏しいせいでしょうか? リンク先はランキングサイトなので、基本的な構造としては登録サイトにタグ付きurlを発行し、登録サイトにそのリンクを貼ってもらい、そのリンクが踏まれたらランキングサイトの情報が更新されるようになっています。(リンクアクセス数、アクセス元のurl等) 相手がブログならアクセス元のurl(リファラー情報)が新規のurlならブログが更新されたと判断できます。その他の情報はそのurlにアクセスして取得することになるでしょう。 タグ付きurlの発行を行わずに(rss情報等も無しに)更新を取得するなら、定期的に適当なページのhtmlを取得して、過去データとの差分情報から更新を解析するというのが基本でしょう。 ただし、特定サイトの定期監視というと、最近、公立図書館の蔵書の新着情報を取得しようとして相手先のサーバーを過負荷でダウンさせてしまい、警察に悪意あるアクセス行為として逮捕された人がいたみたいなので気を付けた方が良いでしょう。
お礼
個別にpingを発行してユーザに発信してもらい、更新情報を得るといった方法だと思ったのですが違ったようですね。すいません。 >>相手がブログならアクセス元のurl(リファラー情報)が新規のurlならブログが更新されたと判断できます。その他の情報はそのurlにアクセスして取得することになるでしょう。タグ付きurlの発行を行わずに(rss情報等も無しに)更新を取得するなら、定期的に適当なページのhtmlを取得して、過去データとの差分情報から更新を解析するというのが基本でしょう。 とりあえずRSSを使ってできたので、サイトの表示速度と相談してこちらでも検証してみます。 事件については、気をつけます。ありがとうございました。
お礼
先程yambejpさんのおっしゃるとおりにRSSを利用した更新に関するものを調べたところ、MagpieRSSというのがあり、以下のサイトのとおりやったらできました。 http://ameblo.jp/yamasita-94nsr/entry-10018566158.html 岡崎図書館事件ですか・・・初耳なので大変勉強になりました。 ありがとうございます。