• ベストアンサー

Webページに特定サイトへのリンクを探しだすシステム

先日、相互リンク系サイトに登録する際、まず登録者自身のサイトにその相互リンク系サイトへのリンクを貼ってから登録作業にかかってください。とのことでした。 試しに、リンクを貼らずにサイト登録しようとすると、「リンクが見当たりません。リンクを貼ってから再度登録作業をして下さい」というメッセージ。 その後自身のサイトに、その相互リンク系サイトへのリンクを貼ってからサイト登録すると、すんなり登録画面がでました。 おそらく登録処理をする前に、その登録希望者のサイトのWebページHTMLを解析して<a href=相互リンク系サイトのURL・・・を探して、あれば登録、なければエラーメッセージというようにしているのだと思います。 この様に特定Webページに自身へのリンクタグがあるかどうかを解析するプログラムはどんな風につくるのでしょうか。 小生Perlは少々かじっております。PHPは判りません。 宜しくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • mo_gu
  • ベストアンサー率51% (56/109)
回答No.2

LWPというモジュールを使えばHTMLの取得は簡単に出来そうです。 あとは取得したHTMLを正規表現で解析すればOK

参考URL:
http://digit.que.ne.jp/work/index.cgi?Perl%E3%83%A2%E3%82%B8%E3%83%A5%E3%83%BC%E3%83%AB%2FLWP

その他の回答 (2)

  • taseki
  • ベストアンサー率66% (155/233)
回答No.3

ANo.2さんもおっしゃってますが、LWPモジュールで簡単にHTMLを取得できます。 サンプルコード use LWP::Simple; $url = 'http://www.yahoo.co.jp/'; $data=get($url);

noname#25358
noname#25358
回答No.1

 似たようなプログラムを作ったことがあります。  自分でソケットを開いて、ブラウザが内部でやってるのと同じ手順でHTMLを取得し、あとは正規表現でタグを探すのです。  解析自体は難しくないですが、ソケットを自分で開くところがけっこう面倒だと思います。

関連するQ&A

専門家に質問してみよう