• ベストアンサー

指定したURLのソース(HTML)を拾ってくるプログラム

入力して指定したURLの先にあるソースファイル(HTML)を拾ってきて、URLの抽出や過去にとってきたソースと比較して更新されているかどうかをチェックするプログラムを作成しようと思っています。 これに類似したサンプルプログラム(スクリプト)や参考になるサイトを教えてもらえませんか。よろしくお願いします。

  • Perl
  • 回答数1
  • ありがとう数1

質問者が選んだベストアンサー

  • ベストアンサー
  • BLUEPIXY
  • ベストアンサー率50% (3003/5914)
回答No.1

指定したURLのファイルをゲットするのは、 LWP で http://okwave.jp/kotaeru.php3?qid=1928933 URLアドレスの抽出は、 HTML::TokeParser で http://okwave.jp/kotaeru.php3?qid=1785000 ファイルが更新されているかのチェックは Digest::file で http://okwave.jp/kotaeru.php3?qid=1825570 できるような気がします。

hanchooooo
質問者

お礼

ばっちりわかりました。ありがとう。

関連するQ&A

  • PHPでHTMLソースから特定のURLを抽出したい

    PHPで外部サイトのHTMLソース内の特定のURLを取得するにはどうすればいいでしょうか? 具体的には楽天市場の個別商品ページのHTMLソースにあるレビューページのURLを抽出したいと思っています。 ttp://item.rakuten.co.jp/asagao/332/のHTMLソースから レビューページのURLのttp://review.rakuten.co.jp/item/1/229861_10000050/1.1/を取得するようなプログラムを作りたいと思っています。 自力で頑張ってみたもののPHP初心者のため、preg_matchや正規表現でお手上げ状態になってしましました。 プログラムのソースコードを教えていただけると助かります。 ご回答よろしくお願いします。

    • ベストアンサー
    • PHP
  • WEBページ内のURLを抽出するJavaScript

    現在見ているホームページのURLを全て、 もしくは画像だけ等の条件付で抽出できる JavaScriptのサンプルスクリプトを教えてください。 ページのアドレスを入力するだけでOKなら 最高だと思うんですけど、その場合、 Perl等のサーバー側で動くプログラムが 必要だと思うんです。 希望としては、パソコン側で実行したいんです。 ソースプログラムをコピー&ペーストして、 実行ボタンを押すとリンクURLだけ抽出されて 表示されるようなスクリプトはありませんか。 よろしくお願いします。

  • [ASP]指定したURLのソースを表示したい。

    指定したURLのHTMLソースを表示するようにしたいのですが、やり方がよく分かりません。 GET http://www.yahoo.co.jp/index.html HTTP/1.1 ...といったリクエスト要求を80番ポートに送信して、その結果を表示すればいい。。。と思いましたが、ASPでどのようにプログラミングすればいいのか分かりませんでした。 以下のようなソースにしようとおもっています。ご存知な方、ご教授おねがいします。 <html> <head><title>result</title></head> <body> <pre> <% 'ここにHTMLソースを表示するプログラムを書く... %> </pre> </body> </html>

  • ページソースからのURL抽出

    VBでページソースにあるURLを全て抽出したいと考えています。 どのようにすれば良いか教えてください。 サンプルコードがあると助かります。 具体的には、以下の通り。 (1)ウェブページのソースを読み込む (2)読み込んだソースを1行ずつ探索し<a href="****">の****の部分を全て読み込んでいく (3)ExcelのURL欄に順に入力していく (4)URL一覧の出来上がり よろしくお願いします。

  • テキストをHTMLに変換するソース

    掲示板を作成しております。 テキストをHTMLに変換するソースサンプルを教えてください。 たとえば、こちらのサイトみたいにURLを入力すると リンクとして表示されるサイトです。 http://yahoo.co.jp ↑のようにリンクとして表示させられればOKです。

    • ベストアンサー
    • Perl
  • HTMLソース

      よろしくお願いします。 下記のソースを使用可能な状態にしたいのですが、   HTMLソース間にあるジャバスクリプトの、プログラムの部分を(ソース選択)というボタンをクリックさせ、ジャバスクリプトの部分だけをコピー出来るように青色に反転させたいのですが、(ソース選択)ボタンが機能しません。よろしくご指導ください。 <h2 align="center">他サイトのフレーム内にリンクされるのを防止します</h2> 自動的にフレームを解除してトップページを表示します<br> <input type="button" value="ソース選択" onclick="highlight(0)"> <form name="s1"> <textarea cols="80" rows="5" readonly> <script language="javascript"> <!-- if (parent.frames.length > 0) top.location.href = "自サイトのトップページURL"; //--> </script>

  • HTMLで指定したURLに飛ばない

    こんにちは。 会社でホームページを修正している者です。 テキストエディタでHTMLを下記のように指定し(URLは例です)、実際のネット環境にUpしようとしています。 <a href="https://www.abc.co.jp/corporate/">こちらをクリック</a> ローカル環境で成功したのでネット環境にあげて確認してみました。 HTMLで表示し、「こちらをクリック」をクリックすると https://www.abc.co.jp/operator/ (以下、operator)に飛んでしまいます。 上記URLを直接アドレスバーに入力したりコピペすればhttps://www.abc.co.jp/corporate/(以下、corporate)に飛んでくれます。 <質問> 1. どうしたらcorporateに飛んでくれるでしょうか。 2. 今飛ばない原因は何が考えられるでしょうか。今までも似たような修正をしたことがあるのですが今回だけうまくいかないのです。 以上です。 よろしくお願いいたします。

  • URL抽出

    指定したURLのソースから<A HREF="~">タグの"~"部分を抜き出してリスト化するようなURL抽出ツールを作りたいのですが、どのようにプログラムを書けばよいのかわからずに困っています。 わかるかた、回答のほどをよろしくお願いします。

  • 指定した「曜日」の「時刻」に違うHTMLを表示させるプログラム

    いつもお世話になっております。 指定した「時刻」または「曜日」または「日付」に 違うHTMLを表示させるプログラムならば ↓のサンプルプログラム「時計」の5.で出来るのですが http://www2s.biglobe.ne.jp/~club_tom/java-kouza/ja-index.htm これを欲張って 指定した「曜日のさらに違う時刻」に 表示させるプログラムは無いでしょうか。 じっくり勉強する時間はないので フリーのサンプルプログラムや 上記の改造方法を教えていただければ 本当に助かります・・・ よろしくお願いします m(_)m

  • HTMLメールのソース

    ロシア系フィッシング詐欺集団が、 「VISAカードをお持ちのお客様は自動的にVISA認証サービスプログラムにご加入いただいております。VISA認証サービスでは、お客様の個人パスワードでお持ちのVISAカードのセキュリティを強化します」と書かれており、「オンラインストアでのお支払い手続きの際に、ATMで暗証番号を入力するのと同じようにパスワードを入力していただきます」と指示。「https://www.visa.co.jp/verified/」というURLをクリックさせて、偽のWebサイトに誘導し、カード情報や暗証番号を入力させる手口を採っているらしいです。 そこで、その防犯のためにHTMLメールのソースをみるのはどうしたらよいのでしょう。ソースさえ見えたら <a HREF="送信先URL">メールの表示URL</a>で判断できるはずなんですが。ちなみにOE6を使っています。

専門家に質問してみよう