締切済み

サイト内の一部の情報を取得したい。

2011/06/08 15:28

file_get_contentsとpreg_matchを使ってhttp://blogs.yahoo.co.jp/y_j_blogの訪問者履歴の情報（ニックネームとYahoo!ID）を取得したいのですが、上手く行きません。 JavaScriptの中身の情報を取得する方法はないのでしょうか？具体的なソースコードを教えて頂ければ有り難いです。

Celipa
お礼率0% (0/1)

PHP
回答数1
ありがとう数0

みんなの回答 （1）
専門家の回答

みんなの回答

gentaro
ベストアンサー率47% (105/221)

2011/06/10 09:59 回答No.1

Ajaxにて通信、結果を取得していますから、html内に記述されている全てのjsファイルを落として解析すれば可能かと。どこかに必ず通信先のURLを記述しているはずです。

関連するQ&A

マッチ情報を取得

$yahoo = file_get_contents(http://www.yahoo.co.jp/) で取得したソース情報の中から特定の情報だけを抜き取りたいのですが・・・。正規表現 preg_match()などを使って欲しい情報があれば、特定の範囲を抜き取りするのかな？と思うのですが・・・。いまいちやり方がわかっていません。アドバイスお願いします。
PHPでWebページの特定部を取得したいのですが、上手くいきません。

PHPでWebページの特定部を取得したいのですが、上手くいきません。現在file_get_contentsを用いてURLを指定して取得し、preg_matchの引数にする方法で行っています。また、preg_matchは以下のように用いています。 preg_match("/パターン(.*?)パターン/s", $html, $matches); print_rで$matchesを表示してみたところArray()のみ出力されます。また、話が逸れて申し訳ないですが、上記とは別にfile_get_contentsを用いて動的にURLを指定して取得しているのですが、処理に時間がかかります。(約10秒) $wordをURLに組み込む変数として以下のように記述しています。 file_get_contents("http://…".$word."…(URLの続き)"); 以上の2点についてご教示願います。
PHPで<title>タグ取得の動作が非常に重い

PHPで<title>タグ取得の動作が非常に重い $html = file_get_contents($url); if(preg_match( "/<title>(.*?)<\/title>/i", $html, $match)) { } 上記のような方法で一度に（1ページ内で）30サイトほどの<title>タグを取得すると、不可がかかり、表示までにかなり時間がかかってしまいます。 preg_match では重いのでしょうか。それとも一度に30サイトはそもそも無理があるのでしょうか。。
PHPで外部サイトの一部を取得して表示

こんにちは。普通、外部ファイルの内容を取得して表示する場合、次のようにしますよね。 <?php echo file_get_contents("***URL***"); ?> それで、そのページの一部分、例えば<div id="text">～</div>の内容を取得して、 file_get_contentsと同じように表示する方法はありますでしょうか。取得する範囲はIDで指定できればと思います。よろしくお願いします。
取得したい日本最初のホームページ

file_get_contents()で日本最初のホームページ（http://www.ibarakiken.gr.jp/www/）を取得したいです。 file_get_contents()を使いレスポンスヘッダをみると200が返ってアクセスはうまくいってるのですが中身が空になります。日本最初のホームページがあとから中身を<FRAME>タグで取得しているのが原因かなぁ～と思っているのですが、でも<HEAD>タグの部分は取得できるはず．．．
UTF-8サイトを取得しSJISに

以下のPHPで指定のサイトを取得すると文字化けしてしまいます。何処が悪いのか分かる方、ご指導お願い致します。 <?php $str = file_get_contents('http://esthe-cinderellaesthe.on.omisenomikata.jp/diary'); mb_convert_encoding($str,"SJIS","UTF-8"); if (preg_match('!<div id="content">(.*?)<div class="pr">!s', $str, $res)){ print $res[1]; } ?>
他サイトの情報取得

JavaScriptで、他のサイトの情報を取得することは可能でしょうか？例えば、PerlでのLWP::Simpleのget関数のようなものを想定しています。 use LWP::Simple; my $buf = get($url); ひょっとしたら、JavaScriptからPerlスクリプト呼び出しが行えるのかもしれませんが、そのへんは全くわかってません。この疑問の背景としては、 http://www.tagindex.com/javascript/time/watch1.html 上記サイトにあるJavaScript関数disp()内の以下記述　var watch1 = now.toLocaleString(); // ローカル時この「now.toLocaleString()」の代わりに、他サイトから抜き出した情報を代入したいと思っています。そして、 setTimeout("disp()", 1000); で、繰り返し表示させる形です。以上、よろしくお願いいたします。
PHPで一部サイトからRSS情報を取得できない

PHPを使用して、他のサイトからRSS情報を取得し、 DBにデータを格納する、というような処理をするバッチを作成しています。 SimplePieという無料のライブラリを使用し、下記のようなファンクションを作成しました。 /* ================= * * RSS情報を最大５件取得 * =================*/ function get_rss_info($feed_url) { // 戻り値 $rss_list = array(); // RSSデータを取得 $feed = new SimplePie(); $feed -> enable_cache(false); $feed -> set_feed_url($feed_url); $feed -> init(); $feed->handle_content_type(); // 過去記事を最大５記事まで取得 $feedItems = $feed -> get_items(0, 5); foreach($feedItems as $item) { // ※自作クラスです $rss = new RSS(); $rss->rss_id = $item -> get_id(); $rss->rss_title = $item -> get_title(); $rss->published_date = $item -> get_date('Y/m/d H:i:s'); $rss->rss_url = $item -> get_permalink(); $rss->rss_text = $item -> get_description(); array_push($rss_list, $rss); } return $rss_list; } 上記のファンクションで、アメブロなどのRSS情報は取得できますし、一部WordPressサイトのRSS情報も問題なく取得することが出来ました。しかし、一部のWordPressサイトでは、上記のファンクションを通しても 1つもRSS情報を取得することが出来ず、配列も空のままで返却されてしまっております。 Feedlyなどの外部サービスで情報が取得できているので、私のプログラムが悪いのだとは思っているのですが・・・自分なりに調査をしてみたのですが、全く糸口を掴むことができませんでした。お知恵を貸していただければと思います。どうぞよろしくお願いいたします。
PHPで他サイトにログインしてHTMLソースを取得

PHPで他のサイトにログインしてHTMLソースを取得できますか？例えば http://www.goo.ne.jp/ http://www.yahoo.co.jp/ http://jp.msn.com/ 上記それぞれのサイトにログインしてメール受信件数を取得して、まとめて表示したいです。静的HTMLページであれば file_get_contents関数で文字列として読み込み preg_matchで目的のHTML部分を正規表現で指定し explodeで分割して目的の部分だけを抽出といったような流れで、だいたい可能なのは解かりました。ただし、その前段階のphpで他のサイトにログインする方法が解かりません。ログインの種類は、上記の例であげたようにフォームタイプのログイン形式です。 Basic認証タイプではありません。 PHPで行う方法はあるのでしょうか。宜しくお願い致します。
PHPでホームページの情報取得に関しまして

ＰＨＰで以下サイト(東京の天気)から「週間天気」の各曜日の気温や降水確率の文字データを取得して表示するには、どのように実現したら良いかご教示ください。＜天気サイト＞ http://weather.yahoo.co.jp/weather/jp/13/4410.html file_get_contentsでファイルの内容を取得して文字検索するしかないでしょうか？それだと非効率で処理速度に影響しそうに思えます。もっと簡単で効率よく情報取得する方法はありませんでしょうか？ ※なんとしてもＰＨＰで取得したいと思っています。どうぞ、宜しくお願い致します。
file_get_contents 画像直URL

file_get_contents($url);した際、画像の直URLがあったら、画像をローカルに保存して、URLを書き換えたいのですが、どうやればいいでしょうか？ if(preg_match("/http:\/\//", file_get_contents($url))) { ？？ } また、画像をローカルに保存って、PHPで出来るのでしょうか？
サイト名を取得するPHP

url.txtに http://test1.com http://test2.com http://test3.com ：とあります。このURLのhtmlファイルから<title>サイト名</title>部分を抜き出し、 http://test1.com+サイト名１ http://test2.com+サイト名２ http://test3.com+サイト名３：と表示したいです。 <?php /** * ページタイトルを取得する関数 */ function getPageTitle( $url ) { $html = file_get_contents($url); //(1) $html = mb_convert_encoding($html, mb_internal_encoding(), "auto" ); //(2) if ( preg_match( "/<title>(.*?)<\/title>/i", $html, $matches) ) { //(3) return $matches[1]; } else { return false; } } $filename="url.txt"; $data=file_get_contents($filename); $array = split("\n",$data); foreach($array as $values){ echo $array."+".getPageTitle($array); } ?> ですがこのコードだと7行目あたりでエラーが出てしまいます。どなたか解決策をご教示ください。どうかよろしくお願いします。
対象サイトのhtmlを取得・解析したい

お世話になります。早速ですがご質問させて頂きます。対象サイトのhtmlを取得し解析・一部情報を抽出する機能を作っています。以下の方法で取得を行ったのですが、抽出したい情報が入っていなく（隠蔽されている？？）困っています。 firebugで対象サイトのhtmlを確認すると抽出したい情報はきちんと表示されていますが、ブラウザでソースを表示すると隠蔽？されています。 ◆表示比較・firebug <p class="●●">(抽出したい情報)</p> ・ブラウザでソース表示する <td id="●●">-</td> ▼プログラム $html = file_get_contents ("http://対象サイト"); $domDocument = new DOMDocument (); $domDocument->loadHTML($html); $xmlString = $domDocument->saveXML (); $xmlObject = simplexml_load_string($xmlString); そもそも抽出したい情報の箇所は動的に生成されているものでfile_get～で読みにいっているものは動的に出力される前のものを読み込んでいるのが原因でこのような結果になっているのでしょうか？上記の方法以外でもうまいやり方があればぜひご教授頂きたいです！宜しくお願い致します！環境： MacOSX 10.6.8 PHP 5.1.2 Firebug 1.11.4 Firefox 22.0
Yahoo!ブログについてお聞きします。

私は、Yahoo!IDを持ってますが、ある人のYahoo!ブログを、知らなくて、IDのまま、訪問しました。そうすると、Yahoo!ブログを出している相手に、私のYahoo!IDが、足跡に残ってしまうと聞きました。 IDは、昔Yahoo!で作った捨てIDです。知恵袋などは、捨てIDと、ヒモ付けされてる、公開ニックネームで出てますが、相手のブログに足跡として、残るのは、公開ニックネームなのでしょうか？公開ニックネームで、相手に検索されると、全ての書き込みが読まれてしまうので、心配してます。 Yahoo!ブログ提供者(※相手)は、訪問者のIDを確認する事が、出来るのでしょうか…?
Javascriptで表示のページをPHPで読む

Javascriptを使って表示されているウェブのコンテンツをPHPで読み込む方法について教えてください。 HTMLで作られている場合は「file_get_contents」でHTMLソースを取得できますが、Javascriptを使って表示されたページのソースを読み込むにはどのようにしたらよいのでしょうか。読み込みたいページは下記のような構造になっています。 <html> <head> </head> <body> <h2>タイトル</h2> //ここのコンテンツ部分がJavascriptをONにしないと見えない。 </body> </html>
PHPのタイトルの取得

こちら（http://wsd.zombie.jp/gw/php_curl_file_get_contents/）のページとこちら(https://www.php.net/manual/ja/funct ion.file-get-contents.php)のページを参考に別ページからタイトルを取得したいと思っているのですが、できませんでした。(上記のサイト様では、ヤフーニュースの取得ができるらしいのですが、表示されませんでした。) webページのタイトルを取得したいです。 index.phpファイル <a href>="ここに下記タイトルを取得"</a> ーサーバー上の別ページー page１．ｐｈｐ＜title＞練習＜/title＞このようにしたいので教えてください。
PHPで定義されている関数のコードが見たい

PHPでコードを記述するとき、関数を定義することがあります。 function test($name){ ：： } しかし、最初から定義されている関数がありますよね。 isset()やfile_get_contents()などの関数です。こういった関数の中身をみたいのですが、PHPのどの部分を見ればいいのでしょうか。関数の中身とは、たとえばfile_get_contentsなら function file_get_contents($name){ ： //この部分のことです。： } PEARだったら、たとえばDB.phpならばDB,phpの中身を見ればいいのですが、fopen()などの最初から定義されている関数はどこを見れいいのかがわかりません。よろしくお願いします。
file_get_contents関数で引数をURLにすれば、HTML

file_get_contents関数で引数をURLにすれば、HTMLソースを取得できるのはわかるのですが、例えば、URLが制限 255バイト？を超える場合、GETでなくPOSTタイプでHTMLを取得したいのですが、file_get_contents関数のように手軽にPOSTタイプで取得できる関数はありますか？ PHP5を使っています。
htmlの一部を読み込んで表示する。

下の階層に有る自分のページをトップのindex.phpページに表示したいです。《./abc/123.html》 ▼<div id="news">■～●</div>▲ 現在は123.htmlで指定した範囲を通り過ぎて▲の部分まで表示してしまいます。 ■～●だけを表示するにはどうしたらよいでしょうか？今は下記のように書いています。 <?php $str = file_get_contents('./abc/123.html'); if (preg_match('!<div id="news">\s*(.*)</div>!s', $str, $res)){ print $res[1]; } ?> ご指導よろしくお願い致します。
javascriptで取得したurlの情報をGETで送る方法がわかりません。

現在のURLをjavascriptで取得し、その取得した情報を送る方法を教えてください。以下のソースでURLを取得しgetで送るにはどのようにすればよいのでしょうか？ <scripttype="text/javascript"language="javascript"> var url = document.write(document.URL); </script> <a href="./submit.php?document.write(url)">新規登録</a> 以上よろしくお願いします。

サイト内の一部の情報を取得したい。

みんなの回答

関連するQ&A

マッチ情報を取得

PHPでWebページの特定部を取得したいのですが、上手くいきません。

PHPで<title>タグ取得の動作が非常に重い

PHPで外部サイトの一部を取得して表示

取得したい日本最初のホームページ

UTF-8サイトを取得しSJISに

他サイトの情報取得

PHPで一部サイトからRSS情報を取得できない

PHPで他サイトにログインしてHTMLソースを取得

PHPでホームページの情報取得に関しまして

file_get_contents 画像直URL

サイト名を取得するPHP

対象サイトのhtmlを取得・解析したい

Yahoo!ブログについてお聞きします。

Javascriptで表示のページをPHPで読む

PHPのタイトルの取得

PHPで定義されている関数のコードが見たい

file_get_contents関数で引数をURLにすれば、HTML

htmlの一部を読み込んで表示する。

javascriptで取得したurlの情報をGETで送る方法がわかりません。

注目のQ&A

カテゴリ
一覧

専門家に質問してみよう
専門家登録

あなたにピッタリな商品が見つかる！ OKWAVE セレクト

サイト内の一部の情報を取得したい。

みんなの回答

関連するQ&A

マッチ情報を取得

PHPでWebページの特定部を取得したいのですが、上手くいきません。

PHPで<title>タグ取得の動作が非常に重い

PHPで外部サイトの一部を取得して表示

取得したい日本最初のホームページ

UTF-8サイトを取得しSJISに

他サイトの情報取得

PHPで一部サイトからRSS情報を取得できない

PHPで他サイトにログインしてHTMLソースを取得

PHPでホームページの情報取得に関しまして

file_get_contents 画像直URL

サイト名を取得するPHP

対象サイトのhtmlを取得・解析したい

Yahoo!ブログについてお聞きします。

Javascriptで表示のページをPHPで読む

PHPのタイトルの取得

PHPで定義されている関数のコードが見たい

file_get_contents関数で引数をURLにすれば、HTML

htmlの一部を読み込んで表示する。

javascriptで取得したurlの情報をGETで送る方法がわかりません。

注目のQ&A

カテゴリ 一覧

専門家に質問してみよう 専門家登録

あなたにピッタリな商品が見つかる！ OKWAVE セレクト

カテゴリ
一覧

専門家に質問してみよう
専門家登録