PHPでHTMLソースから特定のURLを抽出する方法

2012/05/06 18:30

このQ&Aのポイント

PHPで外部サイトのHTMLソース内の特定のURLを取得する方法について教えてください。
具体的には楽天市場の個別商品ページのHTMLソースからレビューページのURLを抽出したいです。
PHP初心者で正規表現がわからないため、プログラムのソースコードを教えていただけると助かります。

ssaiew32
お礼率50% (8/16)

PHP
回答数3
ありがとう数1

みんなの回答 （3）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

reggaepunc
ベストアンサー率59% (64/108)

2012/05/06 23:22 回答No.3

うーん。授業料が欲しいくらいだけお。でも暇だっから今回は許すお。僕に感謝するお。 --------------------------- // find all link foreach($html->find('a') as $e){ $txt = mb_convert_encoding($e->plaintext, 'UTF-8', 'EUC-JP'); $href = mb_convert_encoding($e->href, 'UTF-8', 'EUC-JP'); if(strstr($txt, 'レビューを見る（') !== false ){ echo $href . ' : ' . $txt . '<br>'; } } --------------------------- URL抜き出す条件はソース見ればわかるお。

質問者

お礼 2012/05/07 21:27

ありがとうございます。無事目的のURLのみ抽出できました。

その他の回答 (2)

reggaepunc
ベストアンサー率59% (64/108)

2012/05/06 21:21 回答No.2

しょうがないなぁ。ファイルをダウンロードしたら /example/example_basic_selector.php というファイルがあるから、ブラウザからアクセスしてみよう。すると、、、あら不思議。抽出されたURLが！簡単だお。ソースコード必要ないお。

質問者

補足 2012/05/06 22:19

詳しい説明ありがとうございます。無事にURLは抽出できましたが、不要なURLも大量に抽出してしまいます。目的の↓このURLのみを抽出するにはexample_basic_selector.phpをどのように改良すればいいのでしょうか？ ttp://review.rakuten.co.jp/item/1/229861_10000050/1.1/

reggaepunc
ベストアンサー率59% (64/108)

2012/05/06 18:48 回答No.1

これ。HTML解析する奴。これ使ったら1発だお。 http://simplehtmldom.sourceforge.net/

質問者

補足 2012/05/06 19:03

リンク先にあるScraping Slashdot!を応用するのでしょうか？？もう少し具体的にソースコードを教えていただけると助かります。

PHPでHTMLソースから特定のURLを抽出する方法

PHPでHTMLソースから特定のURLを抽出したい