ベストアンサー

特定の範囲間を取得する方法について

2011/04/24 21:24

任意のウェブサイトから特定の範囲間を取得したいと思い、何らかの正規表現を用いれば出来るのではと思ったのですが、どのようにすればできるのか分からなかった為、アドバイスいただける方がいらっしゃいましたら、ご教示の程よろしくお願いします。なお、抽出したい範囲の例としては下記となります。例1 <body> ※この中を抽出したいです。 </body> 例2  ※この中を抽出したいです。  以上、よろしくお願いします。

iroha_168
お礼率89% (204/228)

PHP
回答数1
ありがとう数2

みんなの回答 （1）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

yambejp
ベストアンサー率51% (3827/7415)

2011/04/25 00:29 回答No.1

XMLをパースしたいならそれ用のパーサーを利用するのが早いです。単純に文字列として抜き出したいなら正規表現でこんな感じ（ただしutf以外では正しく抜き出せない可能性が高いです） <?PHP $str=<<<eof 例1 <body> test1 ※この中を抽出したいです。 test2 </body> 例2  test3 ※この中を抽出したいです。 test4  eof; $pattern1="/(?<=<body>).*?(?=<\/body>)/misu"; if(preg_match($pattern1,$str,$match)) print "結果1:<br>".nl2br(htmlspecialchars($match[0])); $pattern1="/(?<=).*?(?=)/misu"; if(preg_match($pattern1,$str,$match)) print "結果2:<br>".nl2br(htmlspecialchars($match[0])); ?>

質問者

お礼 2011/04/25 11:59

ご回答ありがとうございます。ご教示いただいたソースを試したところ、意図した動作となりました。それと、行いたい事はyambejpさんが下記の質問でご回答された内容と似たような感じだったため、リンク先のソースと今回ご教示いただいたソースから、下記のソースを基にカスタマイズすればやりたい事が出来ると思います。 http://oshiete.goo.ne.jp/qa/3636057.html なお、読み込みたいhtmlは自分が作成したもので、文字コードはUTF-8の為、UTFで動作すれば大丈夫です。 <?php ob_start(); include 'http://www.example.com/index.html'; $hoge=ob_get_contents(); ob_end_clean(); $pattern1="/(?<=<body>).*?(?=<\/body>)/misu"; if(preg_match($pattern1,$hoge,$match)) print "結果1:<br>".nl2br(htmlspecialchars($match[0])); ?> このたびはどうもありがとうございました。以上、よろしくお願いします。

特定の範囲間を取得する方法について

質問者が選んだベストアンサー

お礼 2011/04/25 11:59

関連するQ&A

マッチ情報を取得

変数に入っているHTMLから特定のidのDIVの範囲を取得したい

特定範囲内に一部でも属す線分を抽出する方法

仕組みを教えてください。ある特定の範囲のIP

エクセルでのセル範囲取得

htmlから特定の文字を取得するには

PHPの正規表現「ereg」で特定の数字範囲をマッチさせたい

特定の文字を抽出

一定の範囲で特定の属性を重複と見て１個と数えさせる方法は？

80.25円の少数部分を取得したい

選択範囲の取得と設定(JavaScript)

VBAを使ってHTMLソースから特定の文字列を抽出したいと思っています

検索ファイルのアクセス方法について

Bシェルでファイルから特定の範囲を抽出するには？

特定のワードが含まれているツイートだけ抽出する方法

特定の条件を満たすURLへのアクセスを遮断する方法

拡張子を除いたスクリプト名の取得方法を教えて下さい

ExcelのSUMPRODUCTで日付の範囲を指定する方法

ファイル内の複数の特定文字列を抽出する方法

特定の文字を含まないファイルを検索

注目のQ&A

カテゴリ
一覧

専門家に質問してみよう
専門家登録

あなたにピッタリな商品が見つかる！ OKWAVE セレクト

特定の範囲間を取得する方法について

質問者が選んだベストアンサー

お礼 2011/04/25 11:59

関連するQ&A

マッチ情報を取得

変数に入っているHTMLから特定のidのDIVの範囲を取得したい

特定範囲内に一部でも属す線分を抽出する方法

仕組みを教えてください。ある特定の範囲のIP

エクセルでのセル範囲取得

htmlから特定の文字を取得するには

PHPの正規表現「ereg」で特定の数字範囲をマッチさせたい

特定の文字を抽出

一定の範囲で特定の属性を重複と見て１個と数えさせる方法は？

80.25円の少数部分を取得したい

選択範囲の取得と設定(JavaScript)

VBAを使ってHTMLソースから特定の文字列を抽出したいと思っています

検索ファイルのアクセス方法について

Bシェルでファイルから特定の範囲を抽出するには？

特定のワードが含まれているツイートだけ抽出する方法

特定の条件を満たすURLへのアクセスを遮断する方法

拡張子を除いたスクリプト名の取得方法を教えて下さい

ExcelのSUMPRODUCTで日付の範囲を指定する方法

ファイル内の複数の特定文字列を抽出する方法

特定の文字を含まないファイルを検索

注目のQ&A

カテゴリ 一覧

専門家に質問してみよう 専門家登録

あなたにピッタリな商品が見つかる！ OKWAVE セレクト

カテゴリ
一覧

専門家に質問してみよう
専門家登録