ベストアンサー

※ ChatGPTを利用し、要約された質問です（原文：LWPでHTMLが取得できないことがある）

LWPでHTMLが取得できない場合の理由とは？

2009/01/08 12:54

このQ&Aのポイント

LWPを使用してHTMLを取得すると、取得可能なサイトと不可能なサイトがあります。
yahooのトップページは取得可能ですが、wikipediaは取得できません。
取得できない場合、エラーメッセージが表示されない理由を教えてください。

takoyaki_b
お礼率31% (5/16)

Perl
回答数3
ありがとう数5

みんなの回答 （3）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

kumoz
ベストアンサー率64% (120/185)

2009/01/08 16:54 回答No.2

wikipedia では、LWP::Simple のアクセスを許可していないのだと思います。 get() の代わりに getprint() を使用すると、次のエラーメッセージが出ます。 $ perl -MLWP::Simple -e "getprint 'http://ja.wikipedia.ogr/';" 403 Forbidden <URL:http://ja.wikipedia.org/> 下記の URL でほぼ同じ問題を取り上げていますのでご覧ください。

参考URL：: http://www.atmarkit.co.jp/bbs/phpBB/viewtopic.php?topic=35645&forum=10&3

質問者

お礼 2009/01/09 17:26

回答ありがとうございます。参考URLで解決しました。

その他の回答 (2)

jjon-com
ベストアンサー率61% (1599/2592)

2009/01/08 17:51 回答No.3

http://blog.livedoor.jp/dankogai/archives/50806567.html

質問者

お礼 2009/01/09 17:26

回答ありがとうございます。

noname#208124

2009/01/08 16:23 回答No.1

ユーザーエージェントで弾いてるんじゃないですか Googleとかもlibwww-perlの方弾いてます LWP::Simpleのリクエストヘッダはこれで403 Forbiddenとエラーページ返ってきてます GET http://ja.wikipedia.org/wiki/%E3%83%A1%E3%82%A4%E3%83%B3%E3%83%9A%E3%83%BC%E3%82%B8 HTTP/1.1 TE: deflate,gzip;q=0.3 Connection: TE, close Host: ja.wikipedia.org User-Agent: LWP::Simple/5.814 LWPを使った場合はこれで200 OKでちゃんとコンテンツ返ってきてます GET http://ja.wikipedia.org/wiki/%E3%83%A1%E3%82%A4%E3%83%B3%E3%83%9A%E3%83%BC%E3%82%B8 HTTP/1.1 TE: deflate,gzip;q=0.3 Connection: TE, close Host: ja.wikipedia.org User-Agent: libwww-perl/5.814

質問者

お礼 2009/01/09 17:24

回答ありがとうございます。

LWPでHTMLが取得できない場合の理由とは？

LWPでHTMLが取得できないことがある

質問者が選んだベストアンサー

お礼 2009/01/09 17:26

その他の回答 (2)

お礼 2009/01/09 17:26

お礼 2009/01/09 17:24

関連するQ&A

LWP::simpleがiswebで使えない

LWPによるページ取得の問題

LWPモジュールについて教えてください。

AIは使う人の年齢や市場にも影響する？人工知能の可能性

LWPでHTML取得（その前にSocket取得）できない

続：LWPでHTML取得（その前にSocket取得）できない

use LWP::Simple get で、https:// は取得できない？

Perl LWPでproxyがうまく刺さらない

LWP Cookie取得

LWP::Simpleでのgetについて

[LWP?] 特定のCLASSの値だけ取得したい

perlのLWPがページによって、正常に作動しません？

HTML::TreeBuilderについてです

LWPでHTTPSサイトからコンテンツ取得

Perl HTMLソースから特定のタグ抽出

HTMLから自動的に文章取得

LWPでヘッダー情報をあらかじめ取得したい

他サイトの情報取得

外部サイトの内容の取得

正規表現で指定範囲の文字列の取得

wikipediaのAPIの取り込みについて

注目のQ&A

カテゴリ
一覧

専門家に質問してみよう
専門家登録

あなたにピッタリな商品が見つかる！ OKWAVE セレクト

LWPでHTMLが取得できない場合の理由とは？

LWPでHTMLが取得できないことがある

質問者が選んだベストアンサー

お礼 2009/01/09 17:26

その他の回答 (2)

お礼 2009/01/09 17:26

お礼 2009/01/09 17:24

関連するQ&A

LWP::simpleがiswebで使えない

LWPによるページ取得の問題

LWPモジュールについて教えてください。

AIは使う人の年齢や市場にも影響する？人工知能の可能性

LWPでHTML取得（その前にSocket取得）できない

続：LWPでHTML取得（その前にSocket取得）できない

use LWP::Simple get で、https:// は取得できない？

Perl LWPでproxyがうまく刺さらない

LWP Cookie取得

LWP::Simpleでのgetについて

[LWP?] 特定のCLASSの値だけ取得したい

perlのLWPがページによって、正常に作動しません？

HTML::TreeBuilderについてです

LWPでHTTPSサイトからコンテンツ取得

Perl HTMLソースから特定のタグ抽出

HTMLから自動的に文章取得

LWPでヘッダー情報をあらかじめ取得したい

他サイトの情報取得

外部サイトの内容の取得

正規表現で指定範囲の文字列の取得

wikipediaのAPIの取り込みについて

注目のQ&A

カテゴリ 一覧

専門家に質問してみよう 専門家登録

あなたにピッタリな商品が見つかる！ OKWAVE セレクト

カテゴリ
一覧

専門家に質問してみよう
専門家登録