締切済み

wgetのヴァージョン？

2009/04/07 13:32

最近連続でお世話になっております(汗。。) 二以上のURLを指定したファイルを指定しwgetで取得しています。 url.csvには以下のようにurlが改行で記述されています。 ttp://aaa.jp/ ttp://bbb.jp/ ttp://ccc.jp/ 以下のコマンドで成功します。オプションは(index.htmlを省いたhtmlファイルだけを取得) wget -nc -r -A html -R index.html -i url.csv しかし、違うそれもスペックが高い(cpu、メモリ、しかもデュアルコア)サーバで実行すると１件目はオプション通りにファイル群を取得しますが、２件目以降のurlはindex.htmlだけを取得してしまいます。ちなみに、wgetのヴァージョンは成功するほうが1.8.2で失敗するほうが1.10.2です(後者のほうがヴァージョンも高いですよね) 何かお気づきの方がいればご教授下さい。

gogovamos
お礼率8% (9/107)

Linux系OS
回答数2
ありがとう数6

みんなの回答 （2）
専門家の回答

みんなの回答

Murasan759
ベストアンサー率59% (312/527)

2009/04/08 12:06 回答No.2

GNUのmanpageを見ると http://www.gnu.org/software/wget/manual/wget.html Note that these two options do not affect the downloading of html files (as determined by a ‘.htm’ or ‘.html’ filename prefix). This behavior may not be desirable for all users, and may be changed for future versions of Wget. と書いていますね。なお、ファイル名を指定すること自体は可能で、ワールドカードも使用できます。バージョンによって、htmlファイルを指定したときの挙動が違うのかもしれません。あと、url.csvの1行めと2行めを入れ替えると、1件めがindex.htmlだけを取得して、2件めがオプション通りにファイル群を取得するてことないですか？　.htmlじゃなく.htmだったりして？ wget -nc -r -A html,htm -R "index.htm*" -i url.csv

質問者

補足 2009/04/10 19:59

シェル内に以下を追記することで、現象を解消できました。 export LANG=C export LC_ALL=C しかし、コマンドを直打ちの場合は上手く良くのですが、cronで実行させると再び２件目移行はinde.htmlだけの取得となります。こちらは締め切りますが、上でも質問させて頂きましたので引き続きご教授をお願いいたします。

tk_uc
ベストアンサー率68% (33/48)

2009/04/07 16:02 回答No.1

手元のマシンで1.10.2のhelpを見ると、 -R, --reject=LIST ダウンロードしない拡張子をコンマ区切りで指定するとありますので、「-R index.html」の指定がおかしいのでは？

質問者

補足 2009/04/07 16:23

wgetのヴァージョンが関係あるのかは定かではありませんが、 1.8.2があるサーバでは期待通りに取ってくれるのですよね。。。しかし、1.10.2でも１件目はindex.html以外のhtmlを全て取得しますが、２件目以降は反対にinde.htmlだけを取得します？？？ >とありますので、「-R index.html」の指定がおかしいのでは？ index.html以外の全てのhtmlファイルだけを取得オプションってどう書くのでしょうか？

wgetのヴァージョン？

みんなの回答

補足 2009/04/10 19:59

補足 2009/04/07 16:23

関連するQ&A

◆wgetをcronで動かす場合

wgetのコマンドでは不可能？

wget について

◆wgetのオプション

wgetのオプション

wgetコマンドの精度と取得階層数

シェルスクリプトで外部ファイルを読み込みループさせたい

wgetでのダウンロードについて

wget　使い方

wgetで指定したファイルだけダウンロードするには？

UNIXコマンドwgetについての質問です

wgetコマンドについて

wgetで指定したURLの背景画像等の取得方法

wget でのファイル取得

wgetで絶対リンクのファイルをダウンロード

wgetで対象ページをミラーリング

wgetの後

cronで定期的にWGETしたい

wgetでSegmentation fault

javaでwgetを動作させる際に

注目のQ&A

カテゴリ
一覧

専門家に質問してみよう
専門家登録

あなたにピッタリな商品が見つかる！ OKWAVE セレクト

wgetのヴァージョン？

みんなの回答

補足 2009/04/10 19:59

補足 2009/04/07 16:23

関連するQ&A

◆wgetをcronで動かす場合

wgetのコマンドでは不可能？

wget について

◆wgetのオプション

wgetのオプション

wgetコマンドの精度と取得階層数

シェルスクリプトで外部ファイルを読み込みループさせたい

wgetでのダウンロードについて

wget 使い方

wgetで指定したファイルだけダウンロードするには？

UNIXコマンドwgetについての質問です

wgetコマンドについて

wgetで指定したURLの背景画像等の取得方法

wget でのファイル取得

wgetで絶対リンクのファイルをダウンロード

wgetで対象ページをミラーリング

wgetの後

cronで定期的にWGETしたい

wgetでSegmentation fault

javaでwgetを動作させる際に

注目のQ&A

カテゴリ 一覧

専門家に質問してみよう 専門家登録

あなたにピッタリな商品が見つかる！ OKWAVE セレクト

wget　使い方

カテゴリ
一覧

専門家に質問してみよう
専門家登録