• 締切済み

wgetで指定したファイルだけダウンロードするには?

wgetのファイル収集ツールで 指定したファイルだけをダウンロードする方法はどうしたら良いのでしょうか? イメージとしてはこのサイトの http://shupla.w-jp.net/items/wget.html 『3.使い方』 を応用したいのですが、 余計なファイル、ディレクトまでダウンロードしていまい上手くいかないのです。 例えばテキストファイルに http://www.yahoo.co.jp/index.html http://k.yimg.jp/images/top/sp/logo.gif http://k.yimg.jp/images/sh/recommend/84_84_0053.gif こんな感じで書いて、この“3ファイルだけ”を差分ファイルとしてダウンロードしたい場合です。 ちなみに仕様してるOSはWindowsXPです。 ご教示いただきたくお願いいたします。

みんなの回答

  • notnot
  • ベストアンサー率47% (4847/10260)
回答No.1

そのページの『3.使い方』に、 >この意味としては以下となります。 >1.再起的取得する .... と書いてある通り、再帰的(元ページの漢字が間違ってますね)に取得するようにオプションが指定してあります。wgetのオプションは、wget --help で表示されるのでよく読んでください。 一般的な使い方は、 wget URL とURLをコマンドラインで指定します。URLをコマンドラインでなく、別ファイルに書くとすると、-i を使って、 wget -i urllist.txt とかですね。

gonta0012
質問者

お礼

ありがとうございます。 ファイル単位で取得することができました。 もう1点質問させていただいてよろしいでしょうか。 私の質問が悪かったのですが、 ファイル取得する時にディレクトリ構造を保ったままダウンロードするオプションはどのように記述したらよいのでしょうか? ちなみに私wget使ったことがないので初心者なので悪戦苦闘しながら使ってるのですが色んなサイトみてもオプションの意味がたまに分からないことがありまして。。。 すみませんがよろしくお願いします。

関連するQ&A

  • wgetで絶対リンクのファイルをダウンロード

    wget -r http://test~~.jp/test.html 上記のコマンドを使ってリンク先ファイルを再帰的に回収しているのですが リンク先が相対パスのファイルはダウンロードできるのですが 絶対パスの場合、ダウンロードできません。 絶対パスのリンクをダウンロードする方法を教えて下さい。 なお、絶対パスのリンクとは、以下のようなリンクのことです。 <a href="http://test~~.jp/test1/test1.gif">~ wgetに詳しい方がいましたら教えて下さい。宜しくお願い致します。

  • 画像ファイル(.bmp, gif, .jpg, .png)など縦横サイズを取得する方法

    PHP5でホームページにある画像ファイル(.bmp, gif, .jpg, .png)など縦横サイズを取得する方法はありますか? 例えば、Yahooのロゴ http://k.yimg.jp/images/top/sp/logo.gif は、221px, 59pxm GIFnなので、以下のように取得したいです。 $ret = hogehoge???($url); echo $ret["width"]; // 221px echo $ret["height"]; // 59px echo $ret["type"]; // gif

    • ベストアンサー
    • PHP
  • perlで指定か所のurlを取り出したいのですが

    下記のような文字列からhttp://.......jpや....pngなどの部分だけ抜き出したいのですがどうすればいいかわかりません。 どうすればいいでしょうか?? <img src="http://i.yimg.jp/images/bloom/v201212/anonymous_24.png" width="24" height="24"> <img src="http://i.yimg.jp/images/clear.gif" alt="??????????????" width="1" height="1"> <img src="http://amd.c.yimg.jp/im_siggUafHxX5zBqYXXUl0MFuDGQ---x172-y200-q90/amd/20140212-00000043-dal-000-11-view.jpg" width="172" height="200" alt="???????????????????????????????????????????????????????" onContextMenu="javascript:return false;"> <img src="http://i.yimg.jp/images/news/cobranding/dal.gif" alt="????????????" width="170" height="40"> <img src="http://iwiz-talent.c.yimg.jp/im_siggAkAHOLx3UJ96IWzMLAa3aw---x80-y80-pril/o/talent/images/talent/201402/10/m07/m07-1255-140210.jpg" alt="???????????" border="0" width="80" height="80"> <img src="http://i.yimg.jp/images/news/v2/loading_32_b_2x.gif" width="32" height="32"> <img src="http://amd.c.yimg.jp/im_siggdUHHiAjMx0Vtxw6UiBjXGA---x49-y60-q90/amd/20140211-00000068-dal-000-8-view.jpg" alt="?????????????????????????????????Ф????????????"> <img src=" http://i.yimg.jp/images/evt/sochi/images/banner300x90.jpg" alt="????????????????????????" width="300" height="90"> <img src="http://lpt.c.yimg.jp/im_siggOxcR1sffKraZiSLM4Tvlwg---x60-y53-q90/amd/20140212-00000046-spnannex-000-thumb.jpg" alt="????????????μ???????????裲?????????Τ???"> <img src="http://lpt.c.yimg.jp/im_siggd24L.DRjsSsOFQzvcUudxA---x60-y40-q90/amd/20140212-00000104-scn-000-thumb.jpg" alt="???Ρ???????Ф???????????????????????"> <img src="http://lpt.c.yimg.jp/im_sigg5ySCgAEx9Mr.pAnTk_BLeA---x45-y60-q90/amd/20140211-00000010-tospoweb-000-view.jpg" alt="?????????????????????Ρ?????????"> <img src="http://lpt.c.yimg.jp/im_siggbLLaxB6uLw4PgQNbIotTPw---x57-y60-q90/amd/20140212-00000039-dal-000-view.jpg" alt="???????????????Τ????????????????????????????????????????"> <img src="http://amd.c.yimg.jp/im_sigg9vWalgQCOQonMxnTWgrpUg---x40-y60-q90/amd/20140211-00010000-jisin-000-2-view.jpg" alt="??????????????????????????????????????????"> <img src="http://i.yimg.jp/images/clear.gif" width="1" height="1" alt="?????????????"> <img src="http://i.yimg.jp/images/clear.gif" alt="???Υ???????????" width="1" height="1"> [Finished in 0.9s]

    • ベストアンサー
    • Perl
  • wgetのコマンドでは不可能?

    はじめまして、こんにちは。 wgetでpdfをダウンロードしようと試しているのですが、上手くいかず困っている為質問させて頂きます。「ttp://www.***.jp」というサイトの中の「/yuho/」より下のディレクトリにあるpdfファイルをダウンロードしようとしています。 ttp://www.***.jp ↓ ttp://www.***.jp/list/s1000.htm (s1000はs2000,s3000,,,s9000まである) ↓ ttp://www.***.jp/code/1301.htm (1301は1000,1001,,,9999まである) ↓ ttp://www.***.jp/yuho/1301.htm (1301は1000,1001,,,9999まである) ↓ ttp://www.***.jp/mark/20141114/S1003FL5.htm (20141114とS1003FL5はそれぞれ変動、このページにpdfファイルへのリンクがある) 上記の様にリンクが繋がっていて、 ディレクトリ「list」「code」「yuho」「mark」を取得対象とすれば良いのだろうと考え、wgetで -I オプションでディレクトリを list/,code/,yuho/,mark/と指定してみたのですが、上手く働きませんでした。 これはやはり階層構造になっていない為でしょうか? 余計なページのpdfをダウンロードせず、ディレクトリ「yuho」以下の階層にあるpdfをダウンロードする場合はどのようなwgetのコードを書けば良いのでしょうか? wgetでは不可能なのでしょうか? Irvineというダウンローダーで ttp://www.***.jp/yuho/1301.htm の「1301」の部分を1000から9999にして、ダウンロードする拡張子をpdfに指定、階層を2にして実行しましたがこれも失敗でした。 現在も色々調べておりますが、知恵が足りず大変困っております。 こういった分野に造詣が深い方がいらっしゃいましたら、どうかご教授下さい。 宜しくお願い致します。

  • PHPで外部サイトのファイル有無を確認する方法

    例えばYahooのタイトル画像の http://i.yimg.jp/images/mht/main14.gif というファイルが存在するのか?をPHPを使って調べたいのですが、 どのようにすれば良いのでしょうか? 初歩的な質問で申し訳ないのですが、 教えていただければ幸いです。

    • ベストアンサー
    • PHP
  • アクセスしてないのにFLVファイルが勝手にダウンロードされてしまう。

    Temporary Internet Filesに  freedom1_300k.flv  というファイルがあるんですが、削除しても定期的に復活します。該当するアドレスにアクセスしてないので勝手にダウンロードされている模様です。 FREEDOMの動画は、ヤフー動画で見たことがあります。ノートン先生でこのFLVファイルを検査してもウイルスは出てきません。 これはウイルスに感染してるんでしょうか。 キャッシュの情報 《名前》freedom1_300k.flv 《インターネット アドレス》http://i.yimg.jp/images/streaming/special/freedom4/freedom1_300k.flv 《種類》FLV ファイル 《サイズ》3,496 KB

  • wget でのファイル取得

    FTPサーバから、ファイルを取ってこなければならなくなったのですが、サーバ上のファイル名に「日本語」がついています。 Windows の FFFTP では、普通に日本語のファイル名が表示されています。サーバはWindowsのようです。 [xxxxx@xxxxxx Aug]$ ftp ftp.foo.co.jp Connected to ftp.foo.co.jp. 220 Microsoft FTP Service <SNIP!> Name (ftp.foo.co.jp:username): username 331 Password required for username. Password: 230 User username logged in. Remote system type is Windows_NT. ftp> というような表示です。 で、ダウンロードするファイルが多い(10GBのオーダー)なので、wgetで一気に取得しようとしたのですが、うまく取得できません。 ダウンロードするホストのOSはCentOSで日本語が表示されている(LANG=ja_JP.UTF-8)状態です。 ここで wget --no-passive-ftp -nH -np -r ftp://username:password@ftp.foo.co.jp/ と実行すると、index.htmlが生成され、ファイルはダウンロードされません。ファイルはそのまま見ると文字化けするのですが、lvでUTF8に変換するとディレクトリ名などが正常に確認できます。 なぜ、ファイルがダウンロードされないのでしょうか?

  • マウスカーソルを当てたら画像が変更するようにしたい

    マウスカーソルを当てたら 画像が変更するようにしたいのですが <SCRIPT TYPE="text/JavaScript"> <!--function chgImg(a,b){ a.src = b } // --> </SCRIPT> </head> <body> <A HREF="index.html" onMouseOver="chgImg(document.img1,'http://img.www.goo.ne.jp/img/green/gh_logogreen.gif')" onMouseOut="chgImg(document.img1,'http://k.yimg.jp/images/top/ocn/logo.png')"> <IMG SRC="http://k.yimg.jp/images/top/ocn/logo.png" NAME="img1"> </body> このコードだとマウスを当てても何も変化はありません。 http://www.geocities.co.jp/SiliconValley-Bay/8778/tec/t_rlov.html を参考にしました。

  • サイトの登録

    自分で作ったサイトを検索してヒットするようにしたいのですがつまり登録したいのですがどうすればいいのかわかりません http://dir.yahoo.co.jp/pg/submit/guide/submit1.html ここの説明を見たのですがこの図(http://i.yimg.jp/images/dir/site_submit/03.gif)のとこができません。 なので次の手順のhttp://i.yimg.jp/images/dir/site_submit/20060315/100b2_01.gif ここのサイトの登録・変更ができません どうすればいいでしょう?

  • IISサーバでファイルを隠す

    これまではLinuxのapacheで.htaccessを使ってファイルを隠していました。 サーバをIISに変えました。 たしかIISには.htaccessはありませんよね? ルートのimagesフォルダ以下のjpgとgifを隠したいです。 /images/*.jpg と /images/*.gif を隠す方法を教えてください。 PHPからはfopen('/images/xx.jpg', 'w+b')が可能な状態にしたいです。