2万行のURLをHTMLファイルで保存する方法とは?

このQ&Aのポイント
  • 2万行のURLをHTMLファイルで保存する方法を探しています。Web徘徊保存ソフト以外にもシンプルな方法があるか知りたいです。
  • 2万行のURLをHTMLファイルにダウンロードする方法を教えてください。Web徘徊保存ソフト以外でシンプルに実現する方法があれば教えてください。
  • 2万行のURLをHTMLファイルに保存するためには、どのような方法がありますか?Web徘徊保存ソフト以外にもシンプルな方法を教えてください。
回答を見る
  • ベストアンサー

URL2万行をHTMLファイルで保存したい

以下のように2万行のURLがありますが、 これを片っ端からHTMLファイルでダウンロードするうまい方法はありませんか。 http://example.com/page.jsp?page=1 http://example.com/page.jsp?page=2    :略 http://example.com/page.jsp?page=19999 http://example.com/page.jsp?page=20000 2万アドレスへのハイパーリンクが記述されたHTMLファイル(↓)を自作し、 <a href="http://example.com/page.jsp?page=1">1</a><br> <a href="http://example.com/page.jsp?page=2">2</a><br> 「波乗野郎」みたいなWeb徘徊保存ソフトを使えばいけそうな気がしますが もっとシンプルな方法はありませんか。

質問者が選んだベストアンサー

  • ベストアンサー
noname#195576
noname#195576
回答No.1

フリーのダウンロードツールの Irvine (アーバイン) http://www.vector.co.jp/soft/win95/net/se218138.html で出来そうだけど最近のは試してないのでわからない。 >「波乗野郎」みたいなWeb徘徊保存ソフトを使えばいけそうな気がしますが >もっとシンプルな方法はありませんか。 どの程度手間かかるのかわかりませんが Irvine だと多分 >2万行のURL を Irvine にコピペできますから大した手間ではないと思いますが。

litton101
質問者

お礼

unagi-pie2さん、ご回答をありがとうございました。 > Irvine (アーバイン) > で出来そうだけど最近のは試してないのでわからない。 そういえば、Irvineがありましたね、 ダイアルアップの時代は、まだ前身のIriaの頃から使ってました。 (ブロードバンド全盛ですっかり使わなくなりましたが・・) この「真打ちソフト」で本件解決できそうです、ありがとうございます。

その他の回答 (2)

  • ORUKA1951
  • ベストアンサー率45% (5062/11036)
回答No.3

すでにHTMLあるなら ScrapBook( https://addons.mozilla.jp/firefox/details/427 )

litton101
質問者

お礼

ORUKA1951さん、ご回答ありがとうございました。 >すでにHTMLあるなら ないですけどすぐにつくれると思います。 >ScrapBook( https://addons.mozilla.jp/firefox/details/427 ) なるほど、FireFoxのアドインにこんな便利なツールがあるのですね。 有力候補として検討してみます。非常に参考になりました。

  • Tacosan
  • ベストアンサー率23% (3656/15482)
回答No.2

OS によっては wget とか.

litton101
質問者

お礼

Tacosanさん、ご回答をありがとうございました。 wgetが、コマンドラインで HTTP や FTP 経由のファイル取得を行えるツールだという ことはわかりましたが、あいにくWindows7なので 今後の可能性ということでよく覚えておこうと思います。 ありがとうございました。

関連するQ&A

  • jspファイルが作れません

    現在、jspを勉強なのですが、jspファイルが作れません。 メモ帳にコードを打ちこんだあと、拡張子に「.jsp」を つけて保存するのですが、テキストファイルのままになって しまいます。(教本に付属CDがあり、サンプルでは「jspファイル」 とちゃんと表示されています) ちなみに、サーブレットやHTMLファイルを作成して、トムキャット で実行することはできています。 jspファイルを作るには何か特別なソフトがいるのでしょうか? ネットをいろいろ検索してみましたが、糸口がつかめず困っています。 このような説明でうまく伝わるか不安ですが、どなたかわかる方がいらっしゃいましたら 教えていただけるとうれしいです。 よろしくお願いいたします。 メモ帳でSample1.jsp作成時のコード内容↓ <%@ page cotentType="text/html; charset=Shift_JIS" %> <%@ page import="java.util.*" %> <html> <head> <title>サンプル</title> </head> <body> <center> <img src="car.gif"><br /> <h2>ようこそ</h2> <hr /> 今<%= new Date() %>です。<br /> お選びください。<br /> <br /> <a href="car1.html">乗用車</a><br /> <a href="car2.html">トラック</a><br /> <a href="car3.html">オープンカー</a><br /> </center> </body> </html>

    • ベストアンサー
    • Java
  • 1つのHTMLファイルを区別する方法

    1つのHTMLファイルを、おとな用と子供用に区別して表示したのですが、 やり方がわからず困っています。 URIでできますか? 詳しい方、是非お力をお貸しください。 呼出し側のHTMLファイル(index.html) <a href="settei.htm?mode=1">おとな用</a><br> <a href="settei.htm?mode=2">子ども用</a><br>

  • ソーティングソースの追加方法

    何度もみて頂き申し訳ない気持ちが強いのですが、よろしくお願いします。昨日言っていたソースといいますのが以下のようなものになります。 <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN"><HTML><HEAD><TITLE>paging1-200</TITLE></HEAD><BODY> <form action=pagingpart2.jsp method=POST> ページ:<input type=text size=2 name=page> <input type=submit value="go" name=btn1> // ページングのパラメーターを持たせる <a href="pagingpart2.jsp?page=1"> 1</a> <a href="pagingpart2.jsp?page=2"> 2</a> <a href="pagingpart2.jsp?page=3"> 3</a> <a href="pagingpart2.jsp?page=4"> 4</a> <a href="pagingpart2.jsp?page=5"> 5</a> <a href="pagingpart2.jsp?page=6"> 6</a> <a href="pagingpart2.jsp?page=7"> 7</a> <a href="pagingpart2.jsp?page=8"> 8</a> <a href="pagingpart2.jsp?page=9"> 9</a> <a href="pagingpart2.jsp?page=10"> 10</a>    // ここからがJAVA <% import java.awt.*;  // ←ここにエラーがでます。 import java.awt.event.*;  // ←ここも(以下略) import java.util.*; import java.util.List; import javax.swing.*; import javax.swing.event.TableModelEvent; import javax.swing.event.TableModelListener; import javax.swing.table.*; // 以下もダウンロード(?)したソースが続きます。 class TableSorterDemo extends JPanel {  //(・・・続く) その後データベースにコネクト(ここはOKなはず)し、データを取ります。基本的なSQLのデータベースです。問題となるような節はありますでしょうか?? よろしくお願いします。m(__)m

    • ベストアンサー
    • Java
  • 正規表現の否定先読みについて

    <a href="http://example.com/aaaa/hogehoge1.jpg" target="_blank"><img src="http://example.com/aaaa/hogehoge1.jpg" width="100" alt="huge1"></a><br />hogehoge<br /><a href="http://example.com/bbbb/hogehoge2.jpg" target="_blank"> <img src="http://example.com/bbbb/hogehoge2.jpg" alt="huge2"></a> こういうHTMLがあるとします。改行はなく1行です。 このHTMLから正規表現で 『width="100"がついていない<img>タグ』 のsrc=""までを抜き出して置換したいのです。 期待する結果は <img src="http://example.com/hage/hogehoge2.jpg" です。 そこで /<img src="http:\/\/.*?.jpg"\s(?!width)/ というパターンを試しましたが、.*?の最短一致が思った通りにいかず <img src="http://example.com/aaaa/hogehoge1.jpg" width="100" alt="huge1"></a><br />hogehoge<br /><a href="http://example.com/bbbb/hogehoge2.jpg" と、1つ目の<img>が入ってしまい、2つ目の<a>タグまで抜き出されてしまいます。 これをうまくwidth="\d+"と入っていない<img>タグのみに適用させる方法はないでしょうか? どなたかよろしくおねがいいたします。

    • ベストアンサー
    • PHP
  • ブログのHTMLからトラックバックをしたブログのURLの抽出

    ブログのHTMLから、そのブログのある記事に トラックバックをしたブログのURLを抽出するプログラムを作りたいと思います。 例えば、URLがhttp://blogs.yahoo.co.jp/example/1234というヤフーのブログの記事に、 http://blog.goo.ne.jp/example/1234 http://blogs.yahoo.co.jp/example2.html の二つのブログがトラックバックをしたとします。 このヤフーのブログの記事のHTMLは以下のようになります。 <html> <head> … <style="display:none">http://blogs.yahoo.co.jp/example/1234/trackback</div> … <tr id="tb_tab" style="display:block"> … <b><a href="http://blog.goo.ne.jp/example/1234" target=_blank>…</a></b> … <b><a href="http://blogs.yahoo.co.jp/example2.html" target=_blank>…</a></b> … </body> </html> そこで、トラックバックをしたURLを抽出するときに、 例えば、http://blog.goo.ne.jp/example/1234を抽出するのに、 target=_blankを参照して、 HTML中の<a href="http://blog.goo.ne.jp/example/1234" target=_blank>から http://blog.goo.ne.jp/example/1234を抜き出すようにして、 トラックバック先のURLを抽出するプログラムを作成したいです。 このようなプログラムを作成するにはどのようにプログラムを組めばいいのでしょうか? また、HTML中には、target=_blankで参照すると、以下のような <a href="http://rd.yahoo.co.jp/rss/b/blog/myblog/rss2/01/*http://blogs.yahoo.co.jp/example/rss.xml" target=_blank> [<a href="/example2/5242000" target=_blank> 余分な情報も抜き出してしまうので、上記を抽出しないように、 rssを含むもの、http:で始まらないものは抽出しないという条件で抽出できるようなら、 こちらの方法も教えていただきたいです。 よろしくお願いします。

    • ベストアンサー
    • Java
  • Excel VBAを使ってHTML生成をしたい

    エクセルにデータを入力し、下記のようなhtmlファイルに各々のセルに対応した数値が代入されたものを生成したいと考えています。 <a href="【A1】.html">【A2】</a><br/> <a href="【B1】.html">【B2】</a><br/> <a href="【C1】.html">【C2】</a><br/> <a href="【D1】.html">【D2】</a><br/> <a href="【E1】.html">【E2】</a><br/> VBAを使ってこのようなことは可能でしょうか? また、そのほかどのような方法が考えられますでしょうか? なにとぞよろしくお願いいたします。

    • ベストアンサー
    • HTML
  • HTML一括変更

    自分はHTMLを作成しているものです。 今、作っているサイトの内容を一括変更したいのですが、いちいち一つずつのHTMLファイルのソースを書き換えるのは手間がかかるので、便利なフリーソフト、又はエクセルなどで出来るのなら、その方法を教えていただきたいです!! 例えば、a1.html a2.html a3.html のHTMLファイルのソースコードの、<a href="top-page.html"></a>という3つのファイルに見られる、共通部分の、top-pageをmailなどに一括で変更したいのです。ファイル数が膨大なので、是非教えていただくと助かります!!

  • HTMLの"?page"の意味

    質問させてください。 HTMLで<a href="?page=">という記述を良く見かけますが、この"?page="とはどういう意味でしょうか? 宜しければお教えください。

  • ローカルのHTMLファイルを開く際、ファイルに変数を渡すことは可能ですか?

    こんにちは。お世話になります。 たとえば http://oshiete1.goo.ne.jp/kotaeru.php3?q=1904866 というのは、サーバ上のkotaeru.php3というスクリプトに q=1904866という変数を渡した場合の出力をリクエストしているわけですが、 変数の値を変えることにより、出力の内容を変化させることができます。 いま、ローカルPC環境での閲覧を前提としたHTMLファイルを作成しています。(すなわち、ハードディスク上にあるHTMLファイルを、単にブラウザで表示させるだけです。PCにパーソナルウェブサーバを稼動させて、そのサーバの応答を表示させたりするわけではありません。) HTMLファイルを表示させる際に、呼び出しURLの変数の値を変えることによって表示内容を変化させるファイルを作成したいのですが、そのようなことは可能でしょうか。 ---- ↓以下、なんとなく具体的?な例(ハードディスク上のHTMLファイル) <html> <body> <a href="sample.html?★=10">表示行を10回表示</a><br> <a href="sample.html?★=50">表示行を50回表示</a><br> <a href="sample.html?★=100">表示行を100回表示</a> </body> </html> ---- ↓sample.html(呼び出すHTMLファイル)の内容 <html> <body> <script language="JavaScript">   ● = URLから★の値を取得する;   for(i=0; i<●; i++){     document.write("表示行<br>");   } </script> </body> </html> ---- 何百種類もHTMLファイルを作るのが面倒なので、なんとかしたいと考え、質問させていただきました。 JavaScriptでも他言語でもかまいません。HTMLファイルをCD-ROMで配布するため、PHPなどをインストールしなくても可能な方法があれば、ご教授くださいませんでしょうか。(小ウィンドウを動的に生成する方法も考えたのですが、できればURLを使って変数を渡したいです。) よろしくお願いします。

  • AndroidでのHTMLファイルの読み込み

    PC上で作成したHTMLファイルをAndroid(2.3)のスマートフォンで読みたいと思い、作成したファイルをスマートフォンのSDカード内に移動しました。 スマートフォン上でそのファイルを開けたのは良いのですが、リンクで別のHTMLファイルに移動しようとするとエラーが出て正常に動作しませんでした。 どうすれば読めるようになるのでしょうか? 以下に、そのHTMLファイルのソースを掲載しますので、よろしくお願いします。 このHTMLファイルから別のHTMLファイル(page1.html)に移動したいと考えています。 --------------------------------------------- <html> <head> <title>test page</title> <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> </head> <body> <a href="page1.html">移動</a> </body> </html> --------------------------------------------- こちらが移動先のHTMLファイル(page1.html)のソースです。 --------------------------------------------- <html> <head> <title>My Page</title> <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> </head> <body> 移動完了 </body> </html> --------------------------------------------- エラーメッセージは画像ファイルの通りです。