GetHTMLWでオフライン閲覧可能!ダウンロードできないページとは?

このQ&Aのポイント
  • GetHTMLWを使用しているが、一部のページでダウンロードができない問題が発生している。
  • ブラウザでは閲覧できるが、GetHTMLWではダウンロードできないのは何故か?
  • GetHTMLWの設定が悪い場合、設定方法を分かりやすく説明しているHPを知りたい。
回答を見る
  • ベストアンサー

GetHTMLW

ウェブページをダウンロードしてくれるソフト「GetHTMLW」を使っています。 オフライン環境でも閲覧できるので重宝しています。 でも、問題があります。 ほとんどのページを取得できるのですが、 ブラウザでは閲覧できるのに、GetHTMLWでは 全くダウンロードできないページが存在します。 それから、代替ファイルに置き換えられてしまい、 ダウンロードしたファイルが閲覧できないページもあります。 そこで質問です。 (1)ブラウザで閲覧できるのに、GetHTMLWでダウンロードできないページは、 サーバー側でダウンロードできないように 何らかの工夫がされているのでしょうか? それとも、GetHTMLWの設定が悪いのでしょうか? (2)(1)で、GetHTMLWの設定が悪い場合、 設定方法を分かりやすく説明しているHPがありましたら 紹介してください。 答えられる範囲でよいので、回答いただけると助かります。 よろしくお願いします。

noname#13404
noname#13404

質問者が選んだベストアンサー

  • ベストアンサー
noname#13903
noname#13903
回答No.1

>サーバー側でダウンロードできないように >何らかの工夫がされているのでしょうか? User Agentでアクセス制限を敷くことができます。 GetHTMLWのUAはPockey-GetHTMLというのですが、これがサーバーに多大な負荷を与えているとのことで、一部のサーバーでは締め出しを食らっているようです。

参考URL:
http://on-o.com/page/diary/20030616.html#p04
noname#13404
質問者

お礼

回答ありがとうございます。 >Pockey-GetHTML これで調べたところ、GetHTMLWはかなり嫌われているみたいですね。 他の巡回ダウンロードソフトを使用したら問題なく取得できました。

関連するQ&A

  • 「GetHTMLW」の使い方がわかる方

    オフラインで WebPage を閲覧するためのソフト「GetHTMLW」です。 「GetHTMLW」の使い方がわかる方 教えてください。 こちらのソフトを使えるようになりたいと思っていますが、なかなか理解できず、 1つずつひも解いています。 read meというか、「GetHTMLW」の場合はgethtmlw.txtですが、この説明書きの中に、 「WWW ブラウザのプロキシを GetHTMLW にすることで、オンラインの閲覧と同じ感覚で 取得された WebPage を閲覧できます。」 と書いてありますが、WWW ブラウザのプロキシはどこにあるのでしょうか。 それをGetHTMLWに変換する方法も教えてください。 また、Mozilla FireFoxのブラウザも準備していますが、IE6でも出来るのでしょうか。 お願いします。

  • GetHTMLWと巡集について

    os XPsp2、IE6.0でGetHTMLW7.14.0と巡集 ver1.59.2を使用しています。 gethtmlw.txtやFAQ, 問答集などを読んでも、全然わか らないので困っています。 1.IE6.0でGetHTMLWのProxy Mode 1、Proxy Mode 2の機能を使うためには、GetHTMLWの設定を どのようにしたらいいのでしょうか。 2.GetHTMLWで画像ファイルや音声ファイルや圧縮フ ァイルなどをHPと一緒に取得するためには、設定を どのようにしたらいいのでしょうか。 3.GetHTMLWや巡集でひとつの画面で、画面の半分は 取得できたけれども、もう半分はテキストファイルみ たいになっている場合は、どうすればよいのでしょう か? <html><head><title>ソフトウェア関連質問スレ用FAQ</title> <meta name="robots" content="index,follow"> <meta http-equiv="Content-Type" content="text/html; charset=Shift_JIS" /> <meta http-equiv="Content-Style-Type" content="text/css" /> いくらやり直してもこのようにうまくいきません。 4.GetHTMLWで、取得できないものとして、 (Shockwave-Flash 内の追跡は対応しましたが、Java, JavaScript,その他純粋な HTML でないページには対 応していません) と書いてあるのですが、具体的にはどのようなことを さすのでしょうか。 もし、そういったものを取得したい場合は、どのよう に対処すればよいのでしょうか。 5.巡集でHPをダウンロードすると、ダウンロード したフォルダ名やファイル名が文字化けしていて、そ のファイルを開くと、中身も文字化けしています。 その場合、どうやったら、きちんとダウンロードでき るのでしょうか。 6.巡集の設定で「HTMLのタグを読まないとUR Lの%を変換しない」は、どういう時にチェックをす ればよいのでしょうか。 どうか宜しくお願いします。

  • getHTMLWの使い方を教えて下さい。

    getHTMLWの使い方を教えて下さい。 「WebPage取得」にURLを入力してダウンロードしたのですが、 それをどうやればネットサーフィンと同じように閲覧が 出来るのかがわかりません…。 OSはVista、IE7を使用しています。 宜しくお願いします。

  • gethtmlw の使い方

    インターネットでgethtmlwというフリーソフトを見つけて、ダウンロードインストールしました。自分では問題なくインストールできたと思います。 それで、いざ実行しようと思い、使い方を学ぼうと思ってネットで検索してみたらhttp://page.freett.com/ippeus/windows/getweb/index.html#watch に非常に分かりやすい説明がありました。 そこで質問なのですが、前出のHPには、「取り込んだサイトを閲覧 GetHTMLWのフォルダを開いてみます(中略)」と書いてありますが、私がとりこんだPCにはその保存用のフォルダがないんです。これはうまくダウンロード、インストールできてないのでしょうか(数回トライしてみました)、それとも違った名前でフォルダが出来ているのでしょうか?また、出来ていたとしたらどこの場所に出来ているのでしょうか?(私はPCに詳しくないため、展開フォルダとか扱ってません)。(作成されたGETHTMLW.EXEを使って、サイトの取得はできました。) ご存知の方、ご回答お願いします。もう一つインスト-ルの時にファイルがいくつか作成されました。削除しても構わないファイル等も教えてくださったら幸いです。 あと、このソフトはスタートボタンのすべてのプログラムには表示されません。なんだか心配です

  • GetHTMLW url以下のファイルをダウンロードするには

    こんにちは、 GetHTMLW ver.8.1.1を使っています。 このURL以下のファイルを取得したいとします。 http://www.mdn.co.jp/webcre/Flash/ (例えば、http://www.mdn.co.jp/webcre/Flash/vol80/FlashCT.lzh みたいにvol1から複数存在) ただし、 http://www.mdn.co.jp/webcre/Flash/ をブラウザで見ると、「HTTP 403 アクセス不可」になります。 http://www.mdn.co.jp/webcre/Flash/vol80/FlashCT.lzhでは取得できます。 このようなケースで、GetHTMLW ver.8.1.1でどういう条件にすれば、 取得できますか?また、その他うまくダウンロードする方法があれば教えてください。 (WebCreatorは3年程定期購読していてまとめてダウンロードしたいと考えました。) 何かお分かりでしたらアドバイスお願いします。

  • GetHTMLWでWEBを完全に保存したいです。

    皆さん、はじめまして。早速ですが、本題に入らせていただきます。 保存先はページの豊富な解説サイトです。 TOPのアドレスをhttp://A/top/とすると、そこに http://A/zabieru/ や http://B/edo/ や http://C/hideyoshi/などの別ページのリンクが数多くあります。 (1)GetHTMLWでWEBの保存を何度も試みましたが完全にできませんでした。 フォルダ上にファイルがダウンロードできてるが、TOPのリンクがフォルダのBとCにつながらなか った。リンクに失敗した部分はhttpになっている。 ↓ (2)他のソフトを使っても同じ結果でした。 ↓ (3)設定で→「B」と「C」のURLを追加。 ↓ (4)失敗。 ↓ (5)検索したらhttp://blog.golfdigest.co.jp/user/murasan/archive/83のページで、 ↓ GetHTMLWでWEBの保存したときに別のアドレスだった場合は、加工しないと(リンクを直さないと) いけないとかかれてました。 たしかに保存したWEBのソースを見ると、「A」がはhref="hideyoshi.htmlなのに対して、「B」 や「C」の部分はhref=http://B/hideyoshi/になっていました。 そこで質問ですが、一つ一つリンクを直すのはできればしたくないので、 他によい方法がありましたら、教えてください。 皆さん、よろしくお願いします。

  • GetHTMLWの取得データ、その扱いについて

    http://hp.vector.co.jp/authors/VA014425/gethtmlw/getstart.html の目次4のところに書いてあるように設定すると、閲覧したページが自動的にGetHTMLW専用フォルダに保存されていきます。このデータはこのままでは扱いにくいので他のフォルダに「移動」あるいは「コピー」するわけですが、移動してしまったデータを「URLとして開く」事はできないのでしょうか。つまり http://www.aaa と言うページをproxy mode 2で取得したとします。専用フォルダの中にあるうちはlocal modeで「動作」→「URLとして開く」で http://www.aaa の形式で閲覧できるのですが、専用フォルダの外へ移動してしまったデータは c:\My document\www\aaa というような形式でしか閲覧できないのでしょうか。

  • GetHTMLWでの指定Dir内のDownLoad方法が?

    GetHTMLWでトップページが無いディレクトリ内の指定拡張子データをダウンロードしたいのですが、フィルタ設定では出来ませんでした。 どうすればよいのでしょうか?

  • GetHTMLWのソフトでネットサーフィンしたサイトの保存

    GetHTMLWのソフトです。 2階層3階層を保存するとなると、時間がかかってしまうので、 ネットサーフィンで閲覧したサイトだけ保存したいと思っています。 「ネットサーフィン時に見たデータをすべて保存、オフライン後も再生」 と謳(うた)っています が、 その設定方法を教えてください。

  • ブラウザでのHTMLダウンロード

    ブラウザである動的ページをダウンロードし、 ユーザがオフライン環境でもWebページを閲覧できるようにしたいと考えています。 そこで、質問ですが、 動的ページをダウンロードするには、どういった方法があるでしょうか? ブラウザでは、例えばIEの場合、名前を付けて保存とすればそのページを表示するのに必要な全ファイル(CSS,HTML,画像等)をダウンロードできます。 こういった方法しかないのでしょうか? また、名前を付けて保存とすると、たまに、「このページは正しく保存されない可能性があります」というメッセージが表示されます。 これはどういったHTMLの場合に表示されるのでしょうか? (これはJavaというよりもブラウザの質問ですね・・・) 私の目的は、確実に動的ページをオフライン環境でも閲覧できるようにすることです。 そのためには、動的ページを構成する全ファイル(CSS,HTML,画像等)のダウンロードが必須です。 どなたか詳しい方、ご教授をよろしくお願いいたします。

    • ベストアンサー
    • Java

専門家に質問してみよう