• ベストアンサー

GETHTMLWのデータ、どのように整理?

GETHTMLWを使われている方にお聞きしたいのですが、複数のサーバーにコンテンツを置いているページを保存した場合、多くのフォルダが作成されてどれがどれだか分からなくなってしまいませんか。皆さんはどのように整理しておられるのでしょうか。

質問者が選んだベストアンサー

  • ベストアンサー
noname#21649
noname#21649
回答No.1

受信データを置いておくホルダー(サブディレクトリー)をAAAとします。 AAAでGetHtmlで受信。 HTMLファイルに受信アドレスを記載しておく必要があるので.ProximitronのSAVE from URLフィルターを使用する。 参照関係を整理したデータベースファイルファイルMO-0001.mdbを作成する。 AAA内HTML関係ファィルをAAA.HTMサブティレクトリーにコピー。 AAA.HTMサブディレクトリー内ファイルの<A>タグ内アドレスをhttp.ftp参照からfile参照に書き換える。 私が直接ファイルを操作することはないです。全部子供任せで.ソフトができていますから(ソフトは非公開。ディスクを直接操作するようなことをしているので.使わないほうが身の為です)。

torakarada
質問者

お礼

御回答ありがとうございました。難しそうですね。

関連するQ&A

  • gethtmlw の使い方

    インターネットでgethtmlwというフリーソフトを見つけて、ダウンロードインストールしました。自分では問題なくインストールできたと思います。 それで、いざ実行しようと思い、使い方を学ぼうと思ってネットで検索してみたらhttp://page.freett.com/ippeus/windows/getweb/index.html#watch に非常に分かりやすい説明がありました。 そこで質問なのですが、前出のHPには、「取り込んだサイトを閲覧 GetHTMLWのフォルダを開いてみます(中略)」と書いてありますが、私がとりこんだPCにはその保存用のフォルダがないんです。これはうまくダウンロード、インストールできてないのでしょうか(数回トライしてみました)、それとも違った名前でフォルダが出来ているのでしょうか?また、出来ていたとしたらどこの場所に出来ているのでしょうか?(私はPCに詳しくないため、展開フォルダとか扱ってません)。(作成されたGETHTMLW.EXEを使って、サイトの取得はできました。) ご存知の方、ご回答お願いします。もう一つインスト-ルの時にファイルがいくつか作成されました。削除しても構わないファイル等も教えてくださったら幸いです。 あと、このソフトはスタートボタンのすべてのプログラムには表示されません。なんだか心配です

  • GetHTMLW

    ウェブページをダウンロードしてくれるソフト「GetHTMLW」を使っています。 オフライン環境でも閲覧できるので重宝しています。 でも、問題があります。 ほとんどのページを取得できるのですが、 ブラウザでは閲覧できるのに、GetHTMLWでは 全くダウンロードできないページが存在します。 それから、代替ファイルに置き換えられてしまい、 ダウンロードしたファイルが閲覧できないページもあります。 そこで質問です。 (1)ブラウザで閲覧できるのに、GetHTMLWでダウンロードできないページは、 サーバー側でダウンロードできないように 何らかの工夫がされているのでしょうか? それとも、GetHTMLWの設定が悪いのでしょうか? (2)(1)で、GetHTMLWの設定が悪い場合、 設定方法を分かりやすく説明しているHPがありましたら 紹介してください。 答えられる範囲でよいので、回答いただけると助かります。 よろしくお願いします。

  • GetHTMLWの取得データ、その扱いについて

    http://hp.vector.co.jp/authors/VA014425/gethtmlw/getstart.html の目次4のところに書いてあるように設定すると、閲覧したページが自動的にGetHTMLW専用フォルダに保存されていきます。このデータはこのままでは扱いにくいので他のフォルダに「移動」あるいは「コピー」するわけですが、移動してしまったデータを「URLとして開く」事はできないのでしょうか。つまり http://www.aaa と言うページをproxy mode 2で取得したとします。専用フォルダの中にあるうちはlocal modeで「動作」→「URLとして開く」で http://www.aaa の形式で閲覧できるのですが、専用フォルダの外へ移動してしまったデータは c:\My document\www\aaa というような形式でしか閲覧できないのでしょうか。

  • GetHTMLWでWEBを完全に保存したいです。

    皆さん、はじめまして。早速ですが、本題に入らせていただきます。 保存先はページの豊富な解説サイトです。 TOPのアドレスをhttp://A/top/とすると、そこに http://A/zabieru/ や http://B/edo/ や http://C/hideyoshi/などの別ページのリンクが数多くあります。 (1)GetHTMLWでWEBの保存を何度も試みましたが完全にできませんでした。 フォルダ上にファイルがダウンロードできてるが、TOPのリンクがフォルダのBとCにつながらなか った。リンクに失敗した部分はhttpになっている。 ↓ (2)他のソフトを使っても同じ結果でした。 ↓ (3)設定で→「B」と「C」のURLを追加。 ↓ (4)失敗。 ↓ (5)検索したらhttp://blog.golfdigest.co.jp/user/murasan/archive/83のページで、 ↓ GetHTMLWでWEBの保存したときに別のアドレスだった場合は、加工しないと(リンクを直さないと) いけないとかかれてました。 たしかに保存したWEBのソースを見ると、「A」がはhref="hideyoshi.htmlなのに対して、「B」 や「C」の部分はhref=http://B/hideyoshi/になっていました。 そこで質問ですが、一つ一つリンクを直すのはできればしたくないので、 他によい方法がありましたら、教えてください。 皆さん、よろしくお願いします。

  • GetHTMLWと巡集について

    os XPsp2、IE6.0でGetHTMLW7.14.0と巡集 ver1.59.2を使用しています。 gethtmlw.txtやFAQ, 問答集などを読んでも、全然わか らないので困っています。 1.IE6.0でGetHTMLWのProxy Mode 1、Proxy Mode 2の機能を使うためには、GetHTMLWの設定を どのようにしたらいいのでしょうか。 2.GetHTMLWで画像ファイルや音声ファイルや圧縮フ ァイルなどをHPと一緒に取得するためには、設定を どのようにしたらいいのでしょうか。 3.GetHTMLWや巡集でひとつの画面で、画面の半分は 取得できたけれども、もう半分はテキストファイルみ たいになっている場合は、どうすればよいのでしょう か? <html><head><title>ソフトウェア関連質問スレ用FAQ</title> <meta name="robots" content="index,follow"> <meta http-equiv="Content-Type" content="text/html; charset=Shift_JIS" /> <meta http-equiv="Content-Style-Type" content="text/css" /> いくらやり直してもこのようにうまくいきません。 4.GetHTMLWで、取得できないものとして、 (Shockwave-Flash 内の追跡は対応しましたが、Java, JavaScript,その他純粋な HTML でないページには対 応していません) と書いてあるのですが、具体的にはどのようなことを さすのでしょうか。 もし、そういったものを取得したい場合は、どのよう に対処すればよいのでしょうか。 5.巡集でHPをダウンロードすると、ダウンロード したフォルダ名やファイル名が文字化けしていて、そ のファイルを開くと、中身も文字化けしています。 その場合、どうやったら、きちんとダウンロードでき るのでしょうか。 6.巡集の設定で「HTMLのタグを読まないとUR Lの%を変換しない」は、どういう時にチェックをす ればよいのでしょうか。 どうか宜しくお願いします。

  • 「GetHTMLW」の使い方がわかる方

    オフラインで WebPage を閲覧するためのソフト「GetHTMLW」です。 「GetHTMLW」の使い方がわかる方 教えてください。 こちらのソフトを使えるようになりたいと思っていますが、なかなか理解できず、 1つずつひも解いています。 read meというか、「GetHTMLW」の場合はgethtmlw.txtですが、この説明書きの中に、 「WWW ブラウザのプロキシを GetHTMLW にすることで、オンラインの閲覧と同じ感覚で 取得された WebPage を閲覧できます。」 と書いてありますが、WWW ブラウザのプロキシはどこにあるのでしょうか。 それをGetHTMLWに変換する方法も教えてください。 また、Mozilla FireFoxのブラウザも準備していますが、IE6でも出来るのでしょうか。 お願いします。

  • プロキシーソフトを使った方が便利な事

    HTTPの場合CGIやJAVAなどを使ったページなど、オートパイロットによっては自分のHDに正確に再現出来ないコンテンツがあります。 しかしそういったコンテンツも、プロキシーソフト(GetHTMLWなど)のキャッシュとして保存し、ローカルサーバーを立ち上げれば再現できる可能性が高いですよね。 同様にHTTP以外で、 「プロキシーソフトのキャッシュとして保存し、ローカルサーバーを使わないと上手く再現できないコンテンツ」 がよくあるプロトコル、およびそのコンテンツを紹介していただけないでしょうか。

  • データ整理法

    現在使用しているPCにデータやソフトを乱雑に保存しており、整理したいと考えています。  ここで、皆様はどのような名のフォルダを作って整理されているのでしょう?  また、同様にファイル名にも規則性を持たせるなど考えております。 良い案、ソフトがあれば御教授願います。  現在考えつくことは家族ごとにフォルダを作り良く使うフォルダから順にフォルダ名を 01、02、・・・ と番をつけること程度です。 ちなみに、私の扱うデータは主に下記の通りです。 ・画像 ・役所等への届出 ・家計・光熱費 ・ホームページ作成資料 ・娯楽関係

  • 階層以下をそのまま保存するには(GetHTMLW)

    「世界一受けたい授業」のサイトをオフラインでも見れるように、保存しようと思って、GetHTMLWで何とかならないかと格闘しています。 http://www.ntv.co.jp/sekaju/ のサイト以下の階層だけ(もっといえば、その下のbacknumberフォルダ以下)だけでいいので、保存したいと思うのですが、設定方法がよく分かりません。 他のドメインやsekajuディレクトリより上へのリンクは保存せずに、できるだけ、サイト作成者がftpでアップする前のような状態で保存できないものでしょうか。 ご教授いただければ幸いです。

  • ファイルの整理について

    ホームページビルダーV8で作ったものをアップしています。 最近サーバーよりファイルの数があまりに多いので写真などはフォルダを作って整理してくださいという連絡がありました。 サイトの設定ダイアログボックスで画像ファイルの保存については専用フォルダを作ると今までに作ったウェブページ、すべてが簡単にそのようなフォルダーに整理されるのでしょうか。 それとも最初から作り直さなければならないのでしょうか。 一番簡単な方法を教えていただきたいと思います。 宜しくお願い致します。

専門家に質問してみよう