• ベストアンサー

http://abc.com配下のPDFファイルを

http://abc.com配下のPDFファイルを取得したい。 (例)http://abc.com/study/lesson4_aoki.pdf lesson4_aoki.pdfと言うファイル以外にも、 lesson3_***.pdf、lesson2_*****.pdf、lesson1_**.pdf と言ったファイルの存在が予想されるのですが、フルネームが分からないので表示できません。 この様な場合は、googleの機能等を使って、あるディレクトリ以下のファイルを全てダウンロードする事はできないのでしょうか?

質問者が選んだベストアンサー

  • ベストアンサー
  • ORUKA1951
  • ベストアンサー率45% (5062/11036)
回答No.1

firefox + Firefox アドオン - 拡張機能 - ダウンロードツール | Mozilla Japan の公式アドオン紹介サイト ( https://addons.mozilla.jp/firefox/extensions/download_tools/ ) 私は ScrapBook ( https://addons.mozilla.jp/firefox/details/427 )を使ってますが、 DownThemAll! ( https://addons.mozilla.jp/firefox/details/201 )でも良いかも。

全文を見る
すると、全ての回答が全文表示されます。

その他の回答 (1)

  • kmee
  • ベストアンサー率55% (1857/3366)
回答No.2

その例で studyディレクトリの一覧を取って、と考えたのでしょうが、サーバーでそれができるように設定されていなければ無理ですし、そもそも、studyディレクトリ自体が存在しないかもしれません。 ※ サーバーの設定で、CGIのパラメータに変換して処理されている → 実際には abc.com/getpdf.cgi?section=study&lesson=4&name=aoki にアクセスする → getpdf.cgiの中でパラメータを元にデータベースにアクセスして、結果をPDF形式に変換して出力する ということも可能です。実際に似たようなことをしているサイトは沢山あります。 Google等は、他のページやサイトにあるハイパーリンクを辿って情報を収集します。 lesson1_**.pdf等がどこかのページに書かれていれば登録されるかもしれません。 ※ abc.com/study/mokuji.html に一覧表がある、とか。もっとも、これの一覧があるなら「フルネームが分からない」なんてことは無いわけですが。 そうでなければ、存在自体を知る方法がありません。 lessen1_a.pdf ,lessen1_b.pdf ,lessen1_c.pdf ... と総当たりする、というのもありますが、組合せが膨大なために現実的ではありません。連続アクセスで攻撃と見做され、ブロックされるかもしれません。

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • ディレクトリ配下のファイル名を取得するには

    質問があります。 あるディレクトリの配下のファイル名を取得するには どのようにしたらよいのでしょうか? またその場合、どういった形式で取得できるのでしょうか? もうひとつファイルをオープンして一行しかない ファイルの場合だけ編集を行い、 上書きするという処理をご存知のかた いましたら、教えてください。

  • インターネットに掲載されている時にPDFファイル自体

    インターネットに掲載されている時にPDFファイル自体 がHTTPで始まるファイルになっているのを見かけるので 方法を教えて欲しいと質問したところ 基礎的なことで申し訳ないですが、ご存知でしたらゴメンナサイ http://www.hoge.com/ABC/pdf/xyz.pdf は、HTTPプロトコルで、HTTPサーバー(www.hoge.com)に、[/ABC/pdf]にある[xyz.pdf]を送ってくれという意味ですね。 ファイル名は[xyz.pdf] >>PDFファイル自体がHTTPで始まるファイルになっているのを見かけます。  は、違います。 >リンクではなく出来上がっているPDFファイル全面を変換したい  これは、だからおかしい。  リンクでそこを参照しているに過ぎない。 HTTPプロトコルは、セッションごとに接続が切れると考えますから(実際はkeep-aliveで保たれていたとしても) この例で言うと www.hoge.com というHTTPサーバー(以下はサーバーが認識している構成)  /      ルート   |-- ABC/   ABCディレクトリ      |-- DEF/    DEFディレクトリ      |   |-- index.html      |      |-- pdf/   pdfディレクトリ         |-- xyz.pdf という構成だったとして、index.htmlを現在表示している場合、そのソースに <a href="http://www.hoge.com/ABC/pdf/xyz.pdf">カタログ</a> <a href="/ABC/pdf/xyz.pdf">カタログ</a> <a href="../pdf/xyz.pdf">カタログ</a> と書かれていようが、 【ブラウザが】それを解釈して、www.hoge.comのHTTPサーバーに[/ABC/pdf/xyz.pdf]を要求しているに過ぎないのです。  ですから、URL欄には http://www.hoge.com/ABC/pdf/xyz.pdf と表示される。  あまりにも初歩的なことで、違う質問ならゴメンナサイ。 と答えをいただきました。 私なりに実践してみたところ、開くか保存の確認される形になりましたが 私のHPではPDFファイル表示される時は頭にはHTTP://はついていません ちなみにhttp://sky.geocities.jp/kasijyu/の決算広告のボタンなんですが… 私的には、決算広告のボタンをおしたらすぐPDFファイルが出てるように 作りたいのです…私が勉強不足なのと理解不足なのは承知していますが どうぞお知恵お貸しください。

  • FirefoxでPDFファイルをダウンロードする

    Google Chromeで、WebサイトからPDFファイルをダウンロードするのは出来るのですが、 同じWebサイトをFirefoxで開いて、同じPDFファイルをダウンロードしようとしても出来なかったのです。 なぜFirefoxだとダウンロード出来ないのかが分かりませんでした。 どうすればFirefoxでPDFファイルをダウンロードすることが出来るようになるのでしょうか。

  • ダウンロード形式のPDFファイルは検索対象になりますか

    はじめましてご質問させてください。 ファイルのディレクトリを隠してパラメータつきURLにてPDFをリンクしています。 さて、このPDFファイルですがグーグルなどの検索エンジンで検索対象となりうるのかお尋ねしたいと思います。 グーグルはファイルタイプでも検索できると聞いていますのでエンジンが巡回するのではないかと思いますが・・。どなたかご教授くださいませ。

  • フォルダ配下にあるファイル名を取得する方法

    度々すいません。 また別件で困ってしまい質問をあげさせて頂きます。 環境は以下の通りになります。  ・WindowsXP  ・VC++.NET(2002版) フォルダ配下に存在するファイルのファイル名を取得したいのですが なにか良い関数・やり方はあるのでしょうか? お手数ですがご教授願います。 宜しくお願い致します。

  • ttlマクロによるディレクトリ配下の取得

    シェルスクリプトで、apacheのhtmlディレクトリを取得しバックアップを作成しております。 シェルスクリプトは、ユーザshコマンドによる実行です。(cronでは動かしておりません。) 保存先:/home/test/html_backup/配下 保存ファイル名:yyyymmdd.tar.gz(yyyymmddシェルスクリプト実行日となる。) よって、/home/test/html_backup/ディレクトリ配下にある複数のバックアップ全てを、 マクロによるscp転送で取得したいと考えています。 同名ファイルが存在する場合は、常に上書きでかまいません。 サーバに接続後、下記コマンドを実行しようと思いました。 wait '$' scprecv '/home/test/html_backup/*' scprecv '*' 'c:\temp' としましたが、うまくマクロが動きません。 sendlnでファイル転送ができることはわかりましたか、 今回やろうとしていることは、複数のバックアップファイルがあるため 自動でsendlnでは難しいと思っております。 どのようにttlを書けば バックアップファイルを全部取得できるのでしょうか。 ご教授お願いいたします。

  • PDFファイルを勝手に閲覧されないように

    PDFファイルをレンタルサーバーに置いて、その所在アドレスを告知したメンバーだけに閲覧してもらっているのですが、グーグルでindex ofとかの検索に引っかかるとPDFの存在が分かると聞きました。 そのような検索には引っかからないように出来ないのでしょうか?つまりgoogleの検索の対象にならないPDFファイルの置き方ってありますか?アクセス制限とかパスワードをかけるとか以外の方法で、です。 知ってる方教えてください。よろしくお願い致します。

  • すべてのファイルに対してgrepをかける方法を教えてください。

    /(ルート)配下にあるすべてのディレクトリ(サブディレクトリ)配下のファイルに対して、'test'という文字列が入っているかどうかを調べたいと思っています。 サブディレクトリは何階層にもなっており、存在するすべてのファイルに対して検索をかけたいと思っています。 以上のような場合にどのようにgrepを使用すればよいのでしょうか?

  • ファイル全てのある文字列を変更したい

    Redhat7.1Jを使ってます。 あるディレクトリ配下に属するファイル(サブディレクトリの下のファイルも)全てを対象に 「abc」等の文字列を全て「xyz」等に変換しようとしています。 どのような方法がいいかご指導願います。 ファイル総数は10,000個を越えます。 サブディレクトリも数百あります。

  • PHPで、該当ファイルの一つ上のディレクトリ名を取得したいのですが、そ

    PHPで、該当ファイルの一つ上のディレクトリ名を取得したいのですが、そのような関数はございますでしょうか? 例えば、該当のページが 「http://example.com/abc/top.php」 だった場合、 「abc」を文字列として取得したいです。 自分のファイル名を取得する時はbasenameという関数を使う所までは 分かったのですが、一つ上のディレクトリ名を取得する関数を探す事が 出来ませんでした。ご教授頂けると大変助かります。 宜しくお願い致します。

    • ベストアンサー
    • PHP
このQ&Aのポイント
  • EP-774Aプリンターの印刷ができない問題について解説します。
  • EP-774Aプリンターの印刷ができない原因と対処法をご紹介します。
  • EP-774Aプリンターの印刷トラブルの解決方法について解説します。
回答を見る