• 締切済み

サイト内のページやファイルのURLを全て抽出するようなソフトってありま

サイト内のページやファイルのURLを全て抽出するようなソフトってありますか? 具体的に例をあげると、 http://www.abc.com/というサイトがあるとします。そこで、index.html gazou1.jpg gazou2.jpgという3つのファイルのみアップロードされていたとすると、 http://www.abc.com/index.html http://www.abc.com/gazou1.jpg http://www.abc.com/gazou2.jpg というようにそのURL以降にアップされたファイルのURLをすべて抽出できるようなソフトを探しています。 もしあったら教えてください。

みんなの回答

回答No.2

ご自身でFTP/SCPのアカウントをもつサイトであれば方法はありますが、WEB上で一般公開されたサイト内の公開されていないファイルやデータの確認はセキュリティの観点から不可能かと思われます。 httpd.conf、もしくはhtaccess等のディレクティブで、ディレクトリ内のファイル一覧表示を許可(Options Indexes FollowSymLinks)しているような場合等にはディレクトリパスでの閲覧でリスト表示することは可能ですが、基本的にご要望頂いているような解析は(そのサーバーの権限がない限り)公開されている部分を覗き取得できないと思って頂いて良いと思います。

回答No.1

こちらのソフトなんていかがでしょうか? Website Explorer http://www.umechando.com/webex/

kenken_l0w0l
質問者

お礼

ありがとうございます。 リンクをたどって行ってURLを調べるソフトですよね? しかし、このソフトだと上の例でいうと、index.htmlにgazou1.jpgのリンクが張られていて、gazou2.jpgのリンクが張られていないばあい、index.htmlとgazou1.jpgは抽出できますが、gazou2.jpgは抽出できないことになりますよね。 リンクで繋がっていなくてもアップロードされたファイルを全て抽出するソフトを探しています。 他にいいソフトがあったら教えてください。

関連するQ&A

  • ファイルからjpgファイルのURLを抽出したい

    外部のxmlを読み込んで、その中に記述されているJPGファイルのURLを抽出したいと思います。 読み込みは $line=file("http://xxx.hhhh.abc.com/?xml"); で可能だと思います。 JPGファイル名は、先頭がA~Zの1文字 + 数字の7文字 となっています。 例:P4139135.jpg 抽出したいのは 例:http://xxx.hhhh.abc.com/P4139135.jpgの部分です。 読み込んだファイルをループで回しながら、正規表現で検索するのだと思うのですが、その辺のソースが全くわかりません。

    • ベストアンサー
    • PHP
  • xmlやrdfのurlをphpで抽出できますか?

    xmlやrdfのurlをphpで抽出したいのですが、可能でしょうか? 具体的には下記URLから http://manabekawori.cocolog-nifty.com/ http://manabekawori.cocolog-nifty.com/blog/atom.xml か http://manabekawori.cocolog-nifty.com/blog/index.rdf のどちらかひとつをphpで抽出できればいいのですが、そういうことは可能でしょうか?

    • ベストアンサー
    • PHP
  • ページソースからのURL抽出

    VBでページソースにあるURLを全て抽出したいと考えています。 どのようにすれば良いか教えてください。 サンプルコードがあると助かります。 具体的には、以下の通り。 (1)ウェブページのソースを読み込む (2)読み込んだソースを1行ずつ探索し<a href="****">の****の部分を全て読み込んでいく (3)ExcelのURL欄に順に入力していく (4)URL一覧の出来上がり よろしくお願いします。

  • 画像ファイルの名前をそのままURLにする

    名前が日本語の画像ファイルがあります。 そのファイルをWordPressにアップロードしたとき、 画像ファイルのURLを元の日本語のものにしたいです。 画像ファイルの名前→ああああ-1.jpg ↓WPにアップロード https://www.〇〇.com/wp-content/uploads/ああああ-1.jpg 普通にアップロードすると、 https://www.〇〇.com/wp-content/uploads/25d65154cf8d425c0f19a2.jpg みたいな数字とアルファベットの組み合わせになります。 これを、元の日本語の名前にしたということであります。 これはどのようにすればできますでしょうか? よろしくお願いいたします。

    • ベストアンサー
    • PHP
  • 写真のアップロードについて

    こんにちは、初心者で聞く人なく困っています。 yahooのオークションに出品の際、写真のアップロードができません。ヘルプコーナーに「デスクトップに画像ファイルgazou.jpgを置いた場合、c:\windous\デスクトップ\gazou.jpgのようになります。この場合は、マイコンピューターを開き、c:ドライブにgazou.jpgを置いてアップロードを行ってください。」と載っていました。この方法が具体的にどのようにしたらよいのかわかりません。特にc:ドライブにgazou.jpgを置いて、というところです。いろいろ試してみましたが、やっぱりアップロードができませんので、分かる方、教えてください。

  • サイトの末尾に/m/をつけて携帯サイトを運営する場合のファイルの保存と

    サイトの末尾に/m/をつけて携帯サイトを運営する場合のファイルの保存とアップロード方法を教えてください。 m ファイルの中にもmobile用のindex.htmlがあり、出来上がったmobile用のindex.htmlをアップロードしたら、mobile用ではない普通のページのトップページindex.htmlがmobile用のページに変わってしまいました。m ファイルの保存方法と場所が悪かったと思いますが、何度か試してみても うまくアップロードできません。どのようにm ファイルを保存すれば www.aaa-bbb.com/m/ としてアップできるのでしょうか?

  • 指定したURL下のファイルをすべてダウンロードするソフトありますか?

    ホームページをまるまるダウンロードしたいんですが、いくつかダウンロードのソフトを使ってみたものの、URLが記述されていないファイルや、イベントの結果として呼び出されるようなファイルまで落とすことができません。 URLを指定すると、その下位にあるすべてのファイル (ディレクトリも含む) をダウンロードできるソフトがありましたら、紹介してください。有料のソフトでも構いません。

  • ファイルのurl

    今私はホームページを作っているんですが、BBSはロケットBBSさんのタイプXを使っています。 素材サイト様のところで良いスキンがあったので、それを使用してみると、画像が表示されません。 素材サイト様のスキンをダウンロードしたときに、説明書が入ってあったのですが、 (画像がある場合は画像を全てアップロードし、{CONFIG}~{/CONFIG}内にあるbase_url部分(画像をアップロードしたフォルダのurl)を書き換えて下さい。) と書いてあったのですが、ファイルのURLはどうしたら分かるのでしょうか。前もそうだったんですが、画像のURLもどうしたら分かるのか全く分かりません。インターネットで調べたりもしてきたのですが、やはり分かりませんでした。 どうか教えてください。 無能で申し訳ございません。

  • 動画ファイルから画像を抽出するソフト

    aviなどの動画ファイルから画像を抽出し、 bmp,jpg形式などで保存できるソフトを探しております。 ご存知の方、どうか教えて下さい。

  • id,urlというテーブルにおいて、url中のファイル名が同じものを抜

    id,urlというテーブルにおいて、url中のファイル名が同じものを抜き出したい。 こんなテーブルがあります。 id url 1 http://okwave.jp/test/abc.wav 2 http://okokok.jp/456.jpg 3 http://okokok.jp/abc.wav ......続く urlは必ずファイル名.拡張子で終わっています。 これらのURL中のファイル名.拡張子が同じもの(上のid1とid3などが例です)を抜き出して、 SELECT ファイル名,COUNT(同じだった数) というふうに表示させたいのですが、どのようなSQLを組めばよいでしょうか? PHPでも構いません。 ご教授願います。

    • ベストアンサー
    • MySQL

専門家に質問してみよう