• ベストアンサー
  • 困ってます

サーバ内のファイルがリンクされているページを検索

ホームページの管理を引き継いだ者です。 ホームページサーバ内にアップ日が古いPDFファイルがあります。 リンクされているページ自体が削除されている可能性が高いので、もしどこのページにもリンクされていないならサーバから削除したいと思っています。 サーバ上のリンクされているHTMLファイルの有無を検索する方法はありますか? ※HTMLファイルは、サーバ上にしかありません。 ※PDFファイル名で検索をかけたらPDFファイルそのものがヒットしてしまい、かつリンクされているページがあるファイルも同様の結果でした。

共感・応援の気持ちを伝えよう!

  • 回答数2
  • 閲覧数264
  • ありがとう数2

質問者が選んだベストアンサー

  • ベストアンサー
  • 回答No.2

>ページ更新の際は該当HTMLファイルをローカルに落とし、テキストエディタで手打ちで書き換え、再アップするという手段で更新しています。  なら、FTPソフトがあるのでしょうから、すべてダウンロードしてくれば良いです。CMSなど動的に作成するものがないのでしたら、ダウンロードしてから、grepなりで。  Windows用のgrepもあります。  まあ、テキストエディタで検索機能を持つものもあります。たとえばEmEditor--これでフォルダー内を検索で該当するファイルにリンクしているファイルをすべて拾い出してしまえば良いです。文書内に、href="[^"]*abcdefg.pdf" を正規表現で探す。    

共感・感謝の気持ちを伝えよう!

質問者からのお礼

大変お礼が遅くなり、申し訳ございません。 仰る方法で地道に探していこうと思います。 ありがとうございました。

その他の回答 (1)

  • 回答No.1
  • t_ohta
  • ベストアンサー率38% (4115/10591)

HTMLファイル一式にgrepをかけて、そのPDFファイルのファイル名が記載されているHTMLファイルが無いか探す。 あとは、ホームページアクセスログから、そのPDFファイルへのアクセスの有無を調査。 PDFファイルへのアクセスが見つかれば、どこかからリンクされている可能性あり。 ログにリファラーが出力されていれば参照元が判明します。

共感・感謝の気持ちを伝えよう!

質問者からのお礼

ご回答ありがとうございます。 >HTMLファイル一式にgrepをかけて、そのPDFファイルのファイル名が記載されているHTMLファイルが無いか探す。 全てをDLしてローカルで検索するということでしょうか? すみません…その「一式」がサーバ上にしかない状態です。 また現在ブラックボックス状態のエリアもあり、どこまでDLすれば「一式」になるのかも不明です。 任意サーバ内と言いますか任意ドメイン以下のHTMLファイル全てを検索するのは難しいでしょうか? >あとは、ホームページアクセスログから、そのPDFファイルへのアクセスの有無を調査。 こちらもすみません、ログは取得していません。 ログの取得は行なったことがないのですが、特定のソフトがなくても可能でしょうか? (借りているサーバの会社に確認したところ、コントロールパネルからアクセスログをDLできるが、最短で2~3日、最長でも3~4週間分しか取得できないとのことでした) ※ページ更新の際は該当HTMLファイルをローカルに落とし、テキストエディタで手打ちで書き換え、再アップするという手段で更新しています。  ちなみに、前担当者とは連絡が取れない状態です。資料もとくにありません。

関連するQ&A

  • サーバー内のファイルを検索・削除する方法は?

    HPの管理をしていて、 以下のような壁にぶち当たってしまいました。 何かご存知の方おられればヨロシクお願いしますm(_ _)m <現状> ・レンタルサーバーを利用したwebサイトの管理人を勤めています ・サーバーにアップされている全ての.htmlファイルを削除したいです ・htmlファイルは20~30個くらいのディレクトリ内に、  合計で1300個ほどあり、一つずつ消していくのはとても面倒です。  ・サーバー側にあるファイルを一旦全て削除してアップしなおす方法は  可能な限り避けたいです  (アップにものすごい時間がかかり、サーバーに負荷がかかるため) ・FFFTPなどにはそもそも.htmlファイルを検索して表示する機能が  無いっぽいです。 ・Explorerを利用してftp接続を試みると  Ctrl+Fで検索すれば.htmlファイルのみを表示できますが、  どうやらこれらのファイルは一つずつしか削除できないようです。 ・コマンドプロンプトのftpを利用して mdelete *.html とすると  今いるディレクトリ内の.htmlファイルは全て削除できるんですが、  サブディレクトリ内の.htmlファイルは削除できません。  DOSコマンド風にmdelete /s *.htmlとしても同様です。 <質問> ・ftpサーバー内の.htmlファイルを検索・削除する方法ってありませんか?

  • 検索にひっかからないようにするには?

    もう4・5年ぐらい前になるんですが、ホームページを作って、最近検索(MSN)にかけたらヒットしてしまいました。 もうずいぶん前に作ったものだったんで自分でも存在を忘れてしまっていて、その時ページを削除しました。 そして今また検索してみたらまだ存在していました。ページそのものは削除したので当然「ページが見つかりません」と出るのですが、検索結果が出るページではちゃんとタイトルや紹介文が出てしまって・・・ ページ自体がインターネット上からなくなって、検索しても出てこなくなるというのは無理なのでしょうか? ご存知の方、どうか教えてください。 昔のホームページでして、作った自分自身、ちょっと恥ずかしいんです・・ι

  • あるページだけを検索されないようにするには?

    自分のホームページがあるのですが、会員向けにあるページを作ろうと思っています。CGIのアクセス制限も考えたのですが、もっと簡単にURLを会員に教えてアクセスしてもらおうかと考えております。この場合、同じサーバーにアップし丸秘ページにリンクがないとたら、検索エンジンにひっかかるでしょうか?また、このページを検索されないようにするにはどうしたらいいか教えてくさい?

  • サーバーでは問題なく見れるのですが、自分のパソコンではリンクが効かないページがでてしまいます

    自分が作ったホームページデータをサーバーにアップするとすべてのリンクが正常に見れますが、自分のパソコンのそのページデータをクリックして見ると、そのページの中にあるリンク部分のうち、リンクが効ないものがあります。 (正常に見れるページもあります。) 何かサーバーとローカル(自分のパソコン)でブラウザは違う動きをするのでしょうか。 なお、ホームページビルダーのプレビューで見ると、すべて、正常に表示されます。

  • ページの削除と検索結果

    会社HPの人物紹介ページを2ヶ月程前にサーバーから削除しました。 しかし、今だに人物名で検索すると1ページ目に表示されます リンクをクリックするとページ自体はありませんので「Not Found」となります 検索結果のページから消す方法は有るのでしょうか? よろしくお願いします

    • ベストアンサー
    • SEO
  • 検索の不具合とサーバーの移行

    現在、パソコンをサーバーがわりにホームページを管理しています。サーバー自体は2000年頃から使っているのですが、今年に入ってからエラーが少しずつ出てくるようになりました。特に困っているのは、ホームページにある検索ページが全く使い物にならない時間帯があります。とりあえずサーバーを再起動させれば、使えることには使えるのですが、次の日の午前になると検索がまたできなくなって、それで再起動して・・・というくり返しをやっています。 今は運良くサーバーも不具合が無い状態なのですが、そろそろサーバーを移行することも検討しています。とりあえずページ自体には支障は無いのですが、上でも書いたように検索ページのみ不具合が出て使えないときがあります。検索ページのプログラムやファイルだけを調べて直す方法があれば、それが一番てっとりばやいです。いちおう、自分の知っている業者さんに頼んで直してもらおうと思ったら、「サーバーを新しくした方がいい」の一点張りでサーバー内部のエラーだけを直すことは難しいという回答しかもらえませんでした。 話がややこしくなったので、質問内容を要約すると 1. サーバーを移行しなくても、検索ページのエラーを完全に直す方法があるのでしょうか? 2. サーバーを移行しなくてもハードディスクを増設したり、新しくメモリーを増やしたり、拡張したりすればエラーを回避できるのでしょうか?

  • ページ内のみの検索窓(?)

    ホームページ上から指定のファイルをダウンロードすることが出来るようにページを作ろうかと思っています。イメージとしては、商品のマニュアルダウンロードと言えばわかりやすいでしょうか。 商品名をクリックすると指定のpdfファイルがDL出来るようにする物です。 ただ、ファイルが1000個程度になりそうなので指定のファイルをすぐ探し出すのは困難です。 そこで、そのページ上だけを検索してヒットした場所に移動するようにするにはどうしたら良いでしょうか? いわゆるブラウザの「検索」機能ですが、出来るだけわかりやすいようにページ上での入力で表現したいと思います。 ------------------------ □□□□□□□□ [検索] 商品名1 [Download] 商品名2 [Download] 商品名3 [Download] ~~ ------------------------- こんな感じです。 何か良い方法はありませんか? お願いします。

    • ベストアンサー
    • HTML
  • ホームページをサーバーにアップするとソースが変わる

    ホームページの一箇所におかしなことが起こるようになりました。 ローカルでのファイルをサーバにアップすると一部分削除されてしまいます。 <a href="get/banner.htm">広告でお小遣い</a> という部分です。 アップしたページではリンクがなくなってしまいます。他のサーバなどで試しましたが同じ結果になります。 ローカルでは正しく表示されるのに、サーバにアップすると上の部分がなくなるのでリンクなく空白になります。どなたか教えてください。 ちなみにホームページは3つくらい持っていてそれなりに知識はあるほうです。

  • リンクされてないページを見る事は可能ですか?

    先ほどE-Mailの件で「大きめ画像をサーバにアップしなくて添付で送ったらメーラーが壊れると怒られた!」という件で質問させていただきました。別件の疑問がありますので新たに質問させていただく事にしました。 http://www.okweb.ne.jp/kotaeru_vote.php3?q=567089 どうもよくよく彼女の言い分を読んでみると「画像の大きさうんぬん」ではなく「サーバにアップしなかった事」を怒ってたようなんです。 でも送った画像は第3者には見られたくない写真(変な写真ではないですよ~!)だったので、何となくサーバに上げてしまうとそれは世界中に繋がってるわけですから、どこかで見られる事が可能なのでは・・・?と言う不安がありました。 その画像には当然どこからもリンクを張ってない状態になるのですが、そういった画像(またはページ)は絶対に第3者に見られる可能性は無い物でしょうか?画像なので検索などで引っかかる事は無いと思いますが・・・。 サーバには見られても良い物だけを上げたいと思うのですが実際のところどうなんでしょう?

  • LANでHTMLページにPDFをリンクしたのですが...

    LANを立ち上げるのに奮闘しています。 基本的にHTMLでページを作っているのですが、PDFファイルもリンクさせています。 しかし、ネットワーク上でHTMLファイルを保存している、サーバ用PC以外のPCで PDFファイルへリンクするとPDFのアプリケーションは立ち上がるものの、その後表示されるのは白いページになってしまいます。 何が原因なのか、思い当たることは調べてみたのですが、解明されておりません 原因と解決法をお教えください。お願いいたします。