• 締切済み

IAに収集されない方法

個人でウェブページを作っているんですが、今話題のインターネットアーカイブで、まさかないだろうと思いつつ自分のアドレスを入れたら出てきたんです。一応METAタグを追加して、ロボット検索を拒否するようにしたんですが、完全に阻止する方法をご存知の方がいましたら、教えていただけませんか?

みんなの回答

  • annie_x
  • ベストアンサー率50% (65/129)
回答No.1

FAQにありました(参考URL)。サーバー上に robot.txt を置く必要があります。これは、サーバーのルートに置く必要があると思うので、「http://○○○/~user/」みたいなアドレスをお持ちであれば、○○○サーバーの管理者に相談する必要があるでしょう。 robot.txt を置いた後、以下のページから削除したいURLを入力すると完全に消えます。 http://www.archive.org/internet/remove.html

参考URL:
http://www.archive.org/exec/faqsidos/about/faqs.html?index=7

関連するQ&A

  • ロボット検索を拒否したい。

    教えて下さい。 ロボット検索を拒否したいと思いましてHPの各ページに <meta name="robots" content="noindex,nofollow"> を入力してロボット検索を拒否しています。 ただしトップページだけはYahooで検索されてしまいます。 最近<meta name="robots" content="noarchive">も追加したのですが、 検索されてしまいます。 何か原因は考えられますでしょうか?

    • ベストアンサー
    • HTML
  • ロボット検索の拒否ができない。

    ホームページをフレームで作成しているのですが、 indexのみが検索にかかるようにしたいと思い、 他のページには下記のタグをいれました。 <HEAD>~</HEAD>に <META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW"> しかしロボット検索に単体ページで引っかかるのです。 なにか違っていますか? ロボット検索の拒否ができない訳は外になにかあるのでしょうか。 教えてください。

  • ロボット検索にかからないようにするには?

    HPを作ろうと思うのですが 個人的なページで、内輪だけで楽しみたいページにしたいと思っています。 ですが、聞くところによると勝手にロボットが検索しに来るとか。 それで、それを避けるには <head>~</head>間に <META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW"> <META NAME="ROBOTS" CONTENT="NOARCHIVE"> というようなタグを入れる方法があるというところまでは分かったのですが このタグは、ページごとに全部入れないといけないのでしょうか?

  • 検索サイトから逃げきりたい!

     こんにちは。ホームページ作成初心者です。 質問があります。 質問1 webページがロボット型の自動検索サイトに ひっかからないようにしたいのですが、 その場合、<META NAME="ROBOTS"~>というタグを入れればいい、という所までは 自力で探し当てたのですが、 このタグを、どこに挿入したらいいのか、どこにも書いてありません。 (このタグを紹介している本ですら、webページですら) どこに入れたらいいのでしょうか? 質問2  DreamWeaverでは、このタグを、自動的に(各ページを作るごとに) 入れる方法があると聞いたのですが、どうやるのでしょうか? 教えてください!!

    • ベストアンサー
    • CSS
  • Googleへの削除依頼について

    リクエストは、Google によるこのページのインデックス登録やアーカイブをブロックする適切な robots.txt ファイルまたはメタ タグを、ウェブマスターが適用していないことが原因で拒否されました。 そのサイトのウェブマスターにお問い合わせいただくか、ウェブページ削除リクエスト ツールから別の削除オプションを選択してください。 このように拒否の詳細がのっていてのですが、わかりやすく説明をどなたかして下さい。 よろしくお願いします。

  • アクセスアップのためのタグ

    検索された場合、METAタグに書かれていることが紹介文として出ますが、例えばトップ(index)以 外のページはMETAタグに書かなくてもいいんでしょうか?indexから入れないページの紹介文を載せ るのもどうかと思うのですが。(かなりまわれば入れます)ロボットではないサーチ会社によるMETAのこ とについて言っています。誰か御存知の方教えて下さい。METAタグはindexにだけ入力するのでしょ うか。よろしくお願いします。

    • ベストアンサー
    • HTML
  • 一部のページ・PDFページをロボット収集より拒否したい

    通常のページであれば、metaタグで拒否できますが、.htaccessなどで収集拒否できないでしょうか? もし出来る場合は、書き方を教えて頂けないでしょうか? 1、収集拒否したいページ、1ページのみの場合。 2、あるフォルダの中にあるページを拒否したい場合 宜しくお願い致します。

    • ベストアンサー
    • HTML
  • ロボット型検索エンジンの検索方法

    ロボット型検索エンジンは、一体どういう仕組みで検索されているのでしょうか? サイトによっては、METAタグを拾っているようですけど、 私はMETAタグは一切入れていません。 それでもアクセス解析を見るとGoogleやYahoo、Infoseekなどなどの検索サイトから とんできている人が結構います。 (各サイトに登録もしていません) また、私は全ページをPHPで作成をし、 MySQLからデータを取って表示するという動的ページにしています。 私の認識では、動的ページは、検索エンジンに引っかからなかったと思うのですけど、 どうやら、ログを見ると、動的ページすら引っかかっているようなのですけど…。 (さすがに引数が必要なページでは引数は拾ってませんが) 単なる素朴な疑問ですので、 詳しい方、お時間のある時にでも教えてください。 又は、詳しいサイトがあったらURLを教えてください。

  • CGIで表示させるページを、

    初心者です、市販ソフトを使用して部品の検索ページを作っています。ロボット型の検索エンジンにCGIで表示させるページをヒットさせることは可能なのでしょうか、TOPページはMETAタグの記入方法がわかったのですが?ちなみに検索結果は変化してしまう可能性があるので無理だと思うのですが、各部品のページは固定のアドレスだと認識しております。宜しくお願いいたします。

    • 締切済み
    • CGI
  • ネット初心者です。

    ネット初心者です。 自分のブログに うっかり個人名を載せてアップしてしまいました。 気がついて、すぐに名前の部分を仮名にしてアップし直したのですが googleでその人の名前で検索すると最初の方にその個人名を載せた最初のブログが出てきてしまって… googleで削除依頼ができることを知り URLを報告したのですが 「リクエストは、Google によるこのページのインデックス登録やアーカイブをブロックする適切な robots.txt ファイルまたはメタ タグを、ウェブマスターが適用していないことが原因で拒否されました。 そのサイトのウェブマスターにお問い合わせいただくか、ウェブページ削除リクエスト ツールから別の削除オプションを選択してください。」 と表示されてしまいました。 ウェブマスター というのは何のことでしょうか。