ロボット型サーチエンジンにサーチされたくない

2023/07/20 11:53

このQ&Aのポイント

ロボット型サーチエンジンによる隠しページの探索を防ぐ方法はあるのか
隠しページを探り当てられる可能性があるのか気になる
ロボット型検索エンジンによるサイトへのアクセスを制限する方法はあるのか

ベストアンサー

ロボット型サーチエンジンにサーチされたくない

2000/10/23 10:29

　本来はこういう質問こそ俺の専門分野なので、無茶と知っての質問です。ですんで、無理な場合ははっきり無理と言ってくださいませ。　えとですね。　事情があってうちのホームページに隠しページを作りました。　そのページはパスワードの入力が必要で、そのページに飛ぶとPerlのＣＧＩによるチェックが入ります。で、その中でパスワードが一致するとLocation:ヘッダで飛びますが、クッキーの保存が必要なときだけはメタタグのリフレッシュを使って飛んでいます。　ただし、ＨＴＭＬファイルは、index.htmファイルと同じディレクトリに普通に存在していて、そのページにリンクされているデータも、他の一般公開データと同じディレクトリにＨＴＭＬ形式で存在しています（別途index.htmによってフタをかぶせていますが）。ですんで、これらのファイルにダイレクトジャンプされたらおしまいです。　このような状況下において、ロボット型検索エンジンは、うちの隠しページを探り当てることがありえるのでしょうか？　また、探り当てられてしまうとしたら、それを回避する方法はあるのでしょうか？　ちょっと見には探り当てえないとは思うんですが、友人で一人「ロボットエンジンはキーワードなんか適当にもってくる」と言っていたので。　んーな馬鹿な！？　とは思うんですけどね(笑) 　安心したかったので質問させていただきました。　ま、掲載されてたら苦情を出して消してもらうというのも手でしょうけど、それじゃあちょっと遅いので。

noname#25358

みんなの回答 （1）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

pinky
ベストアンサー率52% (29/55)

2000/10/23 11:01 回答No.1

ロボットに検索されてほしくない場合ですが、一応ふたつの方法で抑制できることになっています。ひとつはrobots.txtを利用する方法。もうひとつは、 <META NAME="ROBOTS" CONTENT="NOINDEX"> を使う方法です。詳しくは以下のページを見てください。

参考URL：: http://www.net-web.ne.jp/ipusiron/source/sec_text_search_engine.htm

質問者

お礼

　こんな便利なものがったんですねぇ。　念のために入れておくことにします。　ありがとうございました。

関連するQ&A

ホームページのロボット制御について
ホームページのロボット制御について疑問があります。 index.html（トップページ）だけはロボットの登録対象にしたいが、その他の全ページはすべて登録対象にしない場合のメタタグについてなんですが、調べたら index.html（トップーページ）には <META NAME="ROBOTS" CONTENT="NOFOLLOW">を記述しこのページを登録対象にし、かつこのページのリンクを辿らないようにする。それ以外のファイルはすべて <META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">と記述すると書いてありました。しかし、そもそもindex.htmlに記述したメタタグによってindex.htmlページ内のリンクを辿らないわけなので、その他のファイルにあえてメタタグを何も書かなくてもその他のファイルはindex.htmlから辿られず、インデックス化されない気がするんですがどうなんでしょうか？ a.htmlやb.htmlなどその他の全ファイルにも <META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">と記述しないといけないんですかね？
- ベストアンサー
- HTML
検索エンジンロボットはPHPタグが見えるのか？
検索エンジンロボットはPHPタグが見えるのか？ googleやMSNなどの検索エンジンロボットは、PHPのタグを読んでプログラムを見ているのでしょうか、それともサーバ側でPHPのプログラムが処理された結果しか見れないのでしょうか？たとえば下記のようなページを用意したとして、 -----------　A.　webページHTML　index.php 鉛筆 ノート <?php include("file.php"); ?> -----------　 -----------　B.　fine.php 秘密のファイル -----------　 -----------　C.　ブラウザで見えるindex.php 鉛筆ノート秘密のファイル -----------　人間がブラウザでアクセスする時も、検索エンジンロボットのキャッシュも、Cのように見えます。検索エンジンロボットが、index.phpのpタグ3行目が外部PHPファイルを読み込んでいると分かっているのかどうか知りたいです。お分かりの方、よろしくお願いいたします。
- ベストアンサー
- ハードウェア・サーバー
ロボット型サーチエンジンの失敗（？）
こんにちは。ちょっとくだらない質問をします。私はどちらかというとディレクトリ型よりロボット型サーチエンジンの方が好きなのですが、これだと自分の意図しないページがいっぱいヒットしますよね。たとえば、アスキー(会社名)と入れてみたら、「ジュニアスキー」のページがたくさん出てきました。一瞬考えてしまいました。また、仕事で「松茸」の資料を探していたとき、なんと男性の体についているほうの松茸（！）のお写真がたくさん載っている（さすがにモザイクでしたけど)サイトを開いてしまったことがあります。たまたま一緒に仕事している主人がナイスタイミングでパソコンを覗き込んで、絶句しておりました。皆様の中で、このように意図しない検索結果について、何か面白いエピソードなどある方がいらっしゃったら、お暇なときにでもご回答いただければと思います。
- ベストアンサー
- その他（インターネット・Webサービス）
ロボット型サーチエンジンへの登録について
質問させて下さい。 googleに登録して欲しい場合、 http://www.google.co.jp/addurl/?hl=ja&continue=/addurl という気休めのサイトがありますが、yahoo、msnのロボット型検索エンジンに登録して欲しい場合、上記のようなサイトはあるのでしょうか。また、yahoo、msnのロボット型検索エンジンも被リンク数が多ければ勝手にクロールされるという認識で間違いないでしょうか。 ※以下のように一括登録サイトがあるのですが、試された方いらっしゃいましたらご感想などを教えて下さい。 (情報が非常に古い感じがしますので・・・) http://ippatsu.net/TARO/ http://www.biwa.ne.jp/~masao-s/submit.htm
- ベストアンサー
- その他（ITシステム運用・管理）
ホームページ（ＩＮＤＥＸ）のフレーム分けをした時のSEO対策（検索ロボットへの影響）について
初めまして。今、ＩＢＭのホームページビルダーでホームページを作っております。ご質問ですが、INDEX.HTMLを4つのフレームに分けております。 (1)INDEX.HTMLは、(2)～(3)フレームの制御 (2)HEADER.HTMは、ヘッドフレーム (3)NAVI.HTMは、ナビゲーションフレームで各ページへのリンクを貼り (4)BODY.HTMは、INDEXのボディフレームで(1)～(4)で一つのページになりますが上記の(1)～(4)の形でSEO対策の検索エンジンの「特に、検索ロボット」の巡回では、うまく反映されないのでしょうか？ご指導の事を、よろしくお願い致します。
- 締切済み
- HTML
サーチエンジンのロボット検索回避
サーチエンジン（CGIのリンク集）を開設しています。事情あって、内容等をYahoo!やGoogleなどの自動ロボット検索に探し当てて欲しくありません。ホームページの作成の際には<meta name="robots" content="noindex,nofollow">タグの挿入をしましたが、CGIの場合の回避方法があったらご教授下さい。一応、CGIセットの中のHTMLファイル内には全て挿入してありますが、それでロボットアクセス回避は可能でしょうか。
- ベストアンサー
- CGI
yahooのロボット検索エンジンについて
　yahooのロボット検索エンジンにホームページを登録したいのですが、どこで登録をすればいいのでしょうか？　それからもし登録するとしたら、ｉｎｄｅｘページだけではなく、他のページもすべて登録しなけば全ページをカバーしてくれないのですか？
- ベストアンサー
- その他（インターネット・Webサービス）
検索エンジンロボットを制御する
マンションの住人以外の閲覧を避けるために、ロボット検索を回避しようと思っています。そのために、http://tech.bayashi.net/pdmemo/robots.htmlを見ていますが、ルートにrobots.txtファイル User-Agent: * Disallow: /cgi-bin/ Disallow: /example.html を置くことが推奨されています。そこで質問です。 (1)上記 example.html の"example"は固定の名前ですか？それともトップページの名前(例：index.html)に置き換えるのですか？ (2)ルートに複数の html ファイルが存在する場合、robots.txt の内容は変えるのですか？ (3)上記(2)で、ルートに .html ファイルと .htm ファイルが混在している場合はどうですか？以上、よろしくお願いします。
- ベストアンサー
- その他（インターネット・Webサービス）
metaタグについてです・・・ロボット検索時において・・・
<meta name="robots" content="index,follow"> このタグを打てばロボット検索が拾ってくれると書いてあったのですが、このindex,followはどういうことなのでしょうか？ indexはそのHTMLファイル名じゃないとダメなのでしょうか？このタグの説明を希望します。よろしくお願いします。 http://www.robot-search.com/search_04.htm
- ベストアンサー
- その他（インターネット・Webサービス）
HPワード検索ロボットへファイル認識のさせ方のご質問
あるHTMLファイルにはコンテンツがたくさんありました。せっかくロボット検索で言葉を拾ってもそれがファイルのどこにあるかを探すのが大変で、ずーっとスクロールさせなければなりませんでした。この不便さを解消しようとそのファイルを単純に前半と後半の二つに分けました。HPの同じフォルダ内での処理ですが、最初にあったファイル名をA.htmとすればそれをA.htmとA2.htmとに分けたのです。結果はA,htmにあるワード検索はOKですが、A2.htmにあるワードは拾わず、ページがみつかりませんと表示されます。その状態はもう2ヶ月になります。そこで試しにパスを全く変えてみました。全部を新しく作った別フォルダに収め、ファイル名もA_new.htmとA2_new.htmという風にしてみました。もうロボットは回って来ていますがどちらのファイルも拾わず、すべてのワードについてページがみつかりません、となります。これらのHTMLファイルをどうすればロボットに認識させる事が出来るでしょうか。よろしくお願いします。
- 締切済み
- HTML