• ベストアンサー

検索ロボットへの拒否について

サイトを運営中ですが、 例えば、aaa.htmlの中で、iframeでbbb.cgiを入れています。 googleのsite:で検索してみると、aaa.htmlとbbb.cgiが一緒に登録されていますが、aaa.htmlから入ってもらいたくて、bbb.cgiをDisallowでrobots.txtに入れたいですが、そうすると、bbb.cgiをロボットが巡回しなくなり、aaa.htmlの登録にも影響がありますか?aaa.htmlの内容のほとんどがbbb.cgiの内容です。 もし、他に、aaa.htmlだけでbbb.cgiは、サイト登録されない方法がありますか?

質問者が選んだベストアンサー

  • ベストアンサー
  • 4017B
  • ベストアンサー率73% (1304/1775)
回答No.1

Googleの検索に関してのみで言えば、あんまり気にする必要は無いです。 恐らく両方が検索結果に出る事で、本来の入り口ページである aaa.html から入らずに。bbb.cgi の方から直接、アクセスされる事を避けたいと言う事だと思いますが…。 Googleのエンジンは極めて優秀ですので。意図的に aaa.html とは無関係の内容のコンテンツを動的生成して、Userを誘導する様なサイトになっていないのなら。bbb.cgi が一緒に検索エンジンに拾われても問題無いです。と言うか一緒に拾われてないと困るのでは? 逆に、aaa.html のみが拾われて、肝心のコンテンツの中心部分である bbb.cgi が弾かれる様な設定だと。Googleの検索結果のランキングからもどんどん下降していきますし。何より検索で見付けて来てくれたUserに不親切です。心象、悪くなりそうです。 最新のGoogleエンジンだと、ページ内コンテンツはきちんと判別して、親ページの方のリンクに飛ばしてくれるんじゃなかったですかね? まあどうしても心配だったら、bbb.cgi でブラウザの環境情報であるリファラーを取得して、いわゆる直リンだったら aaa.html へ転送する様な仕様するとか?

関連するQ&A

  • robotsでロボット巡回拒否のページもきちんと収集してくれるソフト探してます

    Webページ巡回ソフト、収集ソフトといわれるものを使ってみたのですがhttp://○○○/robots.txtがあるページのhttp://○○○/index.htmlが読み込めないのです。 どなたかオフライン中でもきちんと読める巡回ソフト教えてください。 robots.txtには User-agent: Hatena Antenna Disallow: User-agent: * Disallow: / と書いてあります。 よろしくお願いします。

  • 検索エンジンロボットを制御する

    マンションの住人以外の閲覧を避けるために、ロボット検索を回避しようと思っています。そのために、http://tech.bayashi.net/pdmemo/robots.htmlを見ていますが、ルートにrobots.txtファイル User-Agent: * Disallow: /cgi-bin/ Disallow: /example.html を置くことが推奨されています。そこで質問です。 (1)上記 example.html の"example"は固定の名前ですか?それともトップページの名前(例:index.html)に置き換えるのですか? (2)ルートに複数の html ファイルが存在する場合、robots.txt の内容は変えるのですか? (3)上記(2)で、ルートに .html ファイルと .htm ファイルが混在している場合はどうですか? 以上、よろしくお願いします。

  • これって、動的プログラムになるんでしょうか?検索ロボットの邪魔ですか?

    ホームページをGoogle等、ロボット型の検索サイトが巡回して、検索サイトに登録されていくケースがある。という話を聞いたのですが、この場合、ホームページ内に動的プログラムが挿入されている場合、CGIやJavaの事だと思うのですが(その辺は詳しくないのですが)やはり、ランキング投票用のプログラム等が挿入されているページも動的ページに含まれて、ロボット型検索サイトの巡回の障害になってしまい、ロボットに巡回してもらいたい場合、不利になるのでしょうか? ちなみにランキング登録用のプログラムはこんな感じです。 <a href="http://www.***.jp/***/***.cgi?id=***" target="_blank"> ***</a> たぶん、登録しているサイトのCGIにアクセス?するためのリンクのようなので問題無さそうですが、確信がもてないので、説明頂けるとありがたいです。

    • ベストアンサー
    • CSS
  • robots.txtの確認

    わたしのブログがインデックスされていないようです。 確認してみますと Disallow: /wp-adimin/ となっています。 robots.txtの確認のしかたについて調べたところ、クローラーに巡回させるには Disallow: と「/」を消すとありました。 わたしのサイトのrobots.txtでは、wp-adminの前と後に「/」があるのですが 前の「/」だけを消せばいいのでしょうか?

    • 締切済み
    • SEO
  • 検索エンジンロボットを制御する(その2)

    マンションのホームページを担当しています。マンションの住人にはURLを知らせ、マンションの住人以外からは検索ヒットできないようにしたいのです。 QNo.7138297にて質問し、t_ohtaさんからいただいた回答、 《ルートフォルダにDisallow: /から成るrobots.txtファイルを置く》 を実施し、3週間が経ちましたが効果が得られません。 一度検索ロボットの訪問を受けてしまったサイトは、一旦、サイトを閉じる必要があるのでしょうか? それとも、あと数週間待てば効果が得られるのでしょうか?

  • yahoo!のロボット検索に登録したい

    ヤフーがグーグルのロボット検索を使用しなくなってから、ヤフーからのアクセスが激減しました。それどころか一旦検索結果から削除されてしまっているようです。ディレクトリのほうには申請しても登録されない程度のレベルのサイトなのでそちらはいいのですが、ロボット検索では普通に反映して欲しいのですが、どうやって登録したらいいのでしょうか?ディレクトリのはわかりますが、ロボットの登録法がわかりません。普通に巡回してくるのを待つしかないのですかねぇ?今までグーグルと提携していた時はサイトを更新した際にグーグルで再登録する方法でやっていました。御存知のかたよろしくお願いします。

  • robots.txtの書き方

    同じような質問を見ても良くわからなかったので、質問させていただきます。 HPを制作し、robots.txtを使ってロボット除けをする場合、 -------------- User-agent: * Disallow: / -------------- "--------------"内の文を書く事は分かりましたが、 とあるHTML説明サイトでは -------------- User-agent: * Disallow: / -------------- の様に"Disallow: /"の下を一行空けておかないと効果がないと 書かれていました。 けれどほかのサイトではそのような説明はないし、 『直接このページを保存して~』の様にすでに文を打ってある .txtページをリンクして書いてあったので見てみると、 行を空けていなかったのです。 一体どっちなのでしょうか? それとも空けても空けなくても良いのですか? HTMLファイルではなくtxt.ファイルの内容なので、場所違いかとも思いましたが、 こちらに書かせていただきました。

    • ベストアンサー
    • HTML
  • robot.txtは必要?

    googleウェブマスターツールでサイトマップを登録しましたがrobot.txtは必要でしょうか? またrobot.txtではどんなことができるのでしょうか?

  • サーチエンジンのロボット検索回避

    サーチエンジン(CGIのリンク集)を開設しています。 事情あって、内容等をYahoo!やGoogleなどの自動ロボット検索に探し当てて欲しくありません。 ホームページの作成の際には<meta name="robots" content="noindex,nofollow">タグの挿入をしましたが、CGIの場合の回避方法があったらご教授下さい。 一応、CGIセットの中のHTMLファイル内には全て挿入してありますが、それでロボットアクセス回避は可能でしょうか。

    • ベストアンサー
    • CGI
  • yahooの検索結果に表示されてしまう

    サイトの入口ページに、 <META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW,NOARCHIVE"> 及び robots.txtにて User-agent: * Disallow: / User-agent: ia_archiver Disallow: / User-agent: googlebot Disallow: / User-agent: Slurp Disallow: / と書いたものをアップロードしているのではありますが、何故かずっと、yahooの検索結果にサイトが表示されてしまいます。 htaccess.で来られなくするのでは、検索結果にサイト名が表示されている事は相変わらず変わらないので、×です。 どうにかしてyahooの検索結果から自サイトの名前を削除したく、悩んでおります。 何か良い知恵など御座いましたら、ぜひとも宜しくお願い致します。