ベストアンサー

検索ロボットへの拒否について

2011/04/30 17:07

サイトを運営中ですが、例えば、aaa.htmlの中で、iframeでbbb.cgiを入れています。 googleのsite:で検索してみると、aaa.htmlとbbb.cgiが一緒に登録されていますが、aaa.htmlから入ってもらいたくて、bbb.cgiをDisallowでrobots.txtに入れたいですが、そうすると、bbb.cgiをロボットが巡回しなくなり、aaa.htmlの登録にも影響がありますか？aaa.htmlの内容のほとんどがbbb.cgiの内容です。もし、他に、aaa.htmlだけでbbb.cgiは、サイト登録されない方法がありますか？

supapa
お礼率25% (9/36)

その他([技術者向] コンピューター)
回答数1
ありがとう数0

みんなの回答 （1）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

4017B
ベストアンサー率73% (1304/1775)

2011/04/30 19:08 回答No.1

Googleの検索に関してのみで言えば、あんまり気にする必要は無いです。恐らく両方が検索結果に出る事で、本来の入り口ページである aaa.html から入らずに。bbb.cgi の方から直接、アクセスされる事を避けたいと言う事だと思いますが…。 Googleのエンジンは極めて優秀ですので。意図的に aaa.html とは無関係の内容のコンテンツを動的生成して、Userを誘導する様なサイトになっていないのなら。bbb.cgi が一緒に検索エンジンに拾われても問題無いです。と言うか一緒に拾われてないと困るのでは？逆に、aaa.html のみが拾われて、肝心のコンテンツの中心部分である bbb.cgi が弾かれる様な設定だと。Googleの検索結果のランキングからもどんどん下降していきますし。何より検索で見付けて来てくれたUserに不親切です。心象、悪くなりそうです。最新のGoogleエンジンだと、ページ内コンテンツはきちんと判別して、親ページの方のリンクに飛ばしてくれるんじゃなかったですかね？まあどうしても心配だったら、bbb.cgi でブラウザの環境情報であるリファラーを取得して、いわゆる直リンだったら aaa.html へ転送する様な仕様するとか？

関連するQ&A

robotsでロボット巡回拒否のページもきちんと収集してくれるソフト探してます
Webページ巡回ソフト、収集ソフトといわれるものを使ってみたのですがhttp://○○○/robots.txtがあるページのhttp://○○○/index.htmlが読み込めないのです。どなたかオフライン中でもきちんと読める巡回ソフト教えてください。 robots.txtには User-agent: Hatena Antenna Disallow: User-agent: * Disallow: / と書いてあります。よろしくお願いします。
- 締切済み
- フリーウェア・フリーソフト
検索エンジンロボットを制御する
マンションの住人以外の閲覧を避けるために、ロボット検索を回避しようと思っています。そのために、http://tech.bayashi.net/pdmemo/robots.htmlを見ていますが、ルートにrobots.txtファイル User-Agent: * Disallow: /cgi-bin/ Disallow: /example.html を置くことが推奨されています。そこで質問です。 (1)上記 example.html の"example"は固定の名前ですか？それともトップページの名前(例：index.html)に置き換えるのですか？ (2)ルートに複数の html ファイルが存在する場合、robots.txt の内容は変えるのですか？ (3)上記(2)で、ルートに .html ファイルと .htm ファイルが混在している場合はどうですか？以上、よろしくお願いします。
- ベストアンサー
- その他（インターネット・Webサービス）
これって、動的プログラムになるんでしょうか？検索ロボットの邪魔ですか？
ホームページをＧｏｏｇｌｅ等、ロボット型の検索サイトが巡回して、検索サイトに登録されていくケースがある。という話を聞いたのですが、この場合、ホームページ内に動的プログラムが挿入されている場合、ＣＧＩやＪａｖａの事だと思うのですが（その辺は詳しくないのですが）やはり、ランキング投票用のプログラム等が挿入されているページも動的ページに含まれて、ロボット型検索サイトの巡回の障害になってしまい、ロボットに巡回してもらいたい場合、不利になるのでしょうか？ちなみにランキング登録用のプログラムはこんな感じです。 <a href="http://www.＊＊＊.jp/＊＊＊/＊＊＊.cgi?id=＊＊＊" target="_blank"> ＊＊＊</a> たぶん、登録しているサイトのＣＧＩにアクセス？するためのリンクのようなので問題無さそうですが、確信がもてないので、説明頂けるとありがたいです。
- ベストアンサー
- CSS
robots.txtの確認
わたしのブログがインデックスされていないようです。確認してみますと Disallow: /wp-adimin/ となっています。 robots.txtの確認のしかたについて調べたところ、クローラーに巡回させるには Disallow: と「/」を消すとありました。わたしのサイトのrobots.txtでは、wp-adminの前と後に「/」があるのですが前の「/」だけを消せばいいのでしょうか？
- 締切済み
- SEO
検索エンジンロボットを制御する（その２）
マンションのホームページを担当しています。マンションの住人にはＵＲＬを知らせ、マンションの住人以外からは検索ヒットできないようにしたいのです。 QNo.7138297にて質問し、t_ohtaさんからいただいた回答、《ルートフォルダにDisallow: /から成るrobots.txtファイルを置く》を実施し、３週間が経ちましたが効果が得られません。一度検索ロボットの訪問を受けてしまったサイトは、一旦、サイトを閉じる必要があるのでしょうか？それとも、あと数週間待てば効果が得られるのでしょうか？
- ベストアンサー
- その他（インターネット・Webサービス）
yahoo!のロボット検索に登録したい
ヤフーがグーグルのロボット検索を使用しなくなってから、ヤフーからのアクセスが激減しました。それどころか一旦検索結果から削除されてしまっているようです。ディレクトリのほうには申請しても登録されない程度のレベルのサイトなのでそちらはいいのですが、ロボット検索では普通に反映して欲しいのですが、どうやって登録したらいいのでしょうか？ディレクトリのはわかりますが、ロボットの登録法がわかりません。普通に巡回してくるのを待つしかないのですかねぇ？今までグーグルと提携していた時はサイトを更新した際にグーグルで再登録する方法でやっていました。御存知のかたよろしくお願いします。
- ベストアンサー
- その他（インターネット・Webサービス）
robots.txtの書き方
同じような質問を見ても良くわからなかったので、質問させていただきます。 HPを制作し、robots.txtを使ってロボット除けをする場合、 -------------- User-agent: * Disallow: / -------------- "--------------"内の文を書く事は分かりましたが、とあるHTML説明サイトでは -------------- User-agent: * Disallow: / -------------- の様に"Disallow: /"の下を一行空けておかないと効果がないと書かれていました。けれどほかのサイトではそのような説明はないし、『直接このページを保存して～』の様にすでに文を打ってある .txtページをリンクして書いてあったので見てみると、行を空けていなかったのです。一体どっちなのでしょうか？それとも空けても空けなくても良いのですか？ HTMLファイルではなくtxt.ファイルの内容なので、場所違いかとも思いましたが、こちらに書かせていただきました。
- ベストアンサー
- HTML
robot.txtは必要？
googleウェブマスターツールでサイトマップを登録しましたがrobot.txtは必要でしょうか？またrobot.txtではどんなことができるのでしょうか？
- 締切済み
- レンタルサーバ・ASP
サーチエンジンのロボット検索回避
サーチエンジン（CGIのリンク集）を開設しています。事情あって、内容等をYahoo!やGoogleなどの自動ロボット検索に探し当てて欲しくありません。ホームページの作成の際には<meta name="robots" content="noindex,nofollow">タグの挿入をしましたが、CGIの場合の回避方法があったらご教授下さい。一応、CGIセットの中のHTMLファイル内には全て挿入してありますが、それでロボットアクセス回避は可能でしょうか。
- ベストアンサー
- CGI
yahooの検索結果に表示されてしまう
サイトの入口ページに、 <META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW,NOARCHIVE"> 及び robots.txtにて User-agent: * Disallow: / User-agent: ia_archiver Disallow: / User-agent: googlebot Disallow: / User-agent: Slurp Disallow: / と書いたものをアップロードしているのではありますが、何故かずっと、yahooの検索結果にサイトが表示されてしまいます。 htaccess.で来られなくするのでは、検索結果にサイト名が表示されている事は相変わらず変わらないので、×です。どうにかしてyahooの検索結果から自サイトの名前を削除したく、悩んでおります。何か良い知恵など御座いましたら、ぜひとも宜しくお願い致します。
- 締切済み
- その他（インターネット・Webサービス）

検索ロボットへの拒否について

質問者が選んだベストアンサー

関連するQ&A

注目のQ&A

カテゴリ
一覧

専門家に質問してみよう
専門家登録

あなたにピッタリな商品が見つかる！ OKWAVEセレクト

検索ロボットへの拒否について

質問者が選んだベストアンサー

関連するQ&A

注目のQ&A

カテゴリ 一覧

専門家に質問してみよう 専門家登録

あなたにピッタリな商品が見つかる！ OKWAVEセレクト

カテゴリ
一覧

専門家に質問してみよう
専門家登録