• 締切済み

「robots.txt による URL 制限」

所有するHP(Googleでドメインを取得し、Google Appsで管理しています)について、Googleのウェブマスターツールを使用し、クローラのアクセスをしたところ、「サイトをクロールした際に検出されたクロールエラー」として、「robots.txt により URL が制限されています」、という結果が4件現われました。 素人なので、その意味するところもよく理解できていないのですが、ここ数日、HPへの訪問者数が大きく減少していることと関連している気がします。 なお、robots.txt により URL が制限されています、という4件のURLは、いずれも所有するHPのメインのサイトそのものです。 本件はどのように判断すべきなのでしょうか。 Google社に質問を出そうにも、同社は利用者からダイレクトに質問を受けることをしておらず、連絡の取りようがありません。 なお、所有するHPへの最大Traffic Sourceは、米国人サイト利用者一般への閲覧情報提供・閲覧マネジメントサービスを提供する米国会社ですが(URLを調べた結果です)、このURLをGoogleの解析機能でチェックしたところ、「このWebサイトは、有害なプログラムを転送するか、オンライン詐欺に関係していることが確認されています。この画面を閉じてください。」という表示が出てきます。 私のHPが、クローラアクセスのクロールエラーで「robots.txt により URL が制限されています」とされているのも、このことと無関係ではないような気がします(私のHPが有害なサイトとして扱われているのではないかと。なおHPは全て英語のサイトです)。 上記の現象をどう解釈したらいいのか、robots.txt によるURL制限を外すにはどうしたらいいのか、またGoogle社に個別質問を出す方法などについて、どなたかお教えいただけませんでしょうか。 ある特定の日を境にHP閲覧者数の極端な減少が発生しており、非常に困っていますので、どうかよろしくお願いいたします。

  • uwx
  • お礼率80% (4/5)

みんなの回答

  • naokita
  • ベストアンサー率57% (1008/1745)
回答No.1

文章の通りなら、自分で設置したrobots.txtで、 Disallow: / してるって事です。 解除するとクロール制限が無くなります。 後半部分の有害サイト云々の事は何の事かわかりません。 Googleへの個別質問は一切受付していません。 ウェブマスター ヘルプ/フォーラムにて、 たまーに社員さんが回答をくれる程度です。 http://www.google.com/support/forum/p/webmasters?hl=ja 実際のサイトURLを提示して、予測とか無しに詳細に説明しましょう。 または、 素人とか、急ぎなら制作会社やコンサルなどに有料でご相談を。

uwx
質問者

お礼

ありがとうございます。 私自身はプログラムの知識はないのでクロール制限などできませんので、なぜそのような結果になっているのか不思議です。 Googleの無料ブログを利用しているので制作会社はありませんが、誰か専門家に相談してみようと思います。 なお「有害サイト」云々は、私のブログのtraffic sourceの最大者(いつの間にか他を圧倒しての最大者になっていたようです)が、そのURLを叩くとなぜか有害サイトに指定されています(このサイトも元は有害サイト扱いではなかったようですが)。 ご回答、たいへんありがとうございました。

関連するQ&A

  • robots.txt

    いろいろ調べてみたのですが、自分の知識が乏しいようでよくわからなく困ってしまいこちらで質問させていただきたいと思いますのでよろしくお願い致します。 当サイトのグーグルのウェブマスター ツール で確認してみたところ、 「ウェブ クロール エラー 」のURLにアクセスできませんという項目に28件もエラーがのっていました。トップページをはじめとしてエラーになっていたので心配になりました。「robots.txt にアクセスできません」となっております。 「robots.txt ファイルに対して URL をテスト」というのを試してみたのですが、ディレクトリとして検出されました。ファイルによっては固有の制限がある可能性がありますと表示されました。 以前はこんな表示はでてなかったように思いますし、これはどういうことなのでしょうか? こういう表示がでてきてるということは、エラーのページは無視されてしまうということですか? 今までは<META name="ROBOTS" content="ALL">というタグを埋め込んでましたが、これを使っても意味がないので削除するように教えていただいて実行したのですが、これと関係ありますか? どう対処していったらいいのしょうか? robots.txt というのを作成したことがなく、特に問題はなかったのですが、これは自分で作ってアップするものなのですか? どうごご助言よろしくお願い致します。

    • ベストアンサー
    • HTML
  • robots.txtについてお尋ねします。

    googleの検索へHPを登録させたいのですが、robots.txt解析結果というのが表示さらrobots.txt無効 と出ました。 これは、どういう事なのでしょうか あまりこう言ったものには詳しくないので困っています。 http://www.google.com/support/webmasters/bin/answer.py?answer=35220&hl=ja 上記URLのヘルプ検索から「robots.txt無効」をキワード入力したのですが、難しくて意味がよくわかりません。 何方かご存知の方が居ましたら教えて頂きたいのですが 宜しくお願いします。

  • クローラーがrobots.txtを巡回しない

    クローラーがrobots.txtを巡回しないため、毎回手動で再送信をしています。 robots.txtの内容はマスターツールで確認してもエラーもなく正常に表示されています。 あとは制限などをしている可能性があるのはhtaccessくらいですが、robots.txtの巡回を妨げるようなものはあるのでしょうか? 何か理由がお分かりの方がいましたらアドバイスをお願いします。

  • robots.txtの確認

    わたしのブログがインデックスされていないようです。 確認してみますと Disallow: /wp-adimin/ となっています。 robots.txtの確認のしかたについて調べたところ、クローラーに巡回させるには Disallow: と「/」を消すとありました。 わたしのサイトのrobots.txtでは、wp-adminの前と後に「/」があるのですが 前の「/」だけを消せばいいのでしょうか?

    • 締切済み
    • SEO
  • robots.txtの置き場所について

    ウェブマスターツールを使い始めた初心者です。 私のウェブサイトはプロバイダがサービスでくれたもので、URLが www.プロバイダのサーバ.ne.jp/~ユーザーのID となっています。 robots.txtを置きたいのですが、 ウェブマスターツールで私がrobots.txtを置くURLは、 http://www.プロバイダのサーバ.ne.jp/robots.txt となっています。。 私のユーザーのIDのついてないURLにはアップロードできないと思うのですが・・・ どうしたらいいのでしょうか? FFFTPでpublic_htmlの下にアップロードしたところ、やっぱり認識されずずっと404(見つかりませんでした)と言われてます。。。

  • robots.txt によりアクセスが制限されています

    ウェブマスターツールの robots.txt によりアクセスが制限されていますのところに11個入ってしまって殆ど検索に皮下からなくなってしまいました。。 これを解除する方法とかはあるでしょうか? ちなみにアダルト系のブログです。

  • robots.txtの書き方

    同じような質問を見ても良くわからなかったので、質問させていただきます。 HPを制作し、robots.txtを使ってロボット除けをする場合、 -------------- User-agent: * Disallow: / -------------- "--------------"内の文を書く事は分かりましたが、 とあるHTML説明サイトでは -------------- User-agent: * Disallow: / -------------- の様に"Disallow: /"の下を一行空けておかないと効果がないと 書かれていました。 けれどほかのサイトではそのような説明はないし、 『直接このページを保存して~』の様にすでに文を打ってある .txtページをリンクして書いてあったので見てみると、 行を空けていなかったのです。 一体どっちなのでしょうか? それとも空けても空けなくても良いのですか? HTMLファイルではなくtxt.ファイルの内容なので、場所違いかとも思いましたが、 こちらに書かせていただきました。

    • ベストアンサー
    • HTML
  • robots.txtはどこに置くのですか?

    自分のブログが検索でなるべくヒットしないように このサイト http://www.free-seo.jp/robots-crawl-yahoo-google-bing/ このサイト http://info.search.yahoo.co.jp/archives/002849.php このサイト http://dokodemo.rankuappu.com/syono5.html を参考にして robots.txtを作成しました。 上のサイトに記載されている http://www.free-seo.jp/image/robotstxt-upload.gif 「作成した robots.txtを最上位階層にアップロードする」 http://blog-imgs-45.fc2.com/x/x/x/xxxteeeeeeeenxxx/WS000002.jpg 「ファイルは、サイトのルートディレクトリに設置してください。」 http://blog-imgs-45.fc2.com/x/x/x/xxxteeeeeeeenxxx/WS000001.jpg 「置き場所」 の意味がよく分かりません。置き方が分かりません。 どこにアップロードするのか分かりません。 取り敢えず サイトの最上位階層(ルートディレクトリ)に robots.txtをドロップして(置いて)みたのですが ブラウザ上で User-agent: * Disallow: / と再生されるだけです。 よくわからないので htmlの<head>と<head/>の間に <head> User-agent: * Disallow: / <head/> と埋め込み http://tamesi.jmin.net/(質問用ホームページ)のようにしてみました。 これでいいのでしょうか。なんだか違うような気がします。 おバカな中学生にわかりやすく説明して欲しいです。 サイトのルートディレクトリに設置してください。 お前ブログなんて誰も検索しないよ。 のようなもともこない回答はしないで欲しいな(´・ω・`)

  • robots.txtの書き方

    ルートディレクトリから以下のような構造の配置でアップしているサイトがあるのですが、この全ての"zzz"のフォルダ以下をクロールされないようしたいのです。 /a/zzz/ /c/zzz/ /i/zzz/ 今robots.txt内には下記のように書いています。 User-agent: * Disallow: /a/zzz/ Disallow: /c/zzz/ Disallow: /i/zzz/ このように書くしかないのでしょうか。 全て同じフォルダ名なのでできれば一気に指定したいのですが・・・ 方法があればよろしくお願いします!

    • ベストアンサー
    • HTML
  • robots.txt を設定後、携帯サイトがgoogleで表示されなく

    robots.txt を設定後、携帯サイトがgoogleで表示されなくなってしまいました ■「PCコンテンツ」はgoogleにクロールさせたい User-agent: * Allow: / ■「モバイルコンテンツ」はGooglebot-Mobileにクロールさせたい User-agent: Googlebot-Mobile Allow: /mobile Allow: / ■「モバイルコンテンツ」はgoogleにクロールさせたくない User-agent: Googlebot Disallow: /mobile Allow: / つもりで記述したところ モバイルがgoogleで表示されなくなってしまいました 間違っていますか? よろしくお願いいたします

専門家に質問してみよう