- 締切済み
robots.txtの確認
- みんなの回答 (1)
- 専門家の回答
みんなの回答
- 777kame777
- ベストアンサー率48% (241/493)
>わたしのサイトのrobots.txtでは、wp-adminの前と後に「/」があるのですが 前の「/」だけを消せばいいのでしょうか? いいえ、そのrobotos.txtは質問者さんの問題には関係なさそうですね。 質問者さんのrobots.txtはwp-admin配下のページをクローリングさせないというものです。多分名前からして管理者関連ページかと思いますが、もしその配下がブログそのものの場合、そのDisallow文全部消してしまいましょう。 そもそもの話ですが、世界中にあるページが自動的インデックスされる分けではありません。インデックスされない場合は色々あるのです。もっともありがちなのが外部からのリンクが無かったり、Googleからペナルティを受けている場合ですね。 以下参考にどうぞ、 https://seopack.jp/seoblog/20160603-not-indexed/
関連するQ&A
- クローラーがrobots.txtを巡回しない
クローラーがrobots.txtを巡回しないため、毎回手動で再送信をしています。 robots.txtの内容はマスターツールで確認してもエラーもなく正常に表示されています。 あとは制限などをしている可能性があるのはhtaccessくらいですが、robots.txtの巡回を妨げるようなものはあるのでしょうか? 何か理由がお分かりの方がいましたらアドバイスをお願いします。
- 締切済み
- ネットワーク
- robots.txtの書き方
同じような質問を見ても良くわからなかったので、質問させていただきます。 HPを制作し、robots.txtを使ってロボット除けをする場合、 -------------- User-agent: * Disallow: / -------------- "--------------"内の文を書く事は分かりましたが、 とあるHTML説明サイトでは -------------- User-agent: * Disallow: / -------------- の様に"Disallow: /"の下を一行空けておかないと効果がないと 書かれていました。 けれどほかのサイトではそのような説明はないし、 『直接このページを保存して~』の様にすでに文を打ってある .txtページをリンクして書いてあったので見てみると、 行を空けていなかったのです。 一体どっちなのでしょうか? それとも空けても空けなくても良いのですか? HTMLファイルではなくtxt.ファイルの内容なので、場所違いかとも思いましたが、 こちらに書かせていただきました。
- ベストアンサー
- HTML
- robotsでロボット巡回拒否のページもきちんと収集してくれるソフト探してます
Webページ巡回ソフト、収集ソフトといわれるものを使ってみたのですがhttp://○○○/robots.txtがあるページのhttp://○○○/index.htmlが読み込めないのです。 どなたかオフライン中でもきちんと読める巡回ソフト教えてください。 robots.txtには User-agent: Hatena Antenna Disallow: User-agent: * Disallow: / と書いてあります。 よろしくお願いします。
- 締切済み
- フリーウェア・フリーソフト
- robots.txtはどこに置くのですか?
自分のブログが検索でなるべくヒットしないように このサイト http://www.free-seo.jp/robots-crawl-yahoo-google-bing/ このサイト http://info.search.yahoo.co.jp/archives/002849.php このサイト http://dokodemo.rankuappu.com/syono5.html を参考にして robots.txtを作成しました。 上のサイトに記載されている http://www.free-seo.jp/image/robotstxt-upload.gif 「作成した robots.txtを最上位階層にアップロードする」 http://blog-imgs-45.fc2.com/x/x/x/xxxteeeeeeeenxxx/WS000002.jpg 「ファイルは、サイトのルートディレクトリに設置してください。」 http://blog-imgs-45.fc2.com/x/x/x/xxxteeeeeeeenxxx/WS000001.jpg 「置き場所」 の意味がよく分かりません。置き方が分かりません。 どこにアップロードするのか分かりません。 取り敢えず サイトの最上位階層(ルートディレクトリ)に robots.txtをドロップして(置いて)みたのですが ブラウザ上で User-agent: * Disallow: / と再生されるだけです。 よくわからないので htmlの<head>と<head/>の間に <head> User-agent: * Disallow: / <head/> と埋め込み http://tamesi.jmin.net/(質問用ホームページ)のようにしてみました。 これでいいのでしょうか。なんだか違うような気がします。 おバカな中学生にわかりやすく説明して欲しいです。 サイトのルートディレクトリに設置してください。 お前ブログなんて誰も検索しないよ。 のようなもともこない回答はしないで欲しいな(´・ω・`)
- ベストアンサー
- ブログ
- robots.txtの書き方
ルートディレクトリから以下のような構造の配置でアップしているサイトがあるのですが、この全ての"zzz"のフォルダ以下をクロールされないようしたいのです。 /a/zzz/ /c/zzz/ /i/zzz/ 今robots.txt内には下記のように書いています。 User-agent: * Disallow: /a/zzz/ Disallow: /c/zzz/ Disallow: /i/zzz/ このように書くしかないのでしょうか。 全て同じフォルダ名なのでできれば一気に指定したいのですが・・・ 方法があればよろしくお願いします!
- ベストアンサー
- HTML
- タグやrobots,txtを入れているのに…!?
趣味性が強いページなので、最初各種検索避けメタタグを入れていました。 ところがyahoo!でひっかかるようになってしまったので、robots.txt(内容は以下) User-agent: * Disallow: / をトップディリクトリに置いた所、検索結果には出てもエラーページ扱いになり、その後検索結果にも出なくなりました。 …が、チェックの為、数週間ぶりに検索してみたら、再び出るようになってしまいました…!エラーページは出ないし、今までなかった「○○人がブックマークしてます」の表示がつくようになっていました。 これは一体何故なんでしょうか。robots.txtも意味がないということでしょうか。それともブックマークに影響があるのか… オンラインブクマが原因とも聞いたことがありますが、真偽がわからないのでその旨サイトに表記してよいか迷ってます。 .htaccessで避ける方法をとった方がいい場合、表記はどうすればよいのでしょうか(初めてなので調べたんですが、色々な書き方があるようでわからなくなってしまいました) ご存知の方、教えていただければありがたいです。
- ベストアンサー
- HTML
- robots.txt
いろいろ調べてみたのですが、自分の知識が乏しいようでよくわからなく困ってしまいこちらで質問させていただきたいと思いますのでよろしくお願い致します。 当サイトのグーグルのウェブマスター ツール で確認してみたところ、 「ウェブ クロール エラー 」のURLにアクセスできませんという項目に28件もエラーがのっていました。トップページをはじめとしてエラーになっていたので心配になりました。「robots.txt にアクセスできません」となっております。 「robots.txt ファイルに対して URL をテスト」というのを試してみたのですが、ディレクトリとして検出されました。ファイルによっては固有の制限がある可能性がありますと表示されました。 以前はこんな表示はでてなかったように思いますし、これはどういうことなのでしょうか? こういう表示がでてきてるということは、エラーのページは無視されてしまうということですか? 今までは<META name="ROBOTS" content="ALL">というタグを埋め込んでましたが、これを使っても意味がないので削除するように教えていただいて実行したのですが、これと関係ありますか? どう対処していったらいいのしょうか? robots.txt というのを作成したことがなく、特に問題はなかったのですが、これは自分で作ってアップするものなのですか? どうごご助言よろしくお願い致します。
- ベストアンサー
- HTML
- 「robots.txt による URL 制限」
所有するHP(Googleでドメインを取得し、Google Appsで管理しています)について、Googleのウェブマスターツールを使用し、クローラのアクセスをしたところ、「サイトをクロールした際に検出されたクロールエラー」として、「robots.txt により URL が制限されています」、という結果が4件現われました。 素人なので、その意味するところもよく理解できていないのですが、ここ数日、HPへの訪問者数が大きく減少していることと関連している気がします。 なお、robots.txt により URL が制限されています、という4件のURLは、いずれも所有するHPのメインのサイトそのものです。 本件はどのように判断すべきなのでしょうか。 Google社に質問を出そうにも、同社は利用者からダイレクトに質問を受けることをしておらず、連絡の取りようがありません。 なお、所有するHPへの最大Traffic Sourceは、米国人サイト利用者一般への閲覧情報提供・閲覧マネジメントサービスを提供する米国会社ですが(URLを調べた結果です)、このURLをGoogleの解析機能でチェックしたところ、「このWebサイトは、有害なプログラムを転送するか、オンライン詐欺に関係していることが確認されています。この画面を閉じてください。」という表示が出てきます。 私のHPが、クローラアクセスのクロールエラーで「robots.txt により URL が制限されています」とされているのも、このことと無関係ではないような気がします(私のHPが有害なサイトとして扱われているのではないかと。なおHPは全て英語のサイトです)。 上記の現象をどう解釈したらいいのか、robots.txt によるURL制限を外すにはどうしたらいいのか、またGoogle社に個別質問を出す方法などについて、どなたかお教えいただけませんでしょうか。 ある特定の日を境にHP閲覧者数の極端な減少が発生しており、非常に困っていますので、どうかよろしくお願いいたします。
- 締切済み
- インターネットビジネス
- robots.txtやCGIを設置したいのですが
二次創作サイトのみ可で、無料のサイトスペース(審査制)をお借りしている者なのですが、1つ相談があります。 そのサーバーからアカウント発行のメールを頂いたときに、 「html/index.html として置かれたファイルが、インデックスページとなります」 「ウェブサイトを公開する場合は、html/以下に置いて下さい」 とありました。 FTPを繋いで見ると、確かに最初から「html」というディレクトリがありましたし、ここの中にindex.htmlを置くと、http://*******.jp/発行したアカウント となりました。 今のところアクセス解析のCGIと、robots.txtを設置しようと思っています。 それで、今まではインフォシークの無料サーバーを使っていたものですから、「cgi-bin」というディレクトリを作り、その中にCGIを入れなければいけませんでしたが、特に何も書かれていない場合、ディレクトリの指定があるかどうかも分かりません。 また、robots.txtは ttp://sp999.oheya.jp/tips/tips/03_robots.htm このサイトによると、 自分のサイトのトップディレクトリにrobots.txtをアップロードする。 とありますが、これは「html/」の中にアップロードしなければいけないのか、その外にアップロードしなければいけないのか分かりません。 なので上記2つを、サーバーの管理人さんにメールで問い合わせてみようと思っているのですが、大丈夫でしょうか。 審査制のところなので、「ある程度のCGI知識が必要」といわれていましたが、私は日記CGIのnicky!くらいしか設置したことありませんし(それでも審査は通ったのですが)、 これくらいでメールするなよ、と管理人さんに叱咤されそうな感じもします。 よろしければ、アドバイスお願いします。
- ベストアンサー
- レンタルサーバ・ASP
お礼
回答ありがとうございました。