• ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:robots.txtの置き場所について)

robots.txtの置き場所について

このQ&Aのポイント
  • プロバイダが提供するウェブサイトでrobots.txtを配置する方法についての質問です。
  • ウェブマスターツールでのrobots.txtのURLの指定方法について、初心者が悩んでいます。
  • ユーザーのIDが含まれないURLにはrobots.txtをアップロードできないのか疑問です。

質問者が選んだベストアンサー

  • ベストアンサー
  • dscripty
  • ベストアンサー率51% (166/325)
回答No.2

robots.txt は、ドメインごとのサイト設定のためのファイルだから、 http://www.プロバイダのサーバ.ne.jp/robots.txt じゃないと意味がないよ。 つまり、できないということ。 検索エンジンの動きを制御する方法とツール http://web-tan.forum.impressrd.jp/e/2009/01/29/4863 ---- 引用はじめ ---- robots.txtファイル(ロボット排除プロトコルの一種)は、 Webサイトのルートディレクトリ(例:サイトが 「www.google.com」ならば「http://www.google.com/ robots.txt」でアクセスできる場所)に保存しておかなけれ ばならない。 ---- 引用おわり ---- じゃあ、どうすればいいかだけど、HTTP ヘッダか、html のなかで meta タグを使えばいいよ。 詳しく解説しているページがあるから紹介するね。 ロボット排除プロトコル(REP)と は?――メタタグやrobots.txtの基礎 http://web-tan.forum.impressrd.jp/e/2008/02/27/2710

noname#142899
質問者

お礼

メタタグしかないのですね・・・>_< ありがとうございました。

全文を見る
すると、全ての回答が全文表示されます。

その他の回答 (2)

  • naokita
  • ベストアンサー率57% (1008/1745)
回答No.3

置けませんよ。 ルートディレクトリ限定ですから・・・ Googlebotは、サイトを見る前にrobots.txtを見ますから、 サイト最上位の入り口に置かないと意味が無いんです。 例えば、建物の場合、 「立ち入り禁止」の看板は、敷地の入り口付近に誰もが目に付く所にありますよね? サブディレクトリ型のサイトの入り口は、 プロバイダのサーバ.ne.jp/が入り口で、 ここがルートディレクトリなので、一般ユーザーには権限が無い。 robots.txtで何かの指示をしたいのだと思いますが、 新規質問で、 別の方法を質問した方が良いですよ。 ボット巡回・インデックス拒否など #2さんの提案通りmetaタグで指定出来る場合が多いですから

noname#142899
質問者

お礼

勉強不足でディレクトリのことはよく分からないのですが、やっぱりできないことなんですね。 ボット巡回とインデックス拒否をしたいのですが、テキストファイル一個でできるならHTMLのタグが見やすくなっていいかと思ったのですが・・・。 metaタグしかないのですね。 ありがとうございました。

全文を見る
すると、全ての回答が全文表示されます。
noname#198951
noname#198951
回答No.1

プロバイダのサーバ.ne.jp/~ユーザのID/robots.txt になります。 ツールでは独自のドメインを取得した時を想定しているので、サーバ直下のディレクトリ(フォルダ)ん書いているだけだと思います。

noname#142899
質問者

お礼

いちおう置いてみます。もしかして利くことを願い・・・。 ありがとうございました。

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • robots.txt

    いろいろ調べてみたのですが、自分の知識が乏しいようでよくわからなく困ってしまいこちらで質問させていただきたいと思いますのでよろしくお願い致します。 当サイトのグーグルのウェブマスター ツール で確認してみたところ、 「ウェブ クロール エラー 」のURLにアクセスできませんという項目に28件もエラーがのっていました。トップページをはじめとしてエラーになっていたので心配になりました。「robots.txt にアクセスできません」となっております。 「robots.txt ファイルに対して URL をテスト」というのを試してみたのですが、ディレクトリとして検出されました。ファイルによっては固有の制限がある可能性がありますと表示されました。 以前はこんな表示はでてなかったように思いますし、これはどういうことなのでしょうか? こういう表示がでてきてるということは、エラーのページは無視されてしまうということですか? 今までは<META name="ROBOTS" content="ALL">というタグを埋め込んでましたが、これを使っても意味がないので削除するように教えていただいて実行したのですが、これと関係ありますか? どう対処していったらいいのしょうか? robots.txt というのを作成したことがなく、特に問題はなかったのですが、これは自分で作ってアップするものなのですか? どうごご助言よろしくお願い致します。

    • ベストアンサー
    • HTML
  • robots.txtを再作成したいのですが…

    こんばんは。 tubmlrをやっているのですが、 以前、検索エンジンに自分のページが出なくなっていたのでウェブマスターツールで調べてみたら、 robots.txtが消えていたんです。 どうしたら再作成できますか?

  • robots.txt によりアクセスが制限されています

    ウェブマスターツールの robots.txt によりアクセスが制限されていますのところに11個入ってしまって殆ど検索に皮下からなくなってしまいました。。 これを解除する方法とかはあるでしょうか? ちなみにアダルト系のブログです。

  • robots.txtの書き方のことで?

    robots.txtの書き方の事で質問です。 http://abcd.com/himitu1/ http://abcd.com/himitu2/ http://abcd.com/himitu3/ という3つのフォルダ内を隠したい場合は User-Agent: * Disallow: /himitu1/ Disallow: /himitu2/ Disallow: /himitu3/ このような書き方でいいでしょうか? また、robots.txtはサーバーのトップにアップさせるだけでいいのでしょうか? よろしくお願いします。

    • ベストアンサー
    • HTML
  • クローラーがrobots.txtを巡回しない

    クローラーがrobots.txtを巡回しないため、毎回手動で再送信をしています。 robots.txtの内容はマスターツールで確認してもエラーもなく正常に表示されています。 あとは制限などをしている可能性があるのはhtaccessくらいですが、robots.txtの巡回を妨げるようなものはあるのでしょうか? 何か理由がお分かりの方がいましたらアドバイスをお願いします。

  • robots.txtにおいて全てを許可する記述ですが以下の二つの違いは

    robots.txtにおいて全てを許可する記述ですが以下の二つの違いはあるのでしょうか? User-agent: * Disallow: User-agent: * Allow: / よく上が紹介されていますがgoogleウェブマスターツールで生成すると以下の記述になります どちらでもまったく同じ効果であると考えていいのでしょうか?

    • ベストアンサー
    • HTML
  • robots.txtやCGIを設置したいのですが

    二次創作サイトのみ可で、無料のサイトスペース(審査制)をお借りしている者なのですが、1つ相談があります。 そのサーバーからアカウント発行のメールを頂いたときに、 「html/index.html として置かれたファイルが、インデックスページとなります」 「ウェブサイトを公開する場合は、html/以下に置いて下さい」 とありました。 FTPを繋いで見ると、確かに最初から「html」というディレクトリがありましたし、ここの中にindex.htmlを置くと、http://*******.jp/発行したアカウント となりました。 今のところアクセス解析のCGIと、robots.txtを設置しようと思っています。 それで、今まではインフォシークの無料サーバーを使っていたものですから、「cgi-bin」というディレクトリを作り、その中にCGIを入れなければいけませんでしたが、特に何も書かれていない場合、ディレクトリの指定があるかどうかも分かりません。 また、robots.txtは ttp://sp999.oheya.jp/tips/tips/03_robots.htm このサイトによると、 自分のサイトのトップディレクトリにrobots.txtをアップロードする。 とありますが、これは「html/」の中にアップロードしなければいけないのか、その外にアップロードしなければいけないのか分かりません。 なので上記2つを、サーバーの管理人さんにメールで問い合わせてみようと思っているのですが、大丈夫でしょうか。 審査制のところなので、「ある程度のCGI知識が必要」といわれていましたが、私は日記CGIのnicky!くらいしか設置したことありませんし(それでも審査は通ったのですが)、 これくらいでメールするなよ、と管理人さんに叱咤されそうな感じもします。 よろしければ、アドバイスお願いします。

  • robots.txtはどこに置くのですか?

    自分のブログが検索でなるべくヒットしないように このサイト http://www.free-seo.jp/robots-crawl-yahoo-google-bing/ このサイト http://info.search.yahoo.co.jp/archives/002849.php このサイト http://dokodemo.rankuappu.com/syono5.html を参考にして robots.txtを作成しました。 上のサイトに記載されている http://www.free-seo.jp/image/robotstxt-upload.gif 「作成した robots.txtを最上位階層にアップロードする」 http://blog-imgs-45.fc2.com/x/x/x/xxxteeeeeeeenxxx/WS000002.jpg 「ファイルは、サイトのルートディレクトリに設置してください。」 http://blog-imgs-45.fc2.com/x/x/x/xxxteeeeeeeenxxx/WS000001.jpg 「置き場所」 の意味がよく分かりません。置き方が分かりません。 どこにアップロードするのか分かりません。 取り敢えず サイトの最上位階層(ルートディレクトリ)に robots.txtをドロップして(置いて)みたのですが ブラウザ上で User-agent: * Disallow: / と再生されるだけです。 よくわからないので htmlの<head>と<head/>の間に <head> User-agent: * Disallow: / <head/> と埋め込み http://tamesi.jmin.net/(質問用ホームページ)のようにしてみました。 これでいいのでしょうか。なんだか違うような気がします。 おバカな中学生にわかりやすく説明して欲しいです。 サイトのルートディレクトリに設置してください。 お前ブログなんて誰も検索しないよ。 のようなもともこない回答はしないで欲しいな(´・ω・`)

  • httpsへ以降後のrobots.txt 変更は?

    私は最近、趣味のホームページをHTTPからHTTPSへと致しました。 さくらインターネットを使用しており、無料認証証明書でhttps化が自動で出来ると言うことでhttps化する事が出来、301リダイレクトも設置し正常に機能しています。 それで、今現在httpとhttpsの両方が存在している状況です。 以前からサイトマップを検索エンジンに知らせるために、robots.txt を下記のように設置してgoogleウエブマスターツールにて認識させていましたが、httpsに移行させた状況で、下記の内容をそのままにしておいて良い物か、https用に書き換えなければいけないのか?削除してしまえば良いのかアドバイス頂ければ幸いです。 今の設置の内容 ↓ ・・・・・・・ User-agent: * Disallow: Sitemap: http://http://◎◎◎◎.com/Sitemap.xml ・・・・・・・ ◎◎◎◎は任意のURL このように変更しなければいけないでしょうか? ↓ ・・・・・・・ User-agent: * Disallow: Sitemap: https://https://◎◎◎◎.com/Sitemap.xml ・・・・・・・ ◎◎◎◎は任意のURL それとも、今現在移行したばかりで、検索エンジンにhttpsが反映されていないので、httpとhttpsがある中で、下記のように書き換えたほうが良いですか? ↓ ・・・・・・・ User-agent: * Disallow: Sitemap: http://http://◎◎◎◎.com/Sitemap.xml Sitemap: https://https://◎◎◎◎.com/Sitemap.xml ・・・・・・・ ◎◎◎◎は任意のURL それと、検索エンジンにhttpsが反映された場合、httpのサイトマップやhttp自体をウエブマスターツールから削除しなければいけないでしょうか?

    • ベストアンサー
    • XML
  • 「robots.txt による URL 制限」

    所有するHP(Googleでドメインを取得し、Google Appsで管理しています)について、Googleのウェブマスターツールを使用し、クローラのアクセスをしたところ、「サイトをクロールした際に検出されたクロールエラー」として、「robots.txt により URL が制限されています」、という結果が4件現われました。 素人なので、その意味するところもよく理解できていないのですが、ここ数日、HPへの訪問者数が大きく減少していることと関連している気がします。 なお、robots.txt により URL が制限されています、という4件のURLは、いずれも所有するHPのメインのサイトそのものです。 本件はどのように判断すべきなのでしょうか。 Google社に質問を出そうにも、同社は利用者からダイレクトに質問を受けることをしておらず、連絡の取りようがありません。 なお、所有するHPへの最大Traffic Sourceは、米国人サイト利用者一般への閲覧情報提供・閲覧マネジメントサービスを提供する米国会社ですが(URLを調べた結果です)、このURLをGoogleの解析機能でチェックしたところ、「このWebサイトは、有害なプログラムを転送するか、オンライン詐欺に関係していることが確認されています。この画面を閉じてください。」という表示が出てきます。 私のHPが、クローラアクセスのクロールエラーで「robots.txt により URL が制限されています」とされているのも、このことと無関係ではないような気がします(私のHPが有害なサイトとして扱われているのではないかと。なおHPは全て英語のサイトです)。 上記の現象をどう解釈したらいいのか、robots.txt によるURL制限を外すにはどうしたらいいのか、またGoogle社に個別質問を出す方法などについて、どなたかお教えいただけませんでしょうか。 ある特定の日を境にHP閲覧者数の極端な減少が発生しており、非常に困っていますので、どうかよろしくお願いいたします。

このQ&Aのポイント
  • 11月に性行為をしたが、妊娠検査薬は陰性だった。
  • 12月が来ておらず3週間遅れているため不安。
  • 生理について、前回の生理はいつもと異なる症状があった。
回答を見る