robots.txt HTTP/1.1 404 208 について| OKWAVE

robots.txt HTTP/1.1" 404 208 について

よろしくお願いします。２年ほど自宅サーバーでＨＰを公開しています。最近、以下のようにローカルホストに対して robots.txt に関係するアクセスログが記録されます。 ------------------------------------------------------------------ 127.0.0.1 - - [ 日時記載省略 ] "GET /robots.txt HTTP/1.1" 404 208 127.0.0.1 - - [ 日時記載省略 ] "GET /robots.txt HTTP/1.1" 404 208 127.0.0.1 - - [ 日時記載省略 ] "GET /robots.txt HTTP/1.1" 404 208 127.0.0.1 - - [ 日時記載省略 ] "GET /robots.txt HTTP/1.1" 404 208 127.0.0.1 - - [ 日時記載省略 ] "GET /robots.txt HTTP/1.1" 404 208 　　・　　・ ※ 行数は１アクセスに対して４～８行程度。（日によって変わる） ------------------------------------------------------------------ ログとしては未検出エラーのようですが、自サバのルートディレクトリーなどには robots.txt を、過去を含めて一度も設置した事がありません。ただ、この現象が出だしたのは、利用しているHTTPソフトApache 2.0 を 2.2 へバージョンアップした頃から。また、別途公開しているブログ（OCN）のタイトル画像のリンクをこの自サバのルートに置いている画像から引き出した頃からです。しかしこのような構成は過去からずっと行っており、従来から Apache 2.0 の利用で、robots.txtなるファイルも置いた事が無くログに今回のような内容は記録された事がありません。以上のような事から、サーバーソフトの Apache を 2.0 から 2.2 へバージョンアップした事が起因しているのではないかと考えています。判る方がおられましたら宜しくご指導ください。その他の環境 OS：WindowsXP SP2 通信：NTTフレッツADSL＋ルーターモデムWebCaster620 マシン：SONY VAIO デスクトップ機（CPU：800MHz AMD Duron）

robots.txtはどこに置くのですか？

自分のブログが検索でなるべくヒットしないようにこのサイト http://www.free-seo.jp/robots-crawl-yahoo-google-bing/ このサイト http://info.search.yahoo.co.jp/archives/002849.php このサイト http://dokodemo.rankuappu.com/syono5.html を参考にして robots.txtを作成しました。上のサイトに記載されている http://www.free-seo.jp/image/robotstxt-upload.gif 「作成した robots.txtを最上位階層にアップロードする」 http://blog-imgs-45.fc2.com/x/x/x/xxxteeeeeeeenxxx/WS000002.jpg 「ファイルは、サイトのルートディレクトリに設置してください。」 http://blog-imgs-45.fc2.com/x/x/x/xxxteeeeeeeenxxx/WS000001.jpg 「置き場所」の意味がよく分かりません。置き方が分かりません。どこにアップロードするのか分かりません。取り敢えずサイトの最上位階層(ルートディレクトリ)に robots.txtをドロップして(置いて)みたのですがブラウザ上で User-agent: * Disallow: / と再生されるだけです。よくわからないので htmlの<head>と<head/>の間に <head> User-agent: * Disallow: / <head/> と埋め込み http://tamesi.jmin.net/(質問用ホームページ)のようにしてみました。これでいいのでしょうか。なんだか違うような気がします。おバカな中学生にわかりやすく説明して欲しいです。サイトのルートディレクトリに設置してください。お前ブログなんて誰も検索しないよ。のようなもともこない回答はしないで欲しいな(´・ω・`)

簡単なHTTP－Get

こんにちわ。初めて質問します。サイトの簡易試験を行いたくJAVAを使ってHTTPのGetリクエストを送信したいと考えています。要件は以下の通りです。１、HTTPはGetリクエストを使用する２、URLはコードに記載ではなく特定のファイル（URL.ｔｘｔ）を1行づつ読み込む３、User-Agentを都度変更できるようにするということを行いたいのですが、皆様にとっては簡単なことかもしれませんが、なかなか上手くいきません。手助けをお願いいたします。

httpsへ以降後のrobots.txt 変更は？

私は最近、趣味のホームページをHTTPからHTTPSへと致しました。さくらインターネットを使用しており、無料認証証明書でｈｔｔｐｓ化が自動で出来ると言うことでｈｔｔｐｓ化する事が出来、３０１リダイレクトも設置し正常に機能しています。それで、今現在ｈｔｔｐとｈｔｔｐｓの両方が存在している状況です。以前からサイトマップを検索エンジンに知らせるために、robots.txt を下記のように設置してgoogleウエブマスターツールにて認識させていましたが、ｈｔｔｐｓに移行させた状況で、下記の内容をそのままにしておいて良い物か、ｈｔｔｐｓ用に書き換えなければいけないのか？削除してしまえば良いのかアドバイス頂ければ幸いです。今の設置の内容 ↓ ・・・・・・・ User-agent: * Disallow: Sitemap: http://http://◎◎◎◎.com/Sitemap.xml ・・・・・・・ ◎◎◎◎は任意のURL このように変更しなければいけないでしょうか？ ↓ ・・・・・・・ User-agent: * Disallow: Sitemap: https://https://◎◎◎◎.com/Sitemap.xml ・・・・・・・ ◎◎◎◎は任意のURL それとも、今現在移行したばかりで、検索エンジンにｈｔｔｐｓが反映されていないので、httpとhttpsがある中で、下記のように書き換えたほうが良いですか？ ↓ ・・・・・・・ User-agent: * Disallow: Sitemap: http://http://◎◎◎◎.com/Sitemap.xml Sitemap: https://https://◎◎◎◎.com/Sitemap.xml ・・・・・・・ ◎◎◎◎は任意のURL それと、検索エンジンにｈｔｔｐｓが反映された場合、ｈｔｔｐのサイトマップやｈｔｔｐ自体をウエブマスターツールから削除しなければいけないでしょうか？

HTTP/1.0でリクエストする物（ブラウザ/OS?）について

アクセスログを解析していて疑問がありました。ログの中で、 GET / HTTP/1.0 という記述がありますが、"HTTP/1.0"の部分には、HTTP/1.1と書かれているログが大多数です。調べるとリクエストのバージョンということですが、1.0でリクエストするのはどういった場合なのでしょうか？ブラウザ or OSの種類によるのかなと思っていましたが、XPでも1.0をリクエストしているログがあります。非常に疑問です。私が使っているログ解析ソフトはHTTP/1.0は無視する仕様になっているということなので、本件の内容がわからなければ、無視する事もできません。早急に回答が欲しいのです。どなたかご教授ください。

apache log 解析でユーザ解析

アパッチのログで 127.0.0.1 - admin [25/Jan/2005:14:06:35 +0900] "GET /manager/status HTTP/1.1" 200 5508 みたいなのがありますが、この "admin" の部分を解析したいと思っています。 wwwstat analog などでは無理？な感じ。何かいいソフトないでしょうか？

HTTPプロトコルについて(文字化け。)

No.656466の質問「文字化け。」で「サーバーの設定とは関係ありません。」と自身満々に回答してしまったものです。。。 (質問者の方には申し訳ない) 私はHTTPプロトコルはポート80にgetコマンドを送って単にhtmlデータを受け取るだけだと勘違いしていたのですが No.656466の回答にapacheのconfファイルのAddDefaultCharsetを変更することで文字コードの判定を行えるような事を書いてあったのですが apacheはAddDefaultCharsetをconfファイルで指定してやることでどういった動作をしてブラウザとやりとりしているのでしょうか？宜しくお願いします。

apacheのログ

Apacheのログの見方を教えてください。生ログは以下のようになってます。 fw.gmo-ht.com - - [16/Feb/2004:10:05:07 +0900] "GET /freecgi2/Count.cgi?md=8&dd=cdd&ft=5&df=SampleData HTTP/1.1" 200 445 "http://ultra1.isle.jp/hara/haraPW.html" "Mozilla/5.0 (Windows; U; Windows NT 5.0; ja-JP; rv:1.4) Gecko/20030624 Netscape/7.1 (ax)" "-" バージョンはApache 1.3.28なのですが、これがどういう項目で並んでいるのかがわかりません。（なんとなく検討はつくのですが。）どなたか、apacheログについて詳しく記載されているＨＰなどありましたら教えてください。よろしくお願いいたします。

Apacheのログに0.0.0.0と記録される

Windows2000 + Apache2.2で運用しております。 Apacheのアクセスログで、combinedで出力させていますが、アクセス元のＩＰアドレスがすべて「0.0.0.0」と記録されてしまいます。 0.0.0.0 - - [04/Mar/2007:00:16:39 +0900] "GET / HTTP/1.1" 200 164 0.0.0.0 - - [04/Mar/2007:00:16:40 +0900] "GET /favicon.ico HTTP/1.1" 403 1113 このような感じです。外部からも内部からもこのように記録されます。 Linuxで構築していた頃はこのようなことはなかったのですが、どなたか対策法などご存じでしたらご教授ください。

Apacheが出すログでホスト名を取得したい

Apacheの出すログでホスト名を取得したいのです。 61.207.000.00 - - [20/Jun/2004:16:07:56 +0900] "GET /web HTTP/1.1" 401 476 アクセスしたらこのようなアクセスログになりますが、このipの部分にホスト名を記録させたいのです。バージョンは Apache/1.3.27 Linuxで運用しています。 httpd.conf のどの部分を触ればいいのか、ご存知の方、よろしくお願いします。

cドライブにthreatalerts.txtがあります。これは何でしょうか？

いつの間にか気がついたら、cドライブにthreatalerts.txtがあります。これは、何でしょうか？中身はカテゴリ: セキュリティリスク日時@機能@リスク名@結果@項目の種類@発生先@疑わしい動作@ウイルス定義のバージョン@製品バージョン@ユーザー名@コンピュータ名@詳細となっております。どなたか分かりましたら教えてください。ウイルス対策ソフトのnorton2006では何も検出されません。

Apacheログの解析

rubyを使って aaabbb - - [20/Jun/2001:19:16:15 +0900] "GET / HTTP/1.0" 200 4636 bbbccc - - [20/Jun/2001:19:16:15 +0900] "GET /pbpenguin.png HTTP/1.0" 304 -　http://sss.org/ aaaaaa - - [20/Jun/2001:19:16:15 +0900] "GET /pbdebian.png HTTP/1.0" 304 -　http://aaa.org/ruby/ ssssss - - [20/Jun/2001:19:16:27 +0900] "GET /ruby/ HTTP/1.0" 200 4371 aaabbb - - [20/Jun/2001:19:16:30 +0900] "GET /ruby/rice.html HTTP/1.0" 200 2388 このようなapacheのログから、ホストごとのrefererを時系列順に表示するプログラムを作りたいのですが、 aaabbb -> 配列1 bbbccc -> 配列2 aaaaaa -> 配列3 ssssss -> 配列4 aaabbb -> 配列1 という風に同じホストごとに配列に格納するという処理をどう書けばいいのかが分かりません。分かる方いましたら回答お願いします。

access.logのリクエスト行について

mod_proxyのリバースプロキシサーバです。 apacheのアクセスログを見ていたら、『GET　http://xxxxxx.com/test/headers.aspx HTTP/1.0 』とありました。普通はGETの後にスラッシュが入るはずなのにスラッシュが付いていません。コレはどういった意味なのでしょうか？危険な意味なのでしょうか？

ソフト同封の「Readme.txt」のテンプレート

インターネット上で、公開されているソフトは、ほぼ100%「Readme.txt」が同封されています。何かのルートで、そのファイルの推奨テンプレートがあるという情報を手に入れた事があります。どこかの団体が推奨している、という事は憶えてます。ご存知の方、いらっしゃいましたらよろしくお願いします。

ウェブマスターツール　現在のステータス　違いは？

サイトを２つもってるのですが、トップ画面が違います。左は「過去 90 日間エラーが検出されませんでした。」となっていますが右は「DNS」「サーバー接続」「robots.txt の取得」となっています。右に「過去 90 日間エラーが検出されませんでした。」と書いてないことから、エラーが検出されたという事でしょうか？

HTTP_ActivePerl_Overflowと侵入検知

詳細: このコンピュータから試みた侵入「HTTP_ActivePerl_Overflow」の対象は **.***.*.** を検出して遮断しました。侵入者: localhost(****) 危険度: 中レベルプロトコル: TCP 攻撃された IP: **.***.*.**（←外国でした…）攻撃されたポート: http(**) ソフトはノートンを使用しています。ある日侵入を検知したとの表示が出てとても不安です。また、詳細: 侵入検知 (*.*.*) が *** シグネチャを監視しています。と言う表示が出ます。（*＝数字）自分がやった対策としてはActivePerlをアンインストールしたりしたぐらいです。特に二つ目のログがよく記録されております。「HTTP_ActivePerl_Overflow」と侵入検知がどのようなものかわかりません。対策、アドバイスを伺いたいです。お願いします。

Firefoxでページ閲覧するとき、favicon.icoをGETさせないようにしたい

お世話になります。私のパソコン上で動作しているFirefoxに関する質問です。自サイトのApacheのアクセスログを確認したところ、Firefoxでは新しいページをGETするたびに毎回favicon.icoをGETしようとしていることがわかりました。これはFirefoxの仕様で、しかたないことなのでしょうか？ Firefoxのオプションを一通りみたつもりですが、なにか方法があればお教えください。

robots.txtの書き方のことで？

robots.txtの書き方の事で質問です。 http://abcd.com/himitu1/ http://abcd.com/himitu2/ http://abcd.com/himitu3/ という3つのフォルダ内を隠したい場合は User-Agent: * Disallow: /himitu1/ Disallow: /himitu2/ Disallow: /himitu3/ このような書き方でいいでしょうか？また、robots.txtはサーバーのトップにアップさせるだけでいいのでしょうか？よろしくお願いします。

robots.txtについて

あるサイトさんの隠しページというかなんというかところに行きたいのですがコメントにそのページは『検索エンジンに登録されないようrobots.txtを使用しています。』と書かれていたんですが、どのようにしたら行くことができるのでしょうか？そもそもrobots.txtというものはなんでしょうか? よろしくお願いします。

robots.txt

いろいろ調べてみたのですが、自分の知識が乏しいようでよくわからなく困ってしまいこちらで質問させていただきたいと思いますのでよろしくお願い致します。当サイトのグーグルのウェブマスターツールで確認してみたところ、「ウェブクロールエラー」のＵＲＬにアクセスできませんという項目に28件もエラーがのっていました。トップページをはじめとしてエラーになっていたので心配になりました。「robots.txt にアクセスできません」となっております。「robots.txt ファイルに対して URL をテスト」というのを試してみたのですが、ディレクトリとして検出されました。ファイルによっては固有の制限がある可能性がありますと表示されました。以前はこんな表示はでてなかったように思いますし、これはどういうことなのでしょうか？こういう表示がでてきてるということは、エラーのページは無視されてしまうということですか？今までは<META name="ROBOTS" content="ALL">というタグを埋め込んでましたが、これを使っても意味がないので削除するように教えていただいて実行したのですが、これと関係ありますか？どう対処していったらいいのしょうか？ robots.txt というのを作成したことがなく、特に問題はなかったのですが、これは自分で作ってアップするものなのですか？どうごご助言よろしくお願い致します。

robots.txt HTTP/1.1 404 208 について

みんなの回答

お礼 2008/02/03 10:45

補足 2008/02/03 10:45

関連するQ&A

robots.txt HTTP/1.1" 404 208 について

robots.txtはどこに置くのですか？

簡単なHTTP－Get

httpsへ以降後のrobots.txt 変更は？

HTTP/1.0でリクエストする物（ブラウザ/OS?）について

apache log 解析でユーザ解析

HTTPプロトコルについて(文字化け。)

apacheのログ

Apacheのログに0.0.0.0と記録される

Apacheが出すログでホスト名を取得したい

cドライブにthreatalerts.txtがあります。これは何でしょうか？

Apacheログの解析

access.logのリクエスト行について

ソフト同封の「Readme.txt」のテンプレート

ウェブマスターツール　現在のステータス　違いは？

HTTP_ActivePerl_Overflowと侵入検知

Firefoxでページ閲覧するとき、favicon.icoをGETさせないようにしたい

robots.txtの書き方のことで？

robots.txtについて

robots.txt

注目のQ&A

カテゴリ
一覧

専門家に質問してみよう
専門家登録

あなたにピッタリな商品が見つかる！ OKWAVE セレクト

robots.txt HTTP/1.1 404 208 について

みんなの回答

お礼 2008/02/03 10:45

補足 2008/02/03 10:45

関連するQ&A

robots.txt HTTP/1.1" 404 208 について

robots.txtはどこに置くのですか？

簡単なHTTP－Get

httpsへ以降後のrobots.txt 変更は？

HTTP/1.0でリクエストする物（ブラウザ/OS?）について

apache log 解析でユーザ解析

HTTPプロトコルについて(文字化け。)

apacheのログ

Apacheのログに0.0.0.0と記録される

Apacheが出すログでホスト名を取得したい

cドライブにthreatalerts.txtがあります。これは何でしょうか？

Apacheログの解析

access.logのリクエスト行について

ソフト同封の「Readme.txt」のテンプレート

ウェブマスターツール 現在のステータス 違いは？

HTTP_ActivePerl_Overflowと侵入検知

Firefoxでページ閲覧するとき、favicon.icoをGETさせないようにしたい

robots.txtの書き方のことで？

robots.txtについて

robots.txt

注目のQ&A

カテゴリ 一覧

専門家に質問してみよう 専門家登録

あなたにピッタリな商品が見つかる！ OKWAVE セレクト

ウェブマスターツール　現在のステータス　違いは？

カテゴリ
一覧

専門家に質問してみよう
専門家登録