robots.txt HTTP/1.1" 404 208 について| OKWAVE

robots.txt HTTP/1.1 404 208 について

２年ほど自宅サーバーでＨＰを公開しています。最近、以下のようにローカルホストに対して robots.txt に関係するアクセスログが記録されます。 ------------------------------------------------------------------ 127.0.0.1 - - [ 日時記載省略 ] "GET /robots.txt HTTP/1.1" 404 208 127.0.0.1 - - [ 日時記載省略 ] "GET /robots.txt HTTP/1.1" 404 208 127.0.0.1 - - [ 日時記載省略 ] "GET /robots.txt HTTP/1.1" 404 208 127.0.0.1 - - [ 日時記載省略 ] "GET /robots.txt HTTP/1.1" 404 208 127.0.0.1 - - [ 日時記載省略 ] "GET /robots.txt HTTP/1.1" 404 208 　　・　　・ ※ 行数は１アクセスに対して４～８行程度。（日によって変わる） ------------------------------------------------------------------ ログとしては未検出エラーのようですが、自サバのルートディレクトリーなどには robots.txt を、過去を含めて一度も設置した事がありません。ただ、この現象が出だしたのは、利用しているHTTPソフトApache 2.0 を 2.2 へバージョンアップした頃から。また、別途公開しているブログ（OCN）のタイトル画像のリンクをこの自サバのルートに置いている画像から引き出した頃からです。しかしこのような構成は過去からずっと行っており、従来から Apache 2.0 の利用で、robots.txtなるファイルも置いた事が無くログに今回のような内容は記録された事がありません。以上のような事から、サーバーソフトの Apache を 2.0 から 2.2 へバージョンアップした事が起因しているのではないかとも考えています。ちなみに、セキュリティソフトはシマンテックのインターネットセキュリティを使っており、ウイルスやスパイウェアの検出は確認されていません。判る方がおられましたら、ぜひ宜しくご指導ください。その他の環境 OS：WindowsXP SP2 通信：NTTフレッツADSL＋ルーターモデムWebCaster620 マシン：SONY VAIO デスクトップ機（CPU：800MHz AMD Duron）

robots.txtはどこに置くのですか？

自分のブログが検索でなるべくヒットしないようにこのサイト http://www.free-seo.jp/robots-crawl-yahoo-google-bing/ このサイト http://info.search.yahoo.co.jp/archives/002849.php このサイト http://dokodemo.rankuappu.com/syono5.html を参考にして robots.txtを作成しました。上のサイトに記載されている http://www.free-seo.jp/image/robotstxt-upload.gif 「作成した robots.txtを最上位階層にアップロードする」 http://blog-imgs-45.fc2.com/x/x/x/xxxteeeeeeeenxxx/WS000002.jpg 「ファイルは、サイトのルートディレクトリに設置してください。」 http://blog-imgs-45.fc2.com/x/x/x/xxxteeeeeeeenxxx/WS000001.jpg 「置き場所」の意味がよく分かりません。置き方が分かりません。どこにアップロードするのか分かりません。取り敢えずサイトの最上位階層(ルートディレクトリ)に robots.txtをドロップして(置いて)みたのですがブラウザ上で User-agent: * Disallow: / と再生されるだけです。よくわからないので htmlの<head>と<head/>の間に <head> User-agent: * Disallow: / <head/> と埋め込み http://tamesi.jmin.net/(質問用ホームページ)のようにしてみました。これでいいのでしょうか。なんだか違うような気がします。おバカな中学生にわかりやすく説明して欲しいです。サイトのルートディレクトリに設置してください。お前ブログなんて誰も検索しないよ。のようなもともこない回答はしないで欲しいな(´・ω・`)

簡単なHTTP－Get

こんにちわ。初めて質問します。サイトの簡易試験を行いたくJAVAを使ってHTTPのGetリクエストを送信したいと考えています。要件は以下の通りです。１、HTTPはGetリクエストを使用する２、URLはコードに記載ではなく特定のファイル（URL.ｔｘｔ）を1行づつ読み込む３、User-Agentを都度変更できるようにするということを行いたいのですが、皆様にとっては簡単なことかもしれませんが、なかなか上手くいきません。手助けをお願いいたします。

httpsへ以降後のrobots.txt 変更は？

私は最近、趣味のホームページをHTTPからHTTPSへと致しました。さくらインターネットを使用しており、無料認証証明書でｈｔｔｐｓ化が自動で出来ると言うことでｈｔｔｐｓ化する事が出来、３０１リダイレクトも設置し正常に機能しています。それで、今現在ｈｔｔｐとｈｔｔｐｓの両方が存在している状況です。以前からサイトマップを検索エンジンに知らせるために、robots.txt を下記のように設置してgoogleウエブマスターツールにて認識させていましたが、ｈｔｔｐｓに移行させた状況で、下記の内容をそのままにしておいて良い物か、ｈｔｔｐｓ用に書き換えなければいけないのか？削除してしまえば良いのかアドバイス頂ければ幸いです。今の設置の内容 ↓ ・・・・・・・ User-agent: * Disallow: Sitemap: http://http://◎◎◎◎.com/Sitemap.xml ・・・・・・・ ◎◎◎◎は任意のURL このように変更しなければいけないでしょうか？ ↓ ・・・・・・・ User-agent: * Disallow: Sitemap: https://https://◎◎◎◎.com/Sitemap.xml ・・・・・・・ ◎◎◎◎は任意のURL それとも、今現在移行したばかりで、検索エンジンにｈｔｔｐｓが反映されていないので、httpとhttpsがある中で、下記のように書き換えたほうが良いですか？ ↓ ・・・・・・・ User-agent: * Disallow: Sitemap: http://http://◎◎◎◎.com/Sitemap.xml Sitemap: https://https://◎◎◎◎.com/Sitemap.xml ・・・・・・・ ◎◎◎◎は任意のURL それと、検索エンジンにｈｔｔｐｓが反映された場合、ｈｔｔｐのサイトマップやｈｔｔｐ自体をウエブマスターツールから削除しなければいけないでしょうか？

Apacheのログに0.0.0.0と記録される

Windows2000 + Apache2.2で運用しております。 Apacheのアクセスログで、combinedで出力させていますが、アクセス元のＩＰアドレスがすべて「0.0.0.0」と記録されてしまいます。 0.0.0.0 - - [04/Mar/2007:00:16:39 +0900] "GET / HTTP/1.1" 200 164 0.0.0.0 - - [04/Mar/2007:00:16:40 +0900] "GET /favicon.ico HTTP/1.1" 403 1113 このような感じです。外部からも内部からもこのように記録されます。 Linuxで構築していた頃はこのようなことはなかったのですが、どなたか対策法などご存じでしたらご教授ください。

HTTP/1.0でリクエストする物（ブラウザ/OS?）について

アクセスログを解析していて疑問がありました。ログの中で、 GET / HTTP/1.0 という記述がありますが、"HTTP/1.0"の部分には、HTTP/1.1と書かれているログが大多数です。調べるとリクエストのバージョンということですが、1.0でリクエストするのはどういった場合なのでしょうか？ブラウザ or OSの種類によるのかなと思っていましたが、XPでも1.0をリクエストしているログがあります。非常に疑問です。私が使っているログ解析ソフトはHTTP/1.0は無視する仕様になっているということなので、本件の内容がわからなければ、無視する事もできません。早急に回答が欲しいのです。どなたかご教授ください。

Apacheが出すログでホスト名を取得したい

Apacheの出すログでホスト名を取得したいのです。 61.207.000.00 - - [20/Jun/2004:16:07:56 +0900] "GET /web HTTP/1.1" 401 476 アクセスしたらこのようなアクセスログになりますが、このipの部分にホスト名を記録させたいのです。バージョンは Apache/1.3.27 Linuxで運用しています。 httpd.conf のどの部分を触ればいいのか、ご存知の方、よろしくお願いします。

HTTPプロトコルについて(文字化け。)

No.656466の質問「文字化け。」で「サーバーの設定とは関係ありません。」と自身満々に回答してしまったものです。。。 (質問者の方には申し訳ない) 私はHTTPプロトコルはポート80にgetコマンドを送って単にhtmlデータを受け取るだけだと勘違いしていたのですが No.656466の回答にapacheのconfファイルのAddDefaultCharsetを変更することで文字コードの判定を行えるような事を書いてあったのですが apacheはAddDefaultCharsetをconfファイルで指定してやることでどういった動作をしてブラウザとやりとりしているのでしょうか？宜しくお願いします。

ソフト同封の「Readme.txt」のテンプレート

インターネット上で、公開されているソフトは、ほぼ100%「Readme.txt」が同封されています。何かのルートで、そのファイルの推奨テンプレートがあるという情報を手に入れた事があります。どこかの団体が推奨している、という事は憶えてます。ご存知の方、いらっしゃいましたらよろしくお願いします。

不正なアクセスらしいんですが意味が分かりません

サーバーのアクセスログに以下のようなものがあります。 220.166.32.133 - - [31/Jan/2005:22:33:57 +0900] "GET http://www.microsoft.com/ HTTP/1.1" 200 30613 "-" "Mozilla/4.0 (compatible; MSIE 4.01; Windows 95)" "-" 221.200.62.75 - - [04/Mar/2005:08:08:29 +0900] "CONNECT 64.12.137.249:25 HTTP/1.1" 200 315 "-" "-" "-" 221.200.62.75 - - [04/Mar/2005:08:08:54 +0900] "GET http://www.ebay.com/ HTTP/1.1" 200 32606 "-" "Mozilla/4.0 (compatible; MSIE 5.00; Windows 98)" "-" どちらも中国のホストからのアクセスで、最近増えている不正アクセスだと思います。ここで疑問なのは、microsoft.comやebay.comと表示されている部分です。（これはこちらのサーバーに対するリクエストを示していると思うんですが）他の通常のアクセスでは、 provider.ne.jp - - [日時] "GET /filename.gif HTTP/1.1" 200 471 "http:// mydomain/dirname/filename.html" "useragentname" "-"となっています。存在しないmicrosoft.comやebay.comを要求されたら、エラーログにFile does not existなどと記録されるのではないのでしょうか？（該当日時にエラーは記録されていません）そもそもこれは不正アクセスでしょうか？要領を得ない質問ですが、どなたか教えて下さい。

apacheのログ

Apacheのログの見方を教えてください。生ログは以下のようになってます。 fw.gmo-ht.com - - [16/Feb/2004:10:05:07 +0900] "GET /freecgi2/Count.cgi?md=8&dd=cdd&ft=5&df=SampleData HTTP/1.1" 200 445 "http://ultra1.isle.jp/hara/haraPW.html" "Mozilla/5.0 (Windows; U; Windows NT 5.0; ja-JP; rv:1.4) Gecko/20030624 Netscape/7.1 (ax)" "-" バージョンはApache 1.3.28なのですが、これがどういう項目で並んでいるのかがわかりません。（なんとなく検討はつくのですが。）どなたか、apacheログについて詳しく記載されているＨＰなどありましたら教えてください。よろしくお願いいたします。

HTTP80ポートって？

ファイアーオールMCAFEEを使用しています。自サーバーでWindows・Apatchで試験的にHP公開してみたんですが、外部からアクセスすると、ファイアーオールで(例)『IPアドレス210.153.84.237のコンピュータはシステムポート(TCP 80 ポート)の1つにアクセスしようとしました。』という警告がでてきたんで、ファイアーオールの設定を変更し、Webサーバー(HTTP)ポート80を外部からのアクセスも許可するように変更しました。そうしたらHPを外部のWeb上から見る事ができました。このポートを開きぱなっしにしてると、外部からの攻撃とか受けますか？また受けるとしたらどんな攻撃にあうのか教えてもらえないでしょうか？ネットワーク系セキュリティがあまり詳しくないので宜しくお願いします。

apache log 解析でユーザ解析

アパッチのログで 127.0.0.1 - admin [25/Jan/2005:14:06:35 +0900] "GET /manager/status HTTP/1.1" 200 5508 みたいなのがありますが、この "admin" の部分を解析したいと思っています。 wwwstat analog などでは無理？な感じ。何かいいソフトないでしょうか？

外のHPを閲覧すると自サバのログにlocalが記録される

自宅サーバーを趣味で公開している者です。宜しくお願いします。基本的に自分のサーバー公開とは無関係の話しだと判断しているのですが、ある特定の商用サイト（ttp://～/main.html）を訪問すると、それと同時に自宅サーバーの access.logファイルに　localhost - - [13/May/2007:12:00:00 +0900] "GET / HTTP/1.1" 200 3068 referer.logファイルに　ttp://～/main.html -> [13/May/2007:12:00:00 +0900] /index.html などというように、自分のPC（localhost）にアクセスした形で記録が残ります。なぜそのような事が出来るのでしょうか？また、この事は私が公開しているサーバーとどのような関係があるのでしょうか？閲覧先のサイトのソース内容を見ても特殊なファイルは走っていないようなのですが‥。

Apacheログの解析

rubyを使って aaabbb - - [20/Jun/2001:19:16:15 +0900] "GET / HTTP/1.0" 200 4636 bbbccc - - [20/Jun/2001:19:16:15 +0900] "GET /pbpenguin.png HTTP/1.0" 304 -　http://sss.org/ aaaaaa - - [20/Jun/2001:19:16:15 +0900] "GET /pbdebian.png HTTP/1.0" 304 -　http://aaa.org/ruby/ ssssss - - [20/Jun/2001:19:16:27 +0900] "GET /ruby/ HTTP/1.0" 200 4371 aaabbb - - [20/Jun/2001:19:16:30 +0900] "GET /ruby/rice.html HTTP/1.0" 200 2388 このようなapacheのログから、ホストごとのrefererを時系列順に表示するプログラムを作りたいのですが、 aaabbb -> 配列1 bbbccc -> 配列2 aaaaaa -> 配列3 ssssss -> 配列4 aaabbb -> 配列1 という風に同じホストごとに配列に格納するという処理をどう書けばいいのかが分かりません。分かる方いましたら回答お願いします。

Apacheで特定ファイルへのアクセスログをフィルタ

Webの状態監視ツールが、公開ディレクトリ上のtest.txtというファイルに定期的にアクセスを繰り返しているのですが、これによりアクセスログが肥大化しているため、test.txtへのアクセスだけをフィルタしたいと考えています。 IISでは簡単にできることなのですが、Apacheでは可能でしょうか？

access.logのリクエスト行について

mod_proxyのリバースプロキシサーバです。 apacheのアクセスログを見ていたら、『GET　http://xxxxxx.com/test/headers.aspx HTTP/1.0 』とありました。普通はGETの後にスラッシュが入るはずなのにスラッシュが付いていません。コレはどういった意味なのでしょうか？危険な意味なのでしょうか？

WEBサーバーのアクセスログについて

お世話になります。 XserverでWordPressサイトを公開しています。アクセスログについて教えてください。リクエストラインに下記のようなURIのないアクセスがあります。 "GET / HTTP/1.1" これはどこにアクセスしているものなのでしょうか？よろしくお願いします。

Firefoxでページ閲覧するとき、favicon.icoをGETさせないようにしたい

お世話になります。私のパソコン上で動作しているFirefoxに関する質問です。自サイトのApacheのアクセスログを確認したところ、Firefoxでは新しいページをGETするたびに毎回favicon.icoをGETしようとしていることがわかりました。これはFirefoxの仕様で、しかたないことなのでしょうか？ Firefoxのオプションを一通りみたつもりですが、なにか方法があればお教えください。

robots.txtの書き方のことで？

robots.txtの書き方の事で質問です。 http://abcd.com/himitu1/ http://abcd.com/himitu2/ http://abcd.com/himitu3/ という3つのフォルダ内を隠したい場合は User-Agent: * Disallow: /himitu1/ Disallow: /himitu2/ Disallow: /himitu3/ このような書き方でいいでしょうか？また、robots.txtはサーバーのトップにアップさせるだけでいいのでしょうか？よろしくお願いします。

robots.txt HTTP/1.1" 404 208 について

みんなの回答

お礼 2008/02/03 07:57

関連するQ&A

robots.txt HTTP/1.1 404 208 について

robots.txtはどこに置くのですか？

簡単なHTTP－Get

ヤバいパソコンが壊れたかも！？事前に知っておきたい3つの兆候と対策

httpsへ以降後のrobots.txt 変更は？

Apacheのログに0.0.0.0と記録される

HTTP/1.0でリクエストする物（ブラウザ/OS?）について

Apacheが出すログでホスト名を取得したい

HTTPプロトコルについて(文字化け。)

ソフト同封の「Readme.txt」のテンプレート

不正なアクセスらしいんですが意味が分かりません

apacheのログ

HTTP80ポートって？

家のネットワークを最適にできますか？：知っておくべきポイント

apache log 解析でユーザ解析

外のHPを閲覧すると自サバのログにlocalが記録される

Apacheログの解析

Apacheで特定ファイルへのアクセスログをフィルタ

access.logのリクエスト行について

WEBサーバーのアクセスログについて

Firefoxでページ閲覧するとき、favicon.icoをGETさせないようにしたい

robots.txtの書き方のことで？

注目のQ&A

カテゴリ
一覧

専門家に質問してみよう
専門家登録

あなたにピッタリな商品が見つかる！ OKWAVE セレクト

robots.txt HTTP/1.1" 404 208 について

みんなの回答

お礼 2008/02/03 07:57

関連するQ&A

robots.txt HTTP/1.1 404 208 について

robots.txtはどこに置くのですか？

簡単なHTTP－Get

ヤバいパソコンが壊れたかも！？事前に知っておきたい3つの兆候と対策

httpsへ以降後のrobots.txt 変更は？

Apacheのログに0.0.0.0と記録される

HTTP/1.0でリクエストする物（ブラウザ/OS?）について

Apacheが出すログでホスト名を取得したい

HTTPプロトコルについて(文字化け。)

ソフト同封の「Readme.txt」のテンプレート

不正なアクセスらしいんですが意味が分かりません

apacheのログ

HTTP80ポートって？

家のネットワークを最適にできますか？：知っておくべきポイント

apache log 解析でユーザ解析

外のHPを閲覧すると自サバのログにlocalが記録される

Apacheログの解析

Apacheで特定ファイルへのアクセスログをフィルタ

access.logのリクエスト行について

WEBサーバーのアクセスログについて

Firefoxでページ閲覧するとき、favicon.icoをGETさせないようにしたい

robots.txtの書き方のことで？

注目のQ&A

カテゴリ 一覧

専門家に質問してみよう 専門家登録

あなたにピッタリな商品が見つかる！ OKWAVE セレクト

カテゴリ
一覧

専門家に質問してみよう
専門家登録