定期的なユーザーエージェントのないアクセス

このQ&Aのポイント
  • 定期的なユーザーエージェントのないアクセスがあります。IPはわかるが、Mozilla/3.01(compatible;)だけのユーザーエージェントです。ロボットかどうか、更新チェックかどうか、プロキシサーバーの動作かどうか、嫌がらせかどうかわかりません。このアクセスの解釈方法が分からず、リクエストや転送量も気になります。
  • 定期的なユーザーエージェントのないアクセスがある場合、ロボットである可能性や更新チェック、プロキシサーバーの動作などが考えられます。しかし、その解釈方法が分からず、リクエストや転送量が普通の閲覧と同じかどうかも分かりません。このような状況でどのように対応すべきか、分かる方に教えていただきたいです。
  • 定期的なユーザーエージェントのないアクセスが数分おきにある場合、ロボットや更新チェック、プロキシサーバーの動作などが考えられます。しかし、この状況の解釈方法が分からず、リクエストや転送量も不明です。対応方法が分からないため、どなたか詳しい方に教えていただけると助かります。
回答を見る
  • ベストアンサー

定期的なユーザーエージェントのないアクセス

IPはわかるのですが「Mozilla/3.01(compatible;)」だけのユーザーエージェントのアクセスが数分おきにあります。 ロボットでしょうか? だれかがHPの更新をチェックするため巡回ツールを使ってアクセスしているのでしょうか? それともプロキシサーバーのページをリフレッシュするための動作でしょうか。 嫌がらせかなとも思いました。 こんなアクセスがあった場合どのように解釈すればいいでしょうか。 ロボットでの巡回の場合リクエストや転送量は普通に閲覧した場合と同じ程度にかかるのでしょうか? (同じだけかかるとなると数分おきのためかなり気になります) はじいたほうがいいのかそのままでもかまわないのかよくわからないため、どなたかおわかりになる方がいたら教えていただけないでしょうか。 よろしくおねがいします。

質問者が選んだベストアンサー

  • ベストアンサー
回答No.1

まっとうなロボットであれば、通常はRefererに自分の身元を明らかにするような情報が含まれています。 それがロボット名である場合もあれば検索エンジン名そのものである場合もありますが、匿名でくることはあまりないと思われます。 また、一般的なロボットの巡回の特徴は、HTMLファイルのみをGETして、当該ページのそれ以外のファイル(imageファイル等)は一切拾っていきません。 #文章で検索するのですから、文字情報以外は不要という事です。 また、ページの更新をチェックするツールは、GETメソッドではなくHEADメソッドを利用してアクセスしてくることが多いので(コンテンツの更新日時だけ分かればいいから)、HEADで来ていれば更新チェックツールだと推測されます。 ロボットを回避すべきどうかは、対象のページの情報をDERARUさんが不特定多数に公開したいかどうかにかかっていると思います。 更新チェックについては、特に回避する必要はないと個人的に思います。また、更新チェックだけを蹴るのは事実上困難だと思われますし....

DERARU
質問者

お礼

投稿する場所を間違ってしまったのに返信してくださってありがとうございます。 GETメソッドやHEADメソッドはサーバー管理者がわかるものでしょうか? レンタルスペースのアクセス解析なのでわかるのは無理ですよね? htmlファイルのみなら転送量なども特に問題ないと思うのでそのままにしようかなとも思います。 匿名ってところが気になるところですが。

関連するQ&A

  • googelbot.comについて

    掲示板に問題となる投稿があり、 その投稿のホストやユーザーエージェントを見たところ、以下のようでした。 (一部〇〇と伏せました) ホスト: crawl-66-249-69-〇〇.googlebot.com ブラウザ: Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html) これを調べてみるとgooglebot.comとはロボットの巡回プログラム(クローラー)のようですが クローラーが投稿するなどありえるのでしょうか?

  • HTTP_USER_AGENTについて

    アクセス解析していて思ったのですが Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0; .NET CLR 1.1.4322) のような場合のMozilla/4.0の意味を教えてください。 この場合ブラウザはIE6なのでブラウザのMozillaとは関係ないと思うのですがどうなのでしょう。

  • Google botとブラウザ別アクセス

    ブログを開設しているのですが、ブラウザの事で質問があります。 サーバーの「ブラウザ別アクセス」を見るとどんなブラウザでア クセスしてきたかが分かります。 例えばインターネット・エクスプローラーとかネットスケープと かです。 この「ブラウザ別アクセス」で確認したところ、次のようなブラ ウザがありました。 DoCoMo/1.0/N505i/c20/TB/W20H10 (compatible; Googlebot-Mobile/2.1;+http://www.google.com/bot.html) これは携帯電話機のドコモを使ってアクセスしてきたという事で すか?「N505i」という機種を使ってる人がアクセスして来たと いうことでしょうか? だとするとその後ろにある「Google bot」とはどういう事でしょ うか?グーグルボットというのは検索エンジンのグーグルのスパ イダーの事ですよね?ボット(ロボット)が巡回して見にきたと いう事でしょうか? だとすると「ドコモ N505i」とはつじつまがあわなくなります。 ちなみに私が自分でアクセスすると下記のようになります。 Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1) マイクロソフトのIE・6.0を使用しているのでこのように なります。 だとすると次のアクセスはグーグル・ボットが巡回して見にき たという事でしょうか? Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html) グーグルボットは携帯用とパソコン用の2種類あるということ でしょうか?私にはよく分かりません。詳しい方教えて下さい。 よろしくお願い致します。

  • ユーザーエージェント IE6のブラウザ判別について

    調べているんですが、解決に至らず… 教えていただけると助かります! phpで、ブラウザ判別(ユーザーエージェント)を行い、IE6の場合のみ別ページへジャンプさせています。 全てというわけではないのですが、IE7でもIE6と認識される場合があり、困っています。 スクリプトは以下のとおりです。 <?php $user_agent = $_SERVER['HTTP_USER_AGENT']; $msie6 = ereg('Mozilla/4.0 (compatible; MSIE 6.0)', $user_agent); if ($msie6) { include( "http://○○/attention" ); } else { ?> <html>~ IE7のブラウザのうち、IE6と認識されるブラウザの法則性は分かりません。 いろいろと調べてみましたが、辿りつかず、類似の解説があれば教えてください。 また、上記スクリプトがおかしい点ありましたら教えてください! よろしくお願いします!

    • ベストアンサー
    • PHP
  • ウェブサーバに不審なアクセス

    無料Webサーバにサイトを持っているのですが、 アクセス解析に不審なユーザエージェント残っています。 Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.1.4322; MEGAUPLOAD 1.0) これです。MEGAUPLOAD 1.0。なんなんでしょうかこれは。 今まではこのようなアクセスはなかったのですが、最近アクセス数が昼夜問わずに異常に増えてます。 杞憂だといいのですが不安です。 何かご存知の方がいらっしゃいましたら教えていただけないでしょうか。

  • アクセスログの見方について

    いつもお世話になっております。 私が借りているレンタルスペースはアクセスログを閲覧することが可能なのですが、何件かよく分からないアクセスがあります。 例えば、こういったものになります。 (実際のものとは若干、変更してあります) 999.999.999.999 - - [01/Jan/2003:12:12:12 +0900] "GET /web/css.css HTTP/1.1" 404 227 "http://homepage-rei.com/bbs.cgi?page=5" "Mozilla/4.0 (compatible; MSIE 5.5; Windows NT 5.0)" homepage-rei.com/bbs.cgiが参照元になっており、css.cssというファイルのリクエストがあった、ということは分かりますが、このファイルが自分のサイトにない場合でもリクエストが出ているようです。(だから404が返っているようです) こういった事は頻繁にあるのでしょうか。 詳しい方、回答をいただけると幸いです。

  • 自分のホームページをGoogleに未登録なのに…

    最近、自分のホームページ(ブログではない)を作りました。 Googleなどの検索サイトには、URLを登録していないのに、アクセス解析を見ると、 ホスト名「crawl-66-249-69-55.googlebot.com」 ユーザエージェント「Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)」や「Googlebot-Image/1.0」などが、アクセスしにきます。 未登録でも、巡回しにくるなんてことがあるのでしょうか? また自分でも調べてみましたら、「ボットになりすまして、人間が閲覧している可能性もある」とのこと。そんなことも、一般的によくあるのでしょうか? 詳しい方がいらっしゃいましたら、回答よろしくお願い致します。

  • ブログのアクセス解析についてです。

    ブログのアクセス解析についてです。 下記の場合、ドコモの携帯から、あるいはドコモのスマートおフォンからのアクセスである可能性はありますか? Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.0; Trident/4.0; OSはWindows vistaとなっています。 回答お待ちしております。

  • アクセスカウンターは信じていいのですか?

     ホームページを何とかつくり、アクセスカウンターもつけました。 そこで少しおかしいなと思うことがあるのですが、昨日早速いろいろな ロボット検索エンジンに登録したのですが、今日自分のホームページ チョコチョコと覗き始めると、もうアクセスが伸び始めているのです。  30分に3~5アクセスくらいですが、これって本当に訪問してきて くれた結果なのでしょうか?ロボット検索エンジンなどが巡回してきても カウンターに入るのでしょうか?  ちなみに、友人などにもURLを伝えていないですし、自分が訪れた 回数はしっかりと除いて考えています。  長くなりましたがご回答よろしくお願い致します。

    • 締切済み
    • CGI
  • 不正なアクセスらしいんですが意味が分かりません

    サーバーのアクセスログに以下のようなものがあります。 220.166.32.133 - - [31/Jan/2005:22:33:57 +0900] "GET http://www.microsoft.com/ HTTP/1.1" 200 30613 "-" "Mozilla/4.0 (compatible; MSIE 4.01; Windows 95)" "-" 221.200.62.75 - - [04/Mar/2005:08:08:29 +0900] "CONNECT 64.12.137.249:25 HTTP/1.1" 200 315 "-" "-" "-" 221.200.62.75 - - [04/Mar/2005:08:08:54 +0900] "GET http://www.ebay.com/ HTTP/1.1" 200 32606 "-" "Mozilla/4.0 (compatible; MSIE 5.00; Windows 98)" "-" どちらも中国のホストからのアクセスで、最近増えている不正アクセスだと思います。 ここで疑問なのは、microsoft.comやebay.comと表示されている部分です。(これはこちらのサーバーに対するリクエストを示していると思うんですが) 他の通常のアクセスでは、 provider.ne.jp - - [日時] "GET /filename.gif HTTP/1.1" 200 471 "http:// mydomain/dirname/filename.html" "useragentname" "-"となっています。 存在しないmicrosoft.comやebay.comを要求されたら、エラーログにFile does not existなどと記録されるのではないのでしょうか?(該当日時にエラーは記録されていません) そもそもこれは不正アクセスでしょうか? 要領を得ない質問ですが、どなたか教えて下さい。