• 締切済み

あるクローラー(ロボット)が異常にアクセスしてくるのですが...

ご指導よろしくお願いします。 私の運営しているサイトの一日のアクセス数は、PVで3000ほどなのですが、 ここ2,3日のアクセス解析を見ましたところ、1時間に1000以上のアクセスが続いています。 当然一般のユーザーからのアクセスではなく、クローラーです。 その異常にアクセスしてくるクローラーのホストが 「38.99.13.×××」 なんですが、どこから来ているのかが知りたいのです。 検索してみたのですが、”これだっ!”という情報を探すことができず、 こちらに投稿させていただきました。 何卒ご指導の程、よろしくお願いいたします。

みんなの回答

  • celtis
  • ベストアンサー率70% (2271/3209)
回答No.2

WHOISで確認すると、そのグローバルIPはワシントンDCにあるCogent Communications(Performance Systems International Inc.)という老舗のプロバイダみたいですね。そのプロバイダの利用者が何か妙なことをしているのではないでしょうか? 迷惑行為を受けていると直接連絡すれば、何かしら対処してくれるかもしれません。 http://www.cogentco.com/htdocs/index.php

neohiro
質問者

お礼

celtis 様、ご返信が遅くなりまして申し訳ございません。 諸事情によりPCのクリーンインストールを余儀なくさせられてしまい、 セッティングに時間がかかってしまいこちらにログインできない状態でした。 当サイト上のファイルのスクリプトを再確認したところ、バグを発見いたしました。どうやら無限ループが発生していたようです。 何とか解決に至りましたので、ご報告申し上げます。 ありがとうございました。

回答No.1

はずしているかもしれませんが,中国の検索エンジンのクローラが凄くて困っていたことがあります.baidu.com (百度)という検索エンジンです. とりあえず iptables かファイアウォールか何かで弾くのが正しい対処法ではないでしょうか?

neohiro
質問者

補足

spacech5p2 様、ご指導ありがとうございます。 baidu.com (百度)は、当方も疑いを持ったのですがIPが違うようなかんじでしたので、こちらに投稿したしだいです。 日本IDCのIPアドレス: 122.152.128.0 ~ 122.152.128.255 122.152.129.0 ~ 122.152.129.255 説明不足ですいません。 いずれにしても今回のようにやたらアクセスしてくるクローラーは、弾くべきなんでしょうかね~?

関連するQ&A

  • 検索サイトのクローラー(ロボット)

    中国やロシアの検索サイト「百度」、「Yandex」のクローラー(ロボット)は、なぜアクセス元ホストやユーザーエージェントを偽装してアクセスしてくるのでしょうか。 検索サイトが身元を隠してアクセスしてくる理由、メリットとはなんでしょうか。

  • ホスト名の取得できないアクセスはクローラなのでしょうか?

    ホスト名の取得できないアクセスはクローラなのでしょうか? Webページのアクセス解析でクローラ判別しようとしています。 基本はUser-Agentチェックです。 これでだいぶはじいたのですが、怪しいのがまだ残ってます。 User-Agentは 「Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)」 とかクローラっぽいキーワードはありません。 IPアドレスは取れましたが、ホスト名は取得できませんでした。 PHPのgethostbyaddr()でホスト名取得しようとしてもできませんでした。 ということは、ホスト名非公開のサーバーってことですよね? 普通のユーザさんが使っている普通のプロパイダならホスト名公開しているはず なので、上記のようにホスト名の取得できないアクセスはクローラだ というように決め付けても大丈夫でしょうか? ちょっとカテゴリ違いの気もしますが大目に見てください。 ご回答よろしくお願いします。

  • ID・PW認証でアクセス制限したHPに対するアクセス解析

    メンバー15人ほどにIDとPASSをそれぞれに割り振ってアクセスしてもらっているHPを運営しています。 ここのところカウンターが異常にまわるので どのIDでアクセスしてきたものが増えているのか すなわち誰が異常なアクセスをしているのか 知りたいのですがそういったことがわかるアクセス解析はありますか? 一般的な解析だとホストやIPがわかるようですが こちらが割り振ったIDで何度アクセスしてきたか、を わかるようにしたいのですが・・・

  • ブログへの異常アクセス

    このところわたしの個人のブログに異常アクセスがあります これまでは一日10件前後のアクセスで 1~2の記事を見るだけというケースでしたが この数日同一のアクセスで30~50の記事にアクセスしているようです アクセス解析を見ると リモートホストは次のようになっています      om126192131021.1.openmobile.ne.jp これはどういうことが考えられるでしょうか フィルター機能があるので解析しないようにすれば済むことでしょうか これだけでは分からないかもしれませんが何かアドバイスをいただけないものか ご相談です よろしくお願いします

  • FC2のアクセス解析を見たら

    FC2のアクセス解析を見たら ホスト crawl-66-249-79-161.googlebot.com は プロバイダ googleクローラー となっているのですが ホスト google-proxy-66-102-6-201.google.com プロバイダ google となっています。 この プロバイダ google は何なのでしょうか? クローラーとはまた別の者ですよね?

    • ベストアンサー
    • SEO
  • 携帯サイトでPC版yahooクローラー以外をアクセス制限するには?

    現在携帯サイトを運営しているのですが、 パソコンで閲覧した際に、閲覧できないようにPHPで設定しています。 ですが、そうするとPC版のyahooやgoogleのクローラーがアクセスできないと思うのですが、パソコンでアクセスできなくして、なおかつクローラーはアクセスできるようにするにはどうすればいいでしょうか? ちなみに現在は下記のように設定してます。 <?php $user_agent = $_SERVER["HTTP_USER_AGENT"]; if(ereg("(MSIE|Mozilla)",$user_agent)){ header("Location: PCで閲覧したときのフォルダ"); exit; }

    • ベストアンサー
    • PHP
  • 大量のアクセスにこまってます

    こんにちわ 専用サーバーを借りてサイトを運営しているのですが 最近、特定のプロバイダのホスト名でものすごいアクセスがあります。 Webalizer Version 2.01と言うアクセス解析が標準で入っているのですが特定のホストからhit数が20万、ファイル数が0となっています。これってdos攻撃ってやつですか?どうやって対処すればいいでしょうか、

  • ブログのアクセス数、ゼロって異常ですよね

    お恥ずかしい話ですが、1ヶ月ほどたち記事数は11件ほどです。全く趣味系(音楽)のブログです。 それ程長い記事でもなく、本当に日ごろ思ったことを書いているだけ。でも音楽についてって、毎日思うわけでもないので11件しかまだ書けていません。 それではみる人も少ないだろうとは思いますが、全くアクセスがないってどういうことなんでしょうか? 「ブログのアクセス数について」の質問を調べてみました。"一日50件です、少ないでしょうか・・・"といったものが殆どなので、ゼロってのは異常なのだなと思ったんです。 Googleへ登録はしましたが(ウェブマスターツールとか言うもので・・・HEADにMETAタグを入れて・・・というもの)記事中の言葉を検索しても出てきません。 アクセス解析ツールに間違いはないでしょうし。(ブログのホストが提供しているものです)ちなみにNINJAです。悪くないホストだと思います。 HPももっていますが、それも同様にアクセスがありません。 しかしゼロって・・・今後も見込みないでしょうか。いっとき凄い数入ったのですが、調査の結果全部クロールでした・・・ 他のサイトでも質問してみましたがその質問にすら引っかかる人が余りいなかった。文章力がないのでしょうか。 人気ブログになりたい訳ではないですが、結構悲しいものですね。少しくらい訪問してもらいたいです。何が悪いのでしょうか。

  • gooブログのアクセス解析って…

    ふと思ったのですが、gooブログアドバンスのアクセス解析でアクセスカウントの「閲覧数」とアクセス解析の「プラウザ数」が一致しないのはなぜでしょうか? 例えば僕の場合。 閲覧数 243pv アクセスIP数 116pv アスセス解析のプラウザ数を見てみると… InternetExplorer 6.x 69pv Googlebot 66pv Mozilla 5pv Netscape 4.x 2pv EzWeb 1pv プラウザ数を全部足すと143pvとなり「閲覧数」とも「アクセスIP数」とも一致しません。 予測ではRSSリーダーで見ている場合はカウントしていないとかってことかなとも思っています。 本当のところはどうなんでしょうか? 実は間違っているとか…。 気になってしょうがありません。

  • アクセス解析について教えてください

    アクセス解析で、ホスト名からいつも来てくれている人だな、とわかるのですが、訪問回数が1回になっていて、なぜだろうと思ったらユーザーIDが違っていました。 ホスト名が変わるのは何となくわかるのですが、ユーザーIDが変わることはあるんでしょうか? もし変わるのであればなぜ変わるのかも教えてください。 宜しくお願いします。