• 締切済み

百度(www.baidu.com)の検索はどこから来るのですか?

自分のサイトにアクセス解析をつけているのですが、 先日リモートホストが「www47.asd.tj.cn」のアクセスがありました。 色々と検索をしたら百度の検索ロボットだということは分かりました。 ただ気になったのは、アクセスの痕跡があったのがトップページではなくて 階層の深いページにダイレクトに来ていたことです。 しかも一番見られたくないページ(いわゆる隠しページ)だけでした。 こういうことはあるのでしょうか? 一応<META NAME="ROBOTS" CONTENT="NONE">は組み込んでいたので 今までYahooやGoogleから検索されることはありませんでした。 極々少人数の友人だけが見に来るようなページなので(1日に2~3人)、 友人の名前や写真なども載せていまして、いくら中国のであっても 検索でヒットするのは少々困りものです・・・

  • haw6
  • お礼率75% (163/217)

みんなの回答

回答No.1

何気に気になるタイトルだったので少しぐぐってみました。 私自身はこの手の知識が皆無ですが。 百済はRobotテキストを無視するらしいです。とある専用ページ(haw6さんと同じようなプライベートなページです)も見ほうだいだとか。はた迷惑な検索spamdだとの記述も。今のところIPで弾くしか手はないとも。 日本の検索エンジンも頑張って欲しいものですね。

haw6
質問者

お礼

ご回答ありがとうございます。 わざわざ調べていただいたんですね~。すいません・・・。 やっぱりMATEタグも効かないのですか。 ページの場所を変えるしかないみたいですね。困りました。

関連するQ&A

  • 検索エンジン用METAタグについて

    http://www.juraihelm.com/NNR/ (1)<META NAME="ROBOTS" CONTENT="NONE"> <META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW"> そのページと、そこからリンクしている全てのページを制限する。 (2)<META NAME="ROBOTS" CONTENT="INDEX,NOFOLLOW"> そのページのみを許可し、そこからのリンクを制限する。 index.htmlに使うと便利。 (3)<META NAME="ROBOTS" CONTENT="INDEX"> そのページの登録を許可する (4)<META NAME="ROBOTS" CONTENT="NOINDEX,FOLLOW"> そのページを制限し、そこからのリンクを許可する。 このような使い方は普通しない。 (5)<META NAME="ROBOTS" CONTENT="ALL"> 下の階層ページの巡回を許可する。 このような設定は、わざわざすることでもない。 ---------------------------------------- 上は検索エンジン用METAタグの説明サイトです。 今回、ホームページの一部をアップロードします。同様のファイルが並列的に同じフォルダーの中に約40個あります。相互にリンク設定もあります。 この場合、放置すると、それぞれ個別に検索ロボットが拾い上げ、ヒット効率が著しく低下します。これらのうち、一つのページだけ検索エンジンに掲載され、他は載らないようにMETAタグを設定したいのです。 ■(4)のタグを設定しようと思いますが、これでいいのでしょうか。「このような使い方は普通しない。」という記載が気になります。 ■「そこからのリンクを制限する」とは、リンクしたページの拾い上げもしないということでしょうか。 教えてください。

  • ロボット検索を拒否したい。

    教えて下さい。 ロボット検索を拒否したいと思いましてHPの各ページに <meta name="robots" content="noindex,nofollow"> を入力してロボット検索を拒否しています。 ただしトップページだけはYahooで検索されてしまいます。 最近<meta name="robots" content="noarchive">も追加したのですが、 検索されてしまいます。 何か原因は考えられますでしょうか?

    • ベストアンサー
    • HTML
  • asd.tj.cn

    サーバのアクセスログを見ると,今月に入って「asd.tj.cn」から 異常なほど多くのアクセスがあります. 「asd.tj.cn」で検索してみても何者か良く分からずとても不気味です. このまま放置していても問題ないでしょうか? このアクセス元がどういう組織・団体なのかご教示下さい.

  • ロボット巡回対策のMetaタグに関する質問です。

    ロボット巡回対策のMetaタグに関する次のサイトについて質問です。 http://heo.jp/tag/page/key.html ■ ロボット巡回対策 <Meta Name="ROBOTS" Content=""> <Meta Name="ROBOTS" Content="INDEX,FOLLOW"> INDEX,FOLLOW・・・・このページもページからのリンク先も許可。 <Meta Name="ROBOTS" Content="INDEX"> INDEX・・・・このページのみ巡回許可。 <Meta Name="ROBOTS" Content="NONE"> NONE・・・・このページもそこにあるリンク先全てを巡回禁止。 <Meta Name="ROBOTS" Content="NOINDEX"> NOINDEX・・・・このページのみ巡回禁止。 <Meta Name="ROBOTS" Content="NOFOLLOW"> NOFOLLOW・・・・このページは巡回許可、リンク先巡回禁止。 <Meta Name="ROBOTS" Content="ALL"> ALL・・・・下の階層の巡回を許可。 ------------------------------ ★★質問★★ 自分のサイト内を全て巡回禁止にしようと思います。最も簡単な方法を取りたいのですが、上の説明から類推すると、 <Meta Name="ROBOTS" Content="NONE"> NONE・・・・このページもそこにあるリンク先全てを巡回禁止。 これでよさそうですが、ここで言う「リンク先全て」とは、「下の階層全て」と考えていいのでしょうか。それとも文字通り他のサイトであろうとなかろうとリンク先全てということでしょうか。 それとも別に適切な記述がありますか。 ★★希望 そのサイト内のページをホームページ「...index.html」に巡回禁止の記述をすれば完璧にすべて巡回禁止になるようにしたいのです。 よろしくお願いします。

    • ベストアンサー
    • HTML
  • ロボット検索にかからないようにするには?

    HPを作ろうと思うのですが 個人的なページで、内輪だけで楽しみたいページにしたいと思っています。 ですが、聞くところによると勝手にロボットが検索しに来るとか。 それで、それを避けるには <head>~</head>間に <META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW"> <META NAME="ROBOTS" CONTENT="NOARCHIVE"> というようなタグを入れる方法があるというところまでは分かったのですが このタグは、ページごとに全部入れないといけないのでしょうか?

  • ロボット検索の拒否ができない。

    ホームページをフレームで作成しているのですが、 indexのみが検索にかかるようにしたいと思い、 他のページには下記のタグをいれました。 <HEAD>~</HEAD>に <META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW"> しかしロボット検索に単体ページで引っかかるのです。 なにか違っていますか? ロボット検索の拒否ができない訳は外になにかあるのでしょうか。 教えてください。

  • ブログに置ける検索避けタグについて。

    検索避けを必要とするブログサイトを持っています。 私が使っているブログ(J●GEMです)は、ページのHTMLを自分で書き換えることができるタイプのものなので、METAタグ等を自由に入れることができます。 これによって、だいたいの検索エンジン(yahoo,google等) を避けることができるのですが、LIV●DOORの未来検索という、ブログの記述のみを対象とした検索エンジンでは、これまでの<META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW"> <META NAME="ROBOTS" CONTENT="NONE"> <META NAME="ROBOTS" CONTENT="NOARCHIVE"> といった検索避けタグでは回避することができません。 このLIV●DOORの「未来検索」を避けるために、どんな形でタグを挿入すれば良いのかが分かりません。 どなたがお分かりの方がおられましたら、お教えください。切実に困っています。

  • Yahoo 検索避け 検索結果の表示

    お世話になります。 お時間あるときにでも助言いただけますと助かります。 1年ほど運営しているサイトがあります。 検索避けを行っていますが、1週間ほど前よりyahoo検索に引っかかるようになりました。 調べたところyahooのキャッシュ削除は難しいようですので .htaccessなどで対策をとろうと思っています。 疑問なのは、yahoo検索結果の表示についてです。 検索結果の多くは、  タイトルリンク  ページ内テキスト一部  URL ブックマーク キャッシュリンク という表示構成のようですが、自サイトの検索結果の表示は  タイトルリンク  URL のみの表示となっています。 以上について、次の4点を伺います。 1).これはキャッシュとは異なるものでしょうか? 2).異なるのであれば具体的にどのようなシステムで検索結果に表示されるのでしょうか? 3).METAタグや.htaccessでの対策は的外れなものでしょうか? 4).的外れであれば、METAタグや.htaccess以外の効果的な検索避け対策があればご教示いただきたいです。 1点でもご存知のものがあれば情報頂けますとうれしいです。 よろしくお願いいたします。 -------------------------------------------------- ◇参考までに◇  現在の検索避け対策は、下記METAタグ記載(サイト内全ページ)のみです。 <meta name="robots" content="none"> <meta name="robots" content="noindex,nofollow"> <meta name="robots" content="noimageindex"> <meta name="robots" content="noimageclick"> <meta name="robots" content="noarchive">

  • HTMLにこのような

    記述があります。 --------------------------------------------------- <META name="ROBOTS" content="NOINDEX"> <META name="ROBOTS" content="NOFOLLOW"> <META name="ROBOTS" content="NOINDEX, NOFOLLOW"> <META name="ROBOTS" content="NONE"> <META name="robots" content="noindex"> <META name="robots" content="nofollow"> <META name="robots" content="noindex, nofollow"> <META name="robots" content="none"> ----------------------------------------------- これはどんな記述でしょうか?巡回ロボットを回避する 記述でしょうか? 自分でこれを記述した記憶がありません。

    • ベストアンサー
    • HTML
  • 検索エンジンの登録を制限するメタタグについて

    <META NAME="ROBOTS" CONTENT="NONE"> <META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW"> そのページと、そこからリンクしている全てのページを制限する。 ------------------- これは、検索エンジンの登録を制限するメタタグですが、事情があって、Google検索エンジンのみ登録を拒否するソースが欲しいのです。可能でしたら教えてください。 Google検索エンジンだけが、一部のページを違反行為とみなしたのか、そのURLのサイトが著しく登録制限を受けているようです。ページの性質から内容の変更が難しく、また他の検索エンジンでは順調に登録されていることから、上のメタタグは使えません。 よろしくお願いします。

専門家に質問してみよう