• ベストアンサー

ロボット検索による自動収集に関して

サイトを運営して間もないのですが、検索にはトップでヒットしたりしているようです。 しかし、意図としないかんじでヒットしているようです。 そこで少しでもと思い、少し調べると「ロボット検索による自動収集させない方法(タグ)」があることを知りました。 もちろん、完全にそうなるとは思っていません。 少しでもと思っているだけです。 でも、タグに関しては一切知識はありません。 http://www.tagindex.com/html_tag/page/meta_03.html ↑こちらを見ての疑問なのですが、 1:どこに組み込めばいいものなのか? 以下が、運営しているサイトの一部です。 <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> <HTML> <HEAD> <META http-equiv="Content-Type" content="text/html; charset=Shift_JIS"> <META name="GENERATOR" content="IBM WebSphere Studio Homepage Builder Version 8.0.0.0 for Windows"> <META http-equiv="Content-Style-Type" content="text/css"> <TITLE>***</TITLE> </HEAD> <BODY link="#ff0000" vlink="#0000ff" alink="#cc00cc"> ↑これのどこを変更すればいいのでしょうか? 「META」に関して、3つあるのですが・・・。 2:貼り付けたURLにある、「リンク先ページの収集を許可しない指定」ですが、 今のリンクは、「A⇔B⇔C⇔D→Aに戻る」にしています。 (AからC以降飛ぶように設定していません) もし、Bに「リンク先ページの収集を許可しない指定」のタグを組み込めば、Aも収集されないということになるのですか? (Aだけは収集するようにし、B以降は収集させないようにしたいのです) この場合は、各ページに「リンク先収集」ではなく、そのページの収集を許可しない指定をタグに組み込んだほうがいいのでしょうか? 宜しくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
回答No.1

<head>と</head>の間ならどこでも良いです。 見た目の問題で、 <META http・・・ <META http・・・ <META http・・・ <META NAME="Robots" CONTENT="noindex, nofollow"> と揃えて追加してください。 私はロボット検索されたくないWEB全てに禁止を入れています。これをしていなかったために変なページが検索サイトに登録されて困ったことがありました。

himeyuri
質問者

お礼

早速ありがとうございます。 >ならどこでも良いです。 どこでもいいのですか^^ でも、疑問が・・・。 質問に貼り付けたタグの、3つのMETAは消さなくて(削除)いいのでしょうか? 4つ目のMETAとして組み込めばOKですか? >変なページが検索サイトに登録されて困ったことがありました。 そうなんです。まさにこれです>< すべてのページにHOMEに返るようにリンクを貼っていないので&1ページを長~く作成していなくて(重たくなるから&読む気がしなくなりそうだから&他にも)、 途中のページには「画像だけ」というページもあるんです。 そのページがヒットしてもさっぱりわからないと思います^^; 検索でこんなことになるとは知らずにいました・・・。

himeyuri
質問者

補足

あっ!「追加してください」ということですね。 すいません、その部分だけ読むのを飛ばしていました>< ありがとうございました。

その他の回答 (1)

  • Java-Java
  • ベストアンサー率41% (14/34)
回答No.2

Googleの場合は、URL削除の申請をする事で、素早く検索結果から消す事が出来ます。 http://services.google.com:8882/urlconsole/controller その他「robots.txt」を使う方法があります。 http://www.juraihelm.com/NNR/ http://jeff.ecjapan.jp/archives/000102.html <META NAME="Robots" CONTENT="noindex, nofollow">と、上記の2つを組み合わせて使えば、収集されにくくなります。

himeyuri
質問者

お礼

ありがとうございます。 取りあえず、 <META NAME="Robots" CONTENT="noindex"> と各ページに貼り付けました。 ページ数が多いので、「これらだけは検索にヒットしないように」と思っているものだけに対処はしました。 残りは、リンクなども考慮して対処していこうと思ってます。 申請もあるんですね。 教えていただいたURLをじっくり、ゆっくり読んでみます。 ありがとうございました^^

関連するQ&A

専門家に質問してみよう