• 締切済み

ホームページを検索にひっかけたい。

非常にまぬけな質問で申し訳ないのですが、 数年前に私が作っていたホームページを発見しなければならなくなったのですが、アドレスやら、どこのサービスを使っていたかなどすっかり忘れてしまいました。 しかし、以前私が作ったホームページは <META NAME="ROBOTS" CONTENT="INDEX,NOFOLLOW"> が入っていたため、ほとほと困り果てております。 私のホームページは特徴があるため、 自分で発見に適した検索ロボットを作りましたが、 <META NAME="ROBOTS" CONTENT="INDEX,NOFOLLOW"> のせいか、一向に見つかりません。 どなたか有効な方法を ご存知の方いらっしゃいませんでしょうか?

  • Pmaru
  • お礼率57% (4/7)
  • Perl
  • 回答数2
  • ありがとう数1

みんなの回答

  • naoto0314
  • ベストアンサー率34% (25/73)
回答No.2

<META NAME="ROBOTS" CONTENT="INDEX,NOFOLLOW"> は検索を許可し、リンク先をたぐることは禁止と言う意味になります。 つまり、ページが存在すれば検索できます。 おそらく、更新がされていないなどを理由に削除された可能性があります。 HTMLファイルがあるのなら、そこからURLのヒントを探してみるのはどうでしょうか? 例えば、http://からはじまるアドレスを書いていないかとか。 FTPサーバー名がわかるならFTPサーバー名を検索したり。 googleなどで検索を行なうなら、ページタイトルを入れたり 見つける方法はちょっと考えればたくさんでてきます。とにかく、まずはヒントを集めたほうがいいと思います。

  • RZ350RR
  • ベストアンサー率27% (444/1615)
回答No.1

設定されたmetaタグはこのページを登録する。 ページ内のリンク先を巡回しないとなっています。 全く引っかからないようにするにはcontent="noindex,nofollow"です。 ただし、このようなmeta設定でも無視する検索ロボットはいます。 検索エンジンにない、サービス名を忘れたようだったら、コンテンツごと完全に消されたのではないでしょうかね?

Pmaru
質問者

お礼

お忙しい中、ご回答ありがとうございます。 恐縮です。 このようなMETA設定を無視して検索結果を持ってくるにはどのようなプログラムを書けばいいのかご存知ありませんか? コンテンツごと消された可能性は否めませんが、生きてる可能性はあるかと思います。というか、どうしても必要なことなので諦めきれないのが心情なのですが(;;)

関連するQ&A

  • ホームページのロボット制御について

    ホームページのロボット制御について疑問があります。 index.html(トップページ)だけはロボットの登録対象にしたいが、その他の全ページは すべて登録対象にしない場合のメタタグについてなんですが、調べたら index.html(トップーページ)には <META NAME="ROBOTS" CONTENT="NOFOLLOW">を記述しこのページを登録対象にし、かつこのページのリンクを辿らないようにする。 それ以外のファイルはすべて <META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">と記述すると書いてありました。 しかし、そもそもindex.htmlに記述したメタタグによってindex.htmlページ内のリンクを辿らないわけなので、その他のファイルにあえてメタタグを何も書かなくてもその他のファイルはindex.htmlから辿られず、インデックス化されない気がするんですがどうなんでしょうか? a.htmlやb.htmlなどその他の全ファイルにも <META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW">と記述しないといけないんですかね?

    • ベストアンサー
    • HTML
  • HTMLにこのような

    記述があります。 --------------------------------------------------- <META name="ROBOTS" content="NOINDEX"> <META name="ROBOTS" content="NOFOLLOW"> <META name="ROBOTS" content="NOINDEX, NOFOLLOW"> <META name="ROBOTS" content="NONE"> <META name="robots" content="noindex"> <META name="robots" content="nofollow"> <META name="robots" content="noindex, nofollow"> <META name="robots" content="none"> ----------------------------------------------- これはどんな記述でしょうか?巡回ロボットを回避する 記述でしょうか? 自分でこれを記述した記憶がありません。

    • ベストアンサー
    • HTML
  • 検索避けのメタタグの数と効果

    現在は、3個程度入れているのですが、とあるサイトで下記くらい入れることをオススメされていました。 <META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW"> <meta NAME="ROBOTS" CONTENT="NOINDEX"> <meta NAME="ROBOTS" CONTENT="NOFOLLOW"> <meta NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW"> <meta NAME="ROBOTS" CONTENT="NONE"> <meta NAME="robots" CONTENT="noindex"> <meta NAME="robots" CONTENT="nofollow"> <meta NAME="robots" CONTENT="noindex, nofollow"> <meta NAME="robots" CONTENT="none"> <meta NAME="LIBWWW-PERL" CONTENT="NOINDEX"> <meta NAME="LIBWWW-PERL" CONTENT="NOFOLLOW"> <meta NAME="LIBWWW-PERL" CONTENT="NOINDEX,NOFOLLOW"> <meta NAME="LIBWWW-PERL" CONTENT="NONE"> <meta NAME="libwww-perl" CONTENT="noindex"> <meta NAME="libwww-perl" CONTENT="nofollow"> <meta NAME="libwww-perl" CONTENT="noindex,nofollow"> <meta NAME="libwww-perl" CONTENT="none"> <META http-equiv="robots" content="noindex"> <META http-equiv="robots" content="nofollow"> <META NAME="GOOGLEBOT" CONTENT="NOINDEX, NOFOLLOW"> <META NAME="GOOGLEBOT" CONTENT="NOARCHIVE"> <META NAME="GOOGLEBOT" CONTENT="NOSNIPPET"> <meta name="robots" content="noimageindex"> <meta name="robots" content="noimageclick"> <meta name="Expires" content="August 31, 2003"> 3個程度と上のタグを全部入れるのとでは、やはり違ってくるのでしょうか? 手間ではないので、効果があるのなら入れたいと思っています。 どうぞ宜しくお願い致します。

  • ロボット検索の拒否ができない。

    ホームページをフレームで作成しているのですが、 indexのみが検索にかかるようにしたいと思い、 他のページには下記のタグをいれました。 <HEAD>~</HEAD>に <META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW"> しかしロボット検索に単体ページで引っかかるのです。 なにか違っていますか? ロボット検索の拒否ができない訳は外になにかあるのでしょうか。 教えてください。

  • インデックスに登録されたページの総数

    ページ内に <meta name="robots" content="noindex"> <meta name="robots" content="nofollow"> を入れてるのですが ウェブマスターツールで インデックス ステータス 昨年のデータを表示 を見たら、 インデックスに登録されたページの総数 308 となっています。 これはどういう事でしょうか? <meta name="robots" content="noindex"> <meta name="robots" content="nofollow"> はクロールされないためのソースだと思っていたので インデックスに登録されたページの総数は、0になると思っていたのですが。 ちなみにトップページだけではなく 全てのページに <meta name="robots" content="noindex"> <meta name="robots" content="nofollow"> を入れています。

    • ベストアンサー
    • HTML
  • 検索エンジン用METAタグについて

    http://www.juraihelm.com/NNR/ (1)<META NAME="ROBOTS" CONTENT="NONE"> <META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW"> そのページと、そこからリンクしている全てのページを制限する。 (2)<META NAME="ROBOTS" CONTENT="INDEX,NOFOLLOW"> そのページのみを許可し、そこからのリンクを制限する。 index.htmlに使うと便利。 (3)<META NAME="ROBOTS" CONTENT="INDEX"> そのページの登録を許可する (4)<META NAME="ROBOTS" CONTENT="NOINDEX,FOLLOW"> そのページを制限し、そこからのリンクを許可する。 このような使い方は普通しない。 (5)<META NAME="ROBOTS" CONTENT="ALL"> 下の階層ページの巡回を許可する。 このような設定は、わざわざすることでもない。 ---------------------------------------- 上は検索エンジン用METAタグの説明サイトです。 今回、ホームページの一部をアップロードします。同様のファイルが並列的に同じフォルダーの中に約40個あります。相互にリンク設定もあります。 この場合、放置すると、それぞれ個別に検索ロボットが拾い上げ、ヒット効率が著しく低下します。これらのうち、一つのページだけ検索エンジンに掲載され、他は載らないようにMETAタグを設定したいのです。 ■(4)のタグを設定しようと思いますが、これでいいのでしょうか。「このような使い方は普通しない。」という記載が気になります。 ■「そこからのリンクを制限する」とは、リンクしたページの拾い上げもしないということでしょうか。 教えてください。

  • ロボット検索を拒否したい。

    教えて下さい。 ロボット検索を拒否したいと思いましてHPの各ページに <meta name="robots" content="noindex,nofollow"> を入力してロボット検索を拒否しています。 ただしトップページだけはYahooで検索されてしまいます。 最近<meta name="robots" content="noarchive">も追加したのですが、 検索されてしまいます。 何か原因は考えられますでしょうか?

    • ベストアンサー
    • HTML
  • ロボット検索にかからないようにするには?

    HPを作ろうと思うのですが 個人的なページで、内輪だけで楽しみたいページにしたいと思っています。 ですが、聞くところによると勝手にロボットが検索しに来るとか。 それで、それを避けるには <head>~</head>間に <META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW"> <META NAME="ROBOTS" CONTENT="NOARCHIVE"> というようなタグを入れる方法があるというところまでは分かったのですが このタグは、ページごとに全部入れないといけないのでしょうか?

  • どの検索エンジンでも検索されないのでしょうか?

    <meta name="robots" content="noindex"> <meta name="robots" content="nofollow"> このタグをソースに居れていれば URLをダイレクトに打たない限り どの検索エンジンでも検索されないのでしょうか?

    • ベストアンサー
    • HTML
  • ロボット巡回対策のMetaタグに関する質問です。

    ロボット巡回対策のMetaタグに関する次のサイトについて質問です。 http://heo.jp/tag/page/key.html ■ ロボット巡回対策 <Meta Name="ROBOTS" Content=""> <Meta Name="ROBOTS" Content="INDEX,FOLLOW"> INDEX,FOLLOW・・・・このページもページからのリンク先も許可。 <Meta Name="ROBOTS" Content="INDEX"> INDEX・・・・このページのみ巡回許可。 <Meta Name="ROBOTS" Content="NONE"> NONE・・・・このページもそこにあるリンク先全てを巡回禁止。 <Meta Name="ROBOTS" Content="NOINDEX"> NOINDEX・・・・このページのみ巡回禁止。 <Meta Name="ROBOTS" Content="NOFOLLOW"> NOFOLLOW・・・・このページは巡回許可、リンク先巡回禁止。 <Meta Name="ROBOTS" Content="ALL"> ALL・・・・下の階層の巡回を許可。 ------------------------------ ★★質問★★ 自分のサイト内を全て巡回禁止にしようと思います。最も簡単な方法を取りたいのですが、上の説明から類推すると、 <Meta Name="ROBOTS" Content="NONE"> NONE・・・・このページもそこにあるリンク先全てを巡回禁止。 これでよさそうですが、ここで言う「リンク先全て」とは、「下の階層全て」と考えていいのでしょうか。それとも文字通り他のサイトであろうとなかろうとリンク先全てということでしょうか。 それとも別に適切な記述がありますか。 ★★希望 そのサイト内のページをホームページ「...index.html」に巡回禁止の記述をすれば完璧にすべて巡回禁止になるようにしたいのです。 よろしくお願いします。

    • ベストアンサー
    • HTML

専門家に質問してみよう