• 締切済み

METAを無視する検索エンジン?

検索エンジンのロボットを排除するMETAタグがありますが、もしこれを無視して収集する検索エンジンを作ったらどうなるのでしょうか?マナー違反以上の何か問題点がありますか?

みんなの回答

回答No.1

私が持っているHTML辞典によると、実際にあるそうです。 そのような場合には、サーバー側に"robots.txt"というファイルを置いてもらうそうです。

関連するQ&A

  • METAタグと検索エンジン登録について

    ホームページが完成したので、エンジン登録しようと思うのですが、2,3質問があります。 1. SEOでMETAタグが有効(全てでは無いようですが)ということですが、そのタグはTOPページのみでいいのですか?他にテーマのあるページがありますが、それぞれMETAタグを記述したほうがいいのでしょうか? 2. ディレクトリー型検索エンジンへ登録すれば、googleなどで検索されやすくなると聞いたのですが、googleで「ディレクトリ型検索エンジン」で検索かけるとやたら検索エンジンが出てきます。yahooやdmozしか知らなかったのですが、手当たり次第ディレクトリ型検索エンジンに登録した方が効果があるのですか?  宜しくお願いします。 宜しくお願いします。

  • 検索エンジン用METAタグについて

    http://www.juraihelm.com/NNR/ (1)<META NAME="ROBOTS" CONTENT="NONE"> <META NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW"> そのページと、そこからリンクしている全てのページを制限する。 (2)<META NAME="ROBOTS" CONTENT="INDEX,NOFOLLOW"> そのページのみを許可し、そこからのリンクを制限する。 index.htmlに使うと便利。 (3)<META NAME="ROBOTS" CONTENT="INDEX"> そのページの登録を許可する (4)<META NAME="ROBOTS" CONTENT="NOINDEX,FOLLOW"> そのページを制限し、そこからのリンクを許可する。 このような使い方は普通しない。 (5)<META NAME="ROBOTS" CONTENT="ALL"> 下の階層ページの巡回を許可する。 このような設定は、わざわざすることでもない。 ---------------------------------------- 上は検索エンジン用METAタグの説明サイトです。 今回、ホームページの一部をアップロードします。同様のファイルが並列的に同じフォルダーの中に約40個あります。相互にリンク設定もあります。 この場合、放置すると、それぞれ個別に検索ロボットが拾い上げ、ヒット効率が著しく低下します。これらのうち、一つのページだけ検索エンジンに掲載され、他は載らないようにMETAタグを設定したいのです。 ■(4)のタグを設定しようと思いますが、これでいいのでしょうか。「このような使い方は普通しない。」という記載が気になります。 ■「そこからのリンクを制限する」とは、リンクしたページの拾い上げもしないということでしょうか。 教えてください。

  • 検索エンジンの検索結果について

    GoogleやYahoo、MSNをはじめとする大手検索エンジンは、検索エンジンロボットにより、個人の作成したホームページや画像などを収集し、検索結果に表示しています。 検索エンジンにおける検索結果についてですが、検索エンジンロボットが勝手に収集した内容を勝手に公開していることについて、法律にふれることはないのでしょうか? 例えば、Aさんが作成したイメージを、Bさんが勝手にホームページに使ったら著作権違反になりますよね? 上記は、考え方によっては、検索エンジンのイメージ検索にも当てはまり、ロボットが取得したイメージを勝手に公開しているというようにも考えることができると思いますが、どうなのでしょうか? 考え方によっては、検索エンジンは、作成者の許諾を得て、掲載しているわけではないので、著作権違反にあたるのではないでしょうか? 検索エンジンの検索結果を制限するrobots.txtなどもありますが、これは検索エンジンが勝手に作った規則ですよね? ホームページの作成者は、そんなの知らないし、理解もしなければ、完全に検索エンジンの検索結果は、著作権違反ということになるとも思えるのですが。 疑問に思いました。よかったら教えてください。

  • ロボット検索エンジン対策に404header

    htaccessでパスワード制限するほどでもなく、urlを打てば誰でも入ってきてもいいしリンクはされてもかまわない。だが主要な検索エンジンに載らないような準非公開サイトを作りたいと思っています。完全にボットを排除することができないことは承知しています。 予めボットに回収されないようにrobot.txtやhtaccessで主要な検索ロボットを排除、htmlヘッダーにもボット対策のMETAタグを入れています。それでも外国製のボットは回収しているみたいで現在、普通に存在するページに404ヘッダーを入れて表示させているのですが、 この404ヘッダーが原因で普通に閲覧してくる人に対してなんらかの問題が生じることってありますでしょうか。404ヘッダーをハック的に使っているのでウイルス対策ソフトで警告が出たりブラウザで警告が出たりする可能性はどうなのか意見を頂きたいです。

    • ベストアンサー
    • PHP
  • METAタグの言葉で検索したところ・・

    METAタグの言葉でgoogleの検索エンジンで 検索したところ、HP名とMETAタグの一部で検索すると HITするのですが、HP名を含まないMETAタグの内容で 検索するとHITしません。 METAタグはちゃんとHPのindexにはいっているのですが・・ どうるればHITしますか?

  • metaタグについて

    METAタグにて keywords、descriptionを設定し、 ロボット検索は以下のように設定致しました。 <meta name="robots" content="index,follow" /> <meta name="robots" content="noarchive" /> <meta name="robots" content="noimageindex" /> 問題は下の二つなのですが、noarchiveにてキャッシュされないように、noimageindexにてそのページ内の画像は検索されないようにしました。 このような設定でグーグルなどの検索エンジンにはひっかかりますでしょうか? よろしくお願い致します。

  • 検索エンジンへのHIT

    自作HPをGoogle,Yahoo,gooなどの 検索エンジンにHITさせる様にしたいと考えています。 Googleは、ロボット検索で、リンクの数やクリック数に応じて上位表示。(metaタグを利用) Yahooは、登録されているサイトを最初に検索、なにもHITしない様であれば、Googleを利用。 と思っていたのですが、知人に聞いた所、Googleも 登録しないとロボット検索の対象にならないとか言われました。 Googleもいくら、metaタグを利用を利用しキーワード指定をしても、登録しない限り検索の対象にならないのでしょうか?

  • 検索エンジンのことで

    自分のホームページを検索エンジンに過去に登録しましたが、META TAGのところで、タイトルやキーワードを変更した場合、ロボット型のエンジンなら自動的に見に来てくれるのでしょうか?その辺のコツを教えてください。 また、URLの転送型でホームページを持っているとき、 実際のファイルが入っているURLを登録しないといけないのでしょうか? 一発太郎とか以外に最近のすぐれた一括登録するところ も教えていただければ有難いのですが。

  • ロボット型検索エンジンの検索方法

    ロボット型検索エンジンは、一体どういう仕組みで検索されているのでしょうか? サイトによっては、METAタグを拾っているようですけど、 私はMETAタグは一切入れていません。 それでもアクセス解析を見るとGoogleやYahoo、Infoseekなどなどの検索サイトから とんできている人が結構います。 (各サイトに登録もしていません) また、私は全ページをPHPで作成をし、 MySQLからデータを取って表示するという動的ページにしています。 私の認識では、動的ページは、検索エンジンに引っかからなかったと思うのですけど、 どうやら、ログを見ると、動的ページすら引っかかっているようなのですけど…。 (さすがに引数が必要なページでは引数は拾ってませんが) 単なる素朴な疑問ですので、 詳しい方、お時間のある時にでも教えてください。 又は、詳しいサイトがあったらURLを教えてください。

  • どの検索エンジンでも検索されないのでしょうか?

    <meta name="robots" content="noindex"> <meta name="robots" content="nofollow"> このタグをソースに居れていれば URLをダイレクトに打たない限り どの検索エンジンでも検索されないのでしょうか?

    • ベストアンサー
    • HTML

専門家に質問してみよう