検索エンジンにミラーサイトと誤解されないための方法

このQ&Aのポイント
  • 検索エンジンにはミラーサイトと誤解されないようにするための手法がありますか?
  • アクセス元を知るために、リンクするURLに番号を振ることはできますが、検索エンジンがこれを別のページと誤解する可能性があるのはどうしてでしょうか?
  • id=XXXXの部分を無視させるなど、検索エンジンに誤解されないようにする方法はありますか?
回答を見る
  • ベストアンサー

検索エンジンにミラーサイトと誤解されないためには?

アクセス元を知るために、リンクするURLにこのように番号を振りたいと思います。 http://www.test.co.jp/index.php?id=100 これは、下記のようなURLでもまったく同じページが表示されます。 http://www.test.co.jp/index.php?id=1001 http://www.test.co.jp/index.php?id=2002 この手法で一つ気になるのが、検索エンジンがこれを別のページと誤って解析し、ミラーサイトと誤認してしまわないだろうかということです。 id=XXXXの部分を無視させるなど、検索エンジンに誤解されないようにする手法はないものでしょうか?

質問者が選んだベストアンサー

  • ベストアンサー
  • PU2
  • ベストアンサー率38% (1101/2843)
回答No.1

たぶんミラーとか関係なく番号ふった方のアドレスは全て無視され 番号振られていない本来のページだけ対象にされると思います。 アクセス元知るためには他に方法ありますよ なぜそのようにする必要あるのですが?

petisuke
質問者

補足

ありがとうございます。 アクセス元を得るためにあえてこの手法を選んだのは、確実にアクセス元を取得したかったためです。 リファラを利用するのは、隠蔽されている場合に取得ができないのでいやだったのです。

関連するQ&A

  • ロボット型検索エンジンの検索方法

    ロボット型検索エンジンは、一体どういう仕組みで検索されているのでしょうか? サイトによっては、METAタグを拾っているようですけど、 私はMETAタグは一切入れていません。 それでもアクセス解析を見るとGoogleやYahoo、Infoseekなどなどの検索サイトから とんできている人が結構います。 (各サイトに登録もしていません) また、私は全ページをPHPで作成をし、 MySQLからデータを取って表示するという動的ページにしています。 私の認識では、動的ページは、検索エンジンに引っかからなかったと思うのですけど、 どうやら、ログを見ると、動的ページすら引っかかっているようなのですけど…。 (さすがに引数が必要なページでは引数は拾ってませんが) 単なる素朴な疑問ですので、 詳しい方、お時間のある時にでも教えてください。 又は、詳しいサイトがあったらURLを教えてください。

  • Googleの検索エンジンで、サーバーURL非表示

    Googleの検索エンジンで、 ホームページURLと同じページ内容のサーバーURLが検索表示されてしまいます。 検索結果に、サーバーURLを表示させない方法を教えてください。 (例) ホームページURL: http://ドメイン名/index.php サーバーURL: http://サーバアドレス名/フォルダ名/index.php よろしくお願い致します。

  • 検索エンジンにホームページが登録されなくて困っています。

    検索エンジンにホームページが登録されなくて困っています。 クラブ(音楽の方)のサイトを公開してから1年ほど経過しています。 いくつもの他のブログやらサイトなどからリンクを受けているのにも関わらず、yahooやgoogle検索を掛けても引っかからないのです。(何回かクロール申請は出してます。) site://~で検索してみるとgoogleは下層ページのみ、yahoo皆無。 サーバーはAKIRAインターネット 原因かも知れない事: ・yahooサイトエクスプローラーでサイト認証が失敗する ・googleウェブマスターツール [サイトの追加]→[サイトの確認]で失敗するエラー403 ・phpで動的にページ生成しhtaccessで静的に見せている。内容以下 RewriteEngine On RewriteRule ^([^/]+)/$ index.php?page=$1 RewriteRule ^([^/]+)/([^/]+)/$ index.php?page=$1&y=$2 RewriteRule ^([^/]+)/([^/]+)/([^/]+)/$ index.php?page=$1&y=$2&m=$3 RewriteRule ^([^/]+)/([^/]+)/([^/]+)/([^/]+)/$ index.php?page=$1&y=$2&m=$3&d=$4 RewriteRule ^([^/]+)/([^/]+)/([^/]+)/([^/]+)/([^/]+)/$ index.php?page=$1&y=$2&m=$3&d=$4&id=$5 以上になります。 どんな原因が考えられるでしょうか。 サーバーがクローラを拒否しているとかあるのでしょうか? どなたか何か情報お願いします。

  • 特定のページを検索エンジンにインデックスしない方法

    特定のページを検索エンジンにインデックスしない方法として meta文に noindex 等をしたり、robots.txtを設定すれば良いのですが、 それとは別に、meta文や robots.txt の一切設定できないサーバーで、 かつ、他のページは通常通りインデックスさせなければいけないのですが 特定のページをインデックスしない方法はありますでしょうか? そのページはphpで生成されており、?xxxx=xxxのようなものもアドレスに含みます。 #極端な話、「特定のokwaveの質問回答をgoogle等から検索できないようにできませんか?」と  同じ部類の質問です。 よろしくお願いします。。

    • 締切済み
    • SEO
  • 検索エンジンについて

    1)検索エンジンへホームページURLの登録をするのにトップページでなく、間違って違うページのURLで登録した場合、再度、トップページURLで再登録してもいいものでしょうか? 2)検索エンジンの上位に検索される条件は、メタタグ以外になにかあるのでしょうか? どなたか教えて下さい。

  • 動的URLのサイト内検索について

    サイト内検索を設置したいのですが、 動的URL部分の検索がうまくいきません。 どうすればよいでしょうか? ■試したこと 無料で配布されている「Web Search(Web Liberty)」、「PHP Search(PHP Labo)」、「msearch」をそれぞれ設置してみたのですが、何れも通常のphpページの検索結果は反映されるものの、動的URL部分の検索結果phpページが反映されません。 ※動的URL…details.php?id=1 みたいなイメージです。 なんで反映されないのかがよく分かりません。 「通常のPHPファイル」「動的URLを生成するPHPファイル」に違いはあるのでしょうか? ・通常のPHPファイルは、ローカルファイル? ・動的URLは、リモートのファイル? そもそもPHPはサーバー側で生成される(?)ので、通常のPHPファイルだろうが、動的URLだろうが、同じだと思うのですが、なんで、挙動に違いが出るのか(動的URL部分が反映されないのか)が分かりません。 あるいは、動的部分にAJAXも一部利用しているので、その影響でしょうか? 他の手段として、Googleを利用するぐらいしか思いつかないのですが、 ページをなかなかインデックス化してくれないため、 何か違う方法を探しています。 「動的URL部分のサイト内検索」を設置するに辺り、注意した方がよい点(そもそもどういう風に考えればよいか)や、何かよい方法等、この質問見て気がついた点があれば、アドバイスをよろしくお願いします。

    • ベストアンサー
    • PHP
  • 検索エンジンへの登録

    google以外の無料検索エンジンには全て登録できたのですが、googleだけが何度登録しても検索エンジンに反映されません。 URLと備考及び映し出されている英文字を入力して登録をクリックしても画面が白くなるばかりです。 どなたか詳しい方がおられましたら教えていただけないでしょうか。 尚、URLはTOPページのものをいれています。 TOPページはロボット型に対応しています。 URLは http://www.d5.dion.ne.jp/~animal.r/index.html です。

  • 検索エンジンのHTML解析について

    Googleなどの検索エンジンの仕組みについて教えてください。 Googleなどは色々なサイトを巡回し、HTML、又はXMLを取得していると思います。 その場合、そのページのHTMLコードなど全てをデータベース等に格納しているのでしょうか? それとも本文のテキスト部、リンク部など分けて格納しているのでしょうか? JavaScript部やコメント部等は確実に除去していると思いますが。 htmlのタグがあると文章解析は出来ないと思うので色々と除去していると思いますが、 その場合難しいのはどこが本文かは各サイトの構造によって違うことです。 人間が各サイトを解析して設定すれば出来るのでしょうが、Google位になると確実に現実的には不可能だと思います。 自分の想像力が足りないだけでしょうが、一体どのようにしてHTML文書を解析し次の段階(インデックス作成など)へ進むのか分かりません。 すみませんが教えて頂けないでしょうか? 関係ないとは思いますが、一応自分の環境だけは書いておきます。 centOS6 , PHP5.3などです。

  • 検索エンジンロボットはPHPタグが見えるのか?

    検索エンジンロボットはPHPタグが見えるのか? googleやMSNなどの検索エンジンロボットは、PHPのタグを読んでプログラムを見ているのでしょうか、それともサーバ側でPHPのプログラムが処理された結果しか見れないのでしょうか? たとえば下記のようなページを用意したとして、 ----------- A. webページHTML index.php <p>鉛筆</p> <p>ノート</p> <p><?php include("file.php"); ?></p> -----------  ----------- B. fine.php 秘密のファイル -----------  ----------- C. ブラウザで見えるindex.php 鉛筆 ノート 秘密のファイル -----------  人間がブラウザでアクセスする時も、検索エンジンロボットのキャッシュも、Cのように見えます。 検索エンジンロボットが、index.phpのpタグ3行目が外部PHPファイルを読み込んでいると分かっているのかどうか知りたいです。 お分かりの方、よろしくお願いいたします。

  • アクセス解析の検索エンジンのリンク元が…

    candy-cgiのAnalyzer Type1というアクセス解析を使っております。 http://www.candy-cgi.com/ 検索エンジンのリンク元の表示がされません。 yahooやgooに関してはリンク元が「none」と表示されます。 googleに関してはリンク元はgoogleのページが開きますが検索語は表示されません。 検索エンジンの仕様が変わって検索語は解析できなくなってきているのでしょうか? これはどのCGIを使っても無理なのでしょうか?