締切済み

グーグルの検索エンジンについて

2013/07/07 22:07

グーグルの検索エンジンについて質問があります。このエンジンはロボットがクロールする際、あらゆるURLにGETリクエストをおこない膨大なHTMLのキャッシュをかき集めていくと思いますが、その際、ロボットはリクエストを投げてHTTPレスポンスを受け取るのだとおもいますが質問１. このときレスポンスコードが200,300,400,500系それぞれ問わずキャッシュを行っているのでしょうか?一般的にドメインの永久転居の場合301ヘッダーを返すため、300系はキャッシュするのだろうなと想像できます、が400系500系もキャッシュしているのでしょうか？質問2. また、レスポンス２００を受け取り、さあHTTPリクエストのボディ部分・・つまり肝心の HTMLデータを取得する際、完全にHTMLノ読み込みが完了するまでそのURLに滞在しているのでしょうか？言い換えると,ロボットはかならずJavaScriptの【onload】イベントが発生後のコンテンツをキャッシュしているのでしょうか？上記2点について、検索エンジンにお詳しいかたご教授ください。よろしくお願いします。