sitemap.xml ファイルの意味と削除について
- サイトのxhtml化を進める中で、突然作られた sitemap.xml ファイルについて疑問が生じました。
- このファイルは検索エンジンにサイトの内容を通知するためのものであり、削除する必要はありません。
- しかし、個人的な情報が含まれている場合は、metaタグやrobots.txtで非表示にするよう設定することをおすすめします。
- ベストアンサー
sitemap.xml と言うファイル
今、サイトのxhtml化をボチボチと進めています。 先ほどホームページビルダーにて更新したファイルを一括で転送しようと思ったところsitemap.xmlというファイルが含まれていることに気付き、「なんだろう?」と思って(今朝までなかったです)確認したところ作られた日付は3日前の26日でした(サイトのxhtml化を始めた日だと思います)。調べたところ検索に引っかかりやすくなるファイル(?)ですか? 私はオンラインで闘病エッセイのようなものを執筆しているため、私の個人的な内容も書いてあるので <meta name="robots" content="noindex,nofollow,noarchive" />の一行とrobots.txtの設置(その後だんだん分かり始めてダイジェスト認証をかけました)。 極内輪の人しかHPの存在を知りません。 前置きが長くなりまたが、 1 sitemap.xmlなる作った覚えのないファイルがパソコン上になぜ作られたのか?(今朝まで一括転送ファイルの中にはなかったです。サーバーにもありませんでした。)…なんだか気持ち悪いので。 2 パソコン上にあるこのファイルは削除しても良いものか? 以上2点、どなたか分かる方、教えて下さい。
- HTML
- 回答数1
- ありがとう数1
- みんなの回答 (1)
- 専門家の回答
質問者が選んだベストアンサー
sitemap.xmlは、自サイト内の各ページを検索エンジンに案内してクロールしてもらう為のファイルです。 おそらく、ソフト側で生成したと思いますが(そのソフトの仕様・仕組みは知りませんが)、不要なら削除しても構いません。 認証しているならアップロードしても検索には察知されませんが、意味の無いファイルとなります。
関連するQ&A
- XHTML1.0strictで検索にかかりたく無い時の記述は?
以前書いていたHTMLサイトをXHTML1.0strictまたは、 XHTML1.1に変更しようとしています。 友達と内輪なサイトを作って、パソコンの勉強に使って いるので、検索にかかりたくないと思い、 <meta name="robots" content="noindex,nofollow" /> を記述しようとしたのですが、非推奨だと気付きました。 この場合、どのような方法が望ましいのでしょうか?
- ベストアンサー
- HTML
- ロボット検索にかからないようにするには?
HPを作ろうと思うのですが 個人的なページで、内輪だけで楽しみたいページにしたいと思っています。 ですが、聞くところによると勝手にロボットが検索しに来るとか。 それで、それを避けるには <head>~</head>間に <META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW"> <META NAME="ROBOTS" CONTENT="NOARCHIVE"> というようなタグを入れる方法があるというところまでは分かったのですが このタグは、ページごとに全部入れないといけないのでしょうか?
- ベストアンサー
- その他(インターネット・Webサービス)
- PCとモバイルで同一URLのWebサイトのsitemap.xml
PC専用だったWebサイトを携帯にも対応させました。 PCと携帯は全く同じURLで、ユーザーエージェントにより表示内容を振り分けています。 そこで、携帯用のsitemap.xmlの扱いについて悩んでいます。 1.robots.txtの書き方 これまでは下記のように記載していましたが、このままで良いのでしょうか。 --------------------------------------------- User-agent: * Sitemap: http://www.*****.com/sitemap.xml --------------------------------------------- 通常はPC用のsitemap.xmlが表示され、携帯(クローラ含む)からアクセスすると携帯用のsitemap.xmlが表示されます。 2.ウェブサイトマスターでのsitemap.xmlの送信 PC用sitemap.xmlとして、http://www.*****.com/sitemap.xmlを送信していますが、 携帯用sitemap.xmlとしても、http://www.*****.com/sitemap.xmlを送信していいのでしょうか。 それとも、そもそもモバイル用と携帯用はファイルを分けた方がいいのでしょうか。 アドバイスいただけると助かります! 宜しくお願いします。
- ベストアンサー
- HTML
- xhtml エレメントの xpath 表記
xhtml 内で、例えば <meta name="robots" content="noindex,nofollow" /> の、content の部分を指す xpath 表記を教えて頂けますか? noindex,nofollow の部分を取り出したいのです。
- ベストアンサー
- XML
- 検索避けのメタタグの数と効果
現在は、3個程度入れているのですが、とあるサイトで下記くらい入れることをオススメされていました。 <META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW"> <meta NAME="ROBOTS" CONTENT="NOINDEX"> <meta NAME="ROBOTS" CONTENT="NOFOLLOW"> <meta NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW"> <meta NAME="ROBOTS" CONTENT="NONE"> <meta NAME="robots" CONTENT="noindex"> <meta NAME="robots" CONTENT="nofollow"> <meta NAME="robots" CONTENT="noindex, nofollow"> <meta NAME="robots" CONTENT="none"> <meta NAME="LIBWWW-PERL" CONTENT="NOINDEX"> <meta NAME="LIBWWW-PERL" CONTENT="NOFOLLOW"> <meta NAME="LIBWWW-PERL" CONTENT="NOINDEX,NOFOLLOW"> <meta NAME="LIBWWW-PERL" CONTENT="NONE"> <meta NAME="libwww-perl" CONTENT="noindex"> <meta NAME="libwww-perl" CONTENT="nofollow"> <meta NAME="libwww-perl" CONTENT="noindex,nofollow"> <meta NAME="libwww-perl" CONTENT="none"> <META http-equiv="robots" content="noindex"> <META http-equiv="robots" content="nofollow"> <META NAME="GOOGLEBOT" CONTENT="NOINDEX, NOFOLLOW"> <META NAME="GOOGLEBOT" CONTENT="NOARCHIVE"> <META NAME="GOOGLEBOT" CONTENT="NOSNIPPET"> <meta name="robots" content="noimageindex"> <meta name="robots" content="noimageclick"> <meta name="Expires" content="August 31, 2003"> 3個程度と上のタグを全部入れるのとでは、やはり違ってくるのでしょうか? 手間ではないので、効果があるのなら入れたいと思っています。 どうぞ宜しくお願い致します。
- ベストアンサー
- その他(インターネット・Webサービス)
- 検索よけをしても検索される
個人サイトを運営しているのですが、女性向け同人なので一般の方々にはあまり見ていただきたくありません。 なので検索除けタグを入れているのですが、何故か検索されてしまいます。 入れているタグは以下のものです。 <meta NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW,NOARCHIVE"> robots.txtの方も試したのですが、効果はありませんでした。 サーバーはジオシティーズです。
- 締切済み
- レンタルサーバ・ASP
- sitemap.xmlでINDEXファイルしか
サイトのサイトマップを自動作成したのですが、インデックスファイルしか記述されません。ホームページビルダーのビジュアルサイトビューをみるとちゃんとした階層構造になっており誤りなどありまん。しかし、sitemap.xmlをひらいてみるとトップページしか拾ってくれません。ビジュアルサイトビューではちゃんと三層構造となっているのに、インターネットで閲覧するとhttp://A.com/B.html/C.htmlとなるところが http://A.com/C.htmlの2層構造になっております。何が原因で、INDEXファイルしか記述されないのかわかりません。どなたかご教授お願いいたします。
- ベストアンサー
- ホームページ作成ソフト
- 検索避けのメタタグについて
http://oshiete1.goo.ne.jp/kotaeru.php3?q=1566119 上記と似た質問になるのですが、同じではないので、新しく質問させていただきます。詳しい方、宜しくお願いします。 http://help.yahoo.co.jp/help/jp/ysearch/slurp/slurp-04.html 上記URL先で、 『 下記のように2つ設定された場合は、タグが正確に解釈されない場合がありますのでご注意ください。 <META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW"> <META NAME="ROBOTS" CONTENT="NOARCHIVE"> 』 と書かれていました。 ということは、先に質問させていただいている件での、メタタグも有効ではないということになるのでしょうか? <META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW"> <META NAME="ROBOTS" CONTENT="NOARCHIVE"> このどちらかだけ、入れたほうが良いのでしょうか? 必ず、効くとはいえない方法みたいですが(先の質問と被りますが)多いのと少ないの、どちらがオススメでしょう? 宜しくお願い致します。
- ベストアンサー
- HTML
- 検索よけが反映されません
現在、二次創作のイラストサイトを運営しています。 1年ほど前につくったサイトですが、当時あまり検索よけについては 調べることもなく意味もわからずにいたので、 とりあえずあまり関係ないかな・・・という気持ちでいたのですが、 最近アクセス解析をみてみたらyahooからサイト名で検索すると1ページ目にのってしまっていてそこからサイトに来ている方がいることがわかりました・・・。これはまずいと思い検索よけができるタグを調べて <HEAD>のすぐ下に <META name="GOOGLEBOT" content="NOINDEX, NOFOLLOW,NOARCHIVE"> <META name="ROBOTS" content="NOARCHIVE,NOINDEX,NOFOLLOW"> 二行をつければ検索よけができると聞き全ページに タグをつけてアップロードしてみたのですが、 検索してみると前と変わらずに検索にひっかかってしまいます・・・。 1年もたってしまうと検索よけはできなくなってしまうのでしょうか? どうしたらいいかわかりません…。 。どうかアドバイスよろしくお願いします。
- ベストアンサー
- その他(生活・暮らし)
- 一度検索エンジンにかかると外せなくなるのですか?
私は創作系のサイトを持っています。検索除けのタグも正しく入力しているのですが、先日ヤフーの検索エンジンで自分のサイトの名前を入れてみたところ、検索されてしまいました。タイトルのタグの中の名前を変えたのですが、それでも検索されてしまいました。 一度検索エンジンにかかってしまうと、移転しなければ外されないのでしょうか?それとも私の使っている <meta NAME="ROBOTS" CONTENT="NOINDEX,NOFOLLOW,NOARCHIVE"> <meta NAME="GOOGLEBOT" CONTENT="NOINDEX,NOFOLLOW"> の効果がほとんど無いのが理由なのでしょうか? 原因のわかる方、教えていただけないでしょうか? ちなみに、BIGLOBEの検索エンジンにはかかりませんでした。
- ベストアンサー
- その他(インターネット・Webサービス)
お礼
ありがとうございます! 削除します。 勉強になりました。