• 締切済み

googleでの「日本語のページ」になる、ならないの理由は?

こんにちは。 首題の件に関して、質問いたします。わたしは、niftyにホームページを開設しています。 それで、googleでわたしのホームページのトップURLを入れて検索をしてみました。 googleでは、「ウェブ全体から検索」と「日本語のページを検索」のチェックボックスがあります。その両方で、検索を試した結果、「日本語~」の結果の方が、「ウェブ全体~」に比べて極端に少なかったのです。 ホームページのそれぞれのページは、外国語だけのページはなく、全てのページに日本語が含まれています。 また、似たような内容のページでも、「日本語~」の結果に含まれないのが多々あります。 このような現象はどのような結果で起こりうるのでしょうか? なお、それぞれのページには、下記のようなmetaタグを配置しております。 <meta name="keywords" lang="ja" content="~~~"> <meta name="classification" lang="ja" content="~~~"> <meta http-equiv="content-type" content="text/html; charset=Shift_JIS" /> <meta http-equiv="content-language" content="ja" /> わたしとしては、全てのサイト内のページを「日本語~」で検索してヒットされるようにしたいです。 どうか、よろしくお願いいたします。

noname#38071
noname#38071
  • HTML
  • 回答数4
  • ありがとう数6

みんなの回答

回答No.4

ANO.2お礼に対する補足です。 >個別のlang属性はなさっておられないのですね。 個別にlang属性を指定しないのは、既にhtmlタグにおいて、 「このページは日本語のページです(<html lang="ja">)」 と明示しているために、同ページ内では個別に明示する必要がない、と思われるからです。 ですが、たとえば英文を引用する場合には、 「このページは日本語のページですが『この引用部分に限っては、英語です』」 ということを明示するために、あえて、 <blockquote lang="en"><p>Hello !</p></blockquote> というような記述(個別の言語コード指定)を行うことはあります。 さて、 ><meta http-equiv="content-type" content="text/html; charset=Shift_JIS" /> >これのことですよね?大丈夫だと信じたいのですが、不安です。 についてですが、Shift_JIS(や、EUC-JP等)は、あくまでも、その文書がどのような「エンコード」をされた文書なのか? を明示するためであって、何語ということを明示していないと思うのですが。 あれこれ調べましたが、htmlにおけるcharsetは「そのページが何語のページであるかを明示している」ということを裏付けるリソースは見当たりませんでした。 (探し方が下手なのかもしれませんが…) たとえば、漢字もひらがなもカタカナも1字たりとも記述されていない、全文が英語のページをShift_JISでエンコードした。 これって、英語ページなんでしょうか? 日本語ページなんでしょうか? 日本語・英語、半々のときは?? 真実はGoogleにしかわからないでしょうが、Shift_JISというだけで「日本語」と解釈されるとしたら…。 そのようなアルゴリズムは…勘弁願いたいところです。 これより詳しく、信憑性に足る回答につきましては、専門家に委ねることとします。

noname#38071
質問者

お礼

buntan_bunさん、 度々のご回答、そしてとても詳しく説明していただき、本当にありがとうございます。 やはり、運営している人たちにしか分からない、外に公開していない”要素が”あって分からないですよね。 googleにサイトマップを送ってからまだ時間が経ってないせいか、相変わらずの結果です。もう少し待ってみようと思います。 本当にありがとうございました。

回答No.3

>>まさかサーチエンジンが1つだとは思ってないですよね。 >これは、一つの検索エンジン(例えばgoogleならgoogle)だけで1つという意味でしょうか? ああああごめんなさいごめんなさい。 検索エンジン(サーチエンジン)は、googleやmsn、yahooのことです。 これはgoogleが1つ、msnが1つ・・・ですね。 googleという1つの検索エンジンについてみてみます。 googleがまずウェブページの情報を集めます そして、何を集めるのかは知りませんが、集めた情報を蓄積します。 情報が多いので、1つでは収まらないです。 そこで、2つめ、3つめ・・・いくつあるのかは知りませんが。 蓄積するサーバーが1つなら、私達が検索したとき、 いつも出される情報は1つで同じはずです。 これが、2つ3つ4つとあるから、検索するたびに違う結果が出るのではないか、と思ったわけです。 日本語専用に2つ、それ以外用に10個あったとして、 私達が日本語検索をしたばあい、日本語専用サーバーのどちらかを参照することになるはずです。 全体検索をした場合、日本語専用+それ以外を混ぜて結果がでてくるとしたら、 件の減少もありえるかな、と。 言語関係なしでとりあえず集めまくったサーバーのほうに貴方の情報があって、 それを日本語専用のほうが集めていなかったら、 全体のほうが多くなるかな、と。 まぁ憶測なんですが。 こういう検索情報みたいのは企業秘密なんですよね。 だからSEOとかよくわかんないものは流行する、と…。 基本は、参照回数が多ければ多いほど、 安定して、さらに上位に検索されます。

noname#38071
質問者

お礼

-Jelly-さん、 ご回答ありがとうございます。すみません、混乱していました。少し整理がついた様に思います。 ありがとうございました。

回答No.2

もしかしたら、<html lang="ja">ではなく、<html>となっているのではないでしょうか? そうであるなら、これが原因ではないかと思われます。 少なくとも自分のサイトはlang属性を指定してあり、ご質問のような現象は発生しておりません。 また、 <meta name="keywords" lang="ja" content="~~~"> <meta name="classification" lang="ja" content="~~~"> <meta http-equiv="content-language" content="ja" /> のように、個別にlang属性も指定しておりません。 以下も参照してみてください。 http://www.kanzaki.com/docs/html/lang.html http://openlab.ring.gr.jp/k16/htmllint/explain.html#html-lang

noname#38071
質問者

お礼

buntan_bunさん、 ご回答ありがとうございます。 >>もしかしたら、<html lang="ja">ではなく、<html>となっているのではないでしょうか? まさに仰る通りのことをやっていました。これから直してみようと思います。 個別のlang属性はなさっておられないのですね。了解しました。URL先もご紹介ありがとうございました。 ありがとうございました。

回答No.1

サーチエンジン業者ではないので可能性の話ですが サーチエンジンは定期的に (どのぐらいの定期かは知らないですが、だいたい1週間2週間でしょう) ウェブサイトの収集を行い、 情報をサーバーにためていきます。 私達は、単語入力により、ためられたサーバーから検索をします。 まさかサーチエンジンが1つだとは思ってないですよね。 というかいくらなんでも1つだったらパンクする。 こっちのサーバーは貴方のページ情報を収集したが、こっちのサーバーはしていない →検索のたびに違う結果がでる と考えられるし、検索するたびに違う結果がでるというのは実際あります。 有名なサイトや参照、検索されることが多いサイトではそう変わらないでしょうが。 基本的にcharsetを宣言していれば、 日本語サイトであるとサーチエンジン側は認識しているはずです。

noname#38071
質問者

お礼

-Jelly-さん、 ありがとうございます。 >>まさかサーチエンジンが1つだとは思ってないですよね。 これは、一つの検索エンジン(例えばgoogleならgoogle)だけで1つという意味でしょうか?すみません、googleならgoogle1つの検索エンジンだけと、思っていました。複数あるとは思っていませんでした。 でもすみません、「日本語~」の検索と「ウェブ全体~」の検索両方に出てくるページのキャッシュの時間を見ても、同じなのですが、これはどういうことでしょうか?(わたしの認識が間違っています?) >>基本的にcharsetを宣言していれば、 上記は、 <meta http-equiv="content-type" content="text/html; charset=Shift_JIS" /> これのことですよね?大丈夫だと信じたいのですが、不安です。 ”確かに日本語のページである”と認識してくれるタグのようなものがあれば、教えていただきたいです。 よろしくお願いいたします。

関連するQ&A

  • 文字化けするページとしないページ(宣言などは同じなんですが・・・)

    はじめまして。 現在、PHPによる更新管理を入れたページを作っています。 なんとか更新、反映はされたのですが、 ページによって文字化けするページとしないページがあります。 宣言?(1行目から<body>までは)はまったく同じなんですが、なぜか文字化けするページとしないページに分かれています。 しかも文字化けする個所としないページは同じテキストの内容です。 にもかかわらず原因不明の文字化けが起きています。 以下、宣言?以下の部分です。 どうかよろしくお願致します。 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml" xml:lang="ja" lang="ja"> <head> <meta http-equiv="Content-Type" content="text/html; charset=euc-jp"> <meta http-equiv="Content-Script-Type" content="text/javascript" /> <meta http-equiv="imagetoolbar" content="no"> <meta name="Keywords" content="" /> <meta name="Description" content="" /> <meta name="ROBOTS" content="ALL" />

    • ベストアンサー
    • HTML
  • google対応メタタグ

    http://affiliate-bible.com/affiliate_seo.htmlを見て、こんな風にしましたが、メタタグは、google対応になっているでしょうか?あと、ここが間違っているよ。という場所があったらご指摘お願い致します。 <TITLE>サイト名</TITLE> <meta http-equiv="Content-Language" content="ja"> <META http-equiv="Content-Type" content="text/html; charset=Shift_JIS"> <META NAME="keywords" CONTENT="キーワード1,キーワード2,キーワード3"> <META NAME="description" CONTENT="キーワード1"> <META http-equiv="Content-Type" content="text/html; charset=Shift_JIS"> <META name="GENERATOR" content="IBM WebSphere Studio Homepage Builder Version 8.0.0.0 for Windows"> <META http-equiv="Content-Style-Type" content="text/css"> <META name="IBM:HPB-Input-Mode" content="mode/flm; pagewidth=940; pageheight=1200"> <META name="GENERATOR" content="IBM WebSphere Studio Homepage Builder Version 8.0.0.0 for Windows"> 上記のサイトでは一応グーグル対応のメタタグと書いていますが、他で教えてもらったのにはmeta nameをgooglebotにするとgoogle対応とのことですが、どうなんでしょう。どうか、お返事宜しくお願い致します。

  • euc-jpのページをIE7で表示したら真っ白に表示される

    PHPでHTMLを吐き出すeuc-jpのページをIE7で表示したら真っ白になってしまう ページがあるのですが、エンコードを日本語選択にしたり画面を更新(F5) したりすれば通常表示されることから、 IE7 で画面が真っ白になるページの対処方法 http://www.drk7.jp/MT/archives/001163.html と同じ症例ではないかと断定したのですが、↑などを参考に 下記のようにしてみましたが、改善ありません。その他、特効薬はありますか。 <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> <HTML LANG="ja"> <HEAD> <!-- 雀の往来京 --> <meta name="content-language" content="ja"> <meta http-equiv="Content-Type" content="text/html; charset=euc-jp"> <meta http-equiv="Content-Style-Type" content="text/css"> <meta http-equiv="Content-Script-Type" content="text/javascript">

    • ベストアンサー
    • HTML
  • (ホームページ作成について)検索キーワードを日本語で記入しても文字化けしてしまう。

    いつもお世話になっております。 ほとんど素人に近い知識でホームページ作成をしております。 この度作成した自身のホームページをGoogleの検索で引っかかるように設定したいのですが、その際に検索キーワードを下記のように設定しました。 ------------------------------------------------- <head> <meta http-equiv="content-type" content="text/html;charset=ISO-8859-1"> <meta name="description" content="私の公式ホームページです"> <meta name="keywords" content="tokyo,aoyama, 食事, お酒,"> <title>my home page</title> </head> ----------------------------------------------------- その際に、アップロードしたサイトのソースを見てみると日本語表記されている「食事」「お酒」の部分が文字化けしてしまい「??????????」になってしまいます。 もちろんこのままアップロードしてもGoogleの検索にも引っかかりませんでした。 原因及び対処方法をお分かりでしたらご教授願います。 使用しているソフトはAdobe GoLiveです。 以上よろしくお願いいたします!

  • ホームページ作成に関して

    以下のように入力しましたがホームページに反映されません。 <DOCTYPE_html> <html_lang="ja"> <meta name="author"content="名前> <meta name="description"content="内容の紹介 <meta name="keywords> <meta http-equiv="content-style-type content="css> <head> <meta http-equiv="content-script-type-cotent="utf-8> <meta_charset="utf-8"> <title>名前<title> </head>

    • 締切済み
    • PHP
  • 多言語ページのエンコード記述が分かりません

    友人に頼まれてサイトの挨拶文のようなページを、英語バージョンと中国語バージョンで作っています。 ナビゲーションなどは日本語のままで、メインのコンテンツエリアのみ英語や中国語を書くので2つの言語が交じるページとなります。 文字化けを防ぐためのエンコードがいまいち分かりません… 分からないなりに書いては見たものの、これであっているのかも分かりません。 (確認する方法はあるのでしょうか) コードを書いてみました。 添削やアドバイスをお願いします。 ───────────────────────── 【英語と日本語のページ】 ※エンコードをUTF-8にしただけです。 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> <meta http-equiv="Content-Style-Type" content="text/css"> <title>△△△</title> <link href="◯◯◯.css" rel="stylesheet" type="text/css" media="all" /> </head> ───────────────────────── 【中国語と日本語のページ】 ※ネットで検索してcharset=bg2312、 lang="ja,zh" xml:lang="ja,zh"を書きましたがこれでいいんでしょうか? <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml" lang="ja,zh" xml:lang="ja,zh"> <head> <meta http-equiv="Content-Type" content="text/html; charset=bg2312" /> <meta http-equiv="Content-Style-Type" content="text/css"> <title>△△△</title> <link href="◯◯◯.css" rel="stylesheet" type="text/css" media="all" /> </head> ───────────────────────── また、友人のサイトを見てみるとその他すべてのページはShift_JISで作られています。 これは海外の人が開くと文字化けしてしまうということなのでしょうか? 日本語の表示のままでいいのですが、UTF-8にしたほうがいいのでしょうか? わからない事だらけでスミマセン(;_;) よろしくお願いします。。

  • 検索登録の結果・・・

    こんにちは。お願いします。 2年ほど前から、考えてます。ホームページの検索登録についてです。 一括登録「登録君」と、「一発太郎」の二つのサイトから登録しております。 その結果、「google」と「Yahoo」ではヒットするようになりました。 そのほかにも、GOO、Exicite、infoseek、フレッシュアイ、Lycosなどが ありますが、同様に登録したつもりなのに、ヒットしません。 やはり、有料の方法を取らないと、ヒットするようにならないのでしょうか? 実は、ホームページの更新を怠り、検索に出てこなくなったので、 ここ2ヶ月ほど前に、登録し直した結果、 やはり「Google」と「Yahoo」しか検索結果に出てきません。 どうぞ、ご教授くださいませ。 なお、問題のページは、@Niftyのスペースで、 http://homepage2.nifty.com/****/index.html の内容は、以下のようになっています。 (もちろんトップページは、フレームページではありません。) <html><head> <meta http-equiv="Content-Type" content="text/html; charset=shift_jis"> <meta http-equiv="Content-Language" content="ja"> <meta name="robots" content="キーワード,keyword,きーわーど"> <meta name="keywords" content="キーワード,keyword,きーわーど"> <meta name="description" content="キーワード,keyword,きーわーど"> <title>*******</title></head> <body bgcolor="#fffacd"><center> 本文 </center><pre><font color="#fffacd">少し、文があります </font></pre></body></html>

  • Googleに検索されない

    3が月前にホームページを作成したのですが検索エンジンに検索されません。 今現在ページランクは3です。 Googleにサイトの登録もしました。 また http://ippatsu.net/TARO/ の一発太郎を使い登録もしました。 サイト内には登録されやすくするために <meta name="robots" content="index,follow"> <META name="keywords" content="キーワード"> <META name="description" content=""> も入れています。 しかし未だに検索されません。 アドバイスをお願いします。

  • 日本語と韓国語のホームページ作成

    日本語と韓国語で書かれたホームページを韓国の方が見られるようにするには、どのようにしたら良いのでしょうか?同様に日本の方も見られるようにしたいと考えております。 metaタグを調整すれば良いと考えましたが、それ以上分かりませんでした(★の部分です。) <meta http-equiv="content-type" content="text/html; charset=★★★">

  • IE7/8のGoogle検索で日本語だけが設定保存できない

    E7/8のGoogle検索http://www.google.co.jp/で、いつのまにか 常に「ウェブ全体から検索」になった状態になり、日本語だけが設定保存できません。 OS:WindowsXP(SP3) 右上の「検索設定」ボタンを押して、「検索設定の検索言語の設定」→ 「優先する言語」で「日本語」に設定しようと思っても、添付画像のように、 既に日本語にチェックが入っており、グレーアウトされ、日本語のみチェックの オンオフができません。 一方、外国語は全て正常にチェック可能で保存できます。 ちなみに、以前は常に「日本語のページを検索」に設定保存できました。 cookieを削除したり、ctfmon.exeを復活させたりしましたが解消されません。 全く同じ問題の報告が下記サイトにあります。まだ解消されてないのでしょうか? http://www.google.com/support/forum/p/websearch/thread?tid=2712717663313bdf&hl=ja 以下のGoogle検索ならlang_jaなので、常に「日本語のページを検索」になりますが、 相変わらず日本語のみチェックがグレーアウトされ、オンオフできません。 http://www.google.com/webhp?hl=ja&safe=off&num=100&newwindow=1&btnG=%E6%A4%9C%E7%B4%A2&lr=lang_ja http://www.google.co.jp/webhp?rls=ig&hl=ja&source=hp&btnG=Google+%E6%A4%9C%E7%B4%A2&lr=lang_ja