読み始めると止まらない?「ウィキペディア」 の秘密 「検索上位のワケ」「信頼性・正確性は?」

  • ガイド ( How to )
  • 閲覧数:3187
  • ありがとう数:0

はじめに

1月15日は「ウィキペディア」誕生の日。ウィキペディアとは、ウィキメディア財団が運営している誰でも自由に編集に参加できるインターネット百科事典。

「ウィキペディアとは何なのか」「内容の正確性・信頼性」「なぜ、検索結果で常に上位?」「寄付を募集している理由」など、気になる話題を集めました

ウィキペディアって何ですか?

「ユーザによる書込み」で成り立っているネット上の百科事典です。
ユーザの書き込みですので、中身が違っていたり、意図的に改変されていたりもしますが。

すでに回答は出てますが、インターネット上の百科事典と言うのが一番わかりやすい回答ですね。
自分の生まれた年で検索したり、生まれた都道府県で検索したら結構おもしろかったりしますよ。
その他、YahooやGoogleとは違った検索ができるので非常に重宝しております。
便利でおもしろいサイトなので色々見て回ってみることをオススメします。

ウィキペディアで私個人を紹介するページを作ってもいいのでしょうか?

可能ですが、
http://ja.wikipedia.org/wiki/Wikipedia:%E8%87%AA%E5%88%86%E8%87%AA%E8%BA%AB%E3%81%AE%E8%A8%98%E4%BA%8B%E3%82%92%E3%81%A4%E3%81%8F%E3%82%89%E3%81%AA%E3%81%84
にあるように、
「自分自身についての記事を新しく作ることは、基本的に推奨されません。」
となっています。

更に、
http://ja.wikipedia.org/wiki/Wikipedia:%E3%82%A6%E3%82%A3%E3%82%AD%E3%83%9A%E3%83%87%E3%82%A3%E3%82%A2%E3%81%AF%E4%BD%95%E3%81%A7%E3%81%AA%E3%81%84%E3%81%8B
には、
「ウィキペディアの項目は、6.自己宣伝の場所ではありません。」
とあります。

また、
http://ja.wikipedia.org/wiki/Wikipedia:%E5%89%8A%E9%99%A4%E3%81%AE%E6%96%B9%E9%87%9D#.E3.82.B1.E3.83.BC.E3.82.B9_E:_.E7.99.BE.E7.A7.91.E4.BA.8B.E5.85.B8.E7.9A.84.E3.81.A7.E3.81.AA.E3.81.84.E8.A8.98.E4.BA.8B
には、
削除の方針、ケース E: 百科事典的でない記事の中に
「人などを扱い、執筆者やその周辺の人物以外は、内容の正しさや不正確さを検証できない記事。」
とあります。

ですので、作成しないことをお勧めします。

ウィキペディアを読むのが趣味になっている人はいますか。

趣味といえるか、どうか・・・。
ひとつのキーワードから芋ずる式に広がって、元が何だったか
わからなくなる時があります。

以前「いかりや長介」から「ネルソン・マンデラ」に飛んでました。

趣味というか、あること(人の名前とか出来事とか)が気になってwikipediaで調べて「こんなこともやってるのかこの人は!」とか「こんなこともあったのか!」とかの気になる発見がまた出てきてリンクで飛びまくって・・・とかしょっちゅうですね。いい暇つぶしにもなります。

人名をしらべていて、その人に関連するエピソードや事件などで
そっちをみて、またどんどん違うほうへはいっていくときは
あります。

一度だけ、書き込んだことがありますが
それっきり、読む専門です。
ただ、ウィキペギィアもネット全般もそうだけど鵜呑みにすると
危険なときもあるので参照程度にしています。

なぜ、ああいう、丁寧、難解、堅苦しい文体なのでしょうか。なにか規制がかかっていて、誰かが修正しているのですか?

ウィキペディアは何度か投稿したことがありますが、誰かに推敲されるみたいですね。
推敲は誰でもできますが、何かプレミアム会員みたいな人がいて、通りすがりの人よりも高いレベルで行い、推敲以外にも、関連項目へのリンクを張ったり、間違いを直したり、画像を関連付けたりする人がいるみたいです。
どうもIP規制しているようで、何度も書くと「IDとパス取って普通に書け」旨の警告が出ます。

●基本的なルール
 ウィキペディアには基本的なスタイルが定まっています。
・Wikipedia:ガイドブック 編集方針
 http://ja.wikipedia.org/wiki/Wikipedia:%E3%82%AC%E3%82%A4%E3%83%89%E3%83%96%E3%83%83%E3%82%AF_%E7%B7%A8%E9%9B%86%E6%96%B9%E9%87%9D#.E8.A8.98.E4.BA.8B.E3.81.AE.E4.BD.93.E8.A3.81

 百科事典ですから、くだけた表現は用いられません。
 また、記事が一般にくだけた書き方をしていないのであれば、新たに加筆する人も
 それに倣うでしょう。
 仮に、顔文字やくだけた表現があれば、ウィキペディアでは異質なものとして浮いてしまいますので、
 誰かが見つけ次第修正していきます。

●誰が直すのか?
>果たしてそれらすべてを管轄することは可能なのか? おかしな文を見つけたら誰かがただちに
>“ウィキペディア風”に修正しているのか? そもそもおかしな文などウィキペディアには存在するのか? 疑問はつきません。

 ウィキペディアはwikiというシステムを用いています。
 ウィキペディアの記事には[履歴]というタブが付いており、これを見れば過去の履歴が分かります。
 また、過去の履歴を参照して、以前の記述に戻すこともできるのです。
 たとえば、誰かがとある記事を
「あっdwふfdgyqftgyふじこlp;@」
 と書き換えて行ったとしましょう。
 これを見つけた人は、すぐ履歴を開き、荒らされる以前の状態に戻すことができます。
 これを「リバート」と言います。

●どうやって気付くのか
 ウィキペディアの登録ユーザーは、自分が関わった記事を「ウォッチリスト」に登録していることが多いです。
 ユーザーがウォッチリストを開くと、自分が登録した記事の編集が表示されます。
 ここで大きな改変があれば、以下のように表示されます。
 ・「ページの白紙化」 → 荒らしが記事を消していった
 ・「ページの置き換え」→ 誰かが記事を全部書き換えた(荒らしの可能性が高い)
 ・大量加筆・大量除去 → 太字で変化したバイト数を表示

 ウォッチリストにない記事でも「最近更新したページ」という項目があり、
 それを見れば同様に表示されます。
 http://ja.wikipedia.org/wiki/%E7%89%B9%E5%88%A5:RecentChanges

 また、記事が大幅に改編された場合、たとえば記事の要領が大幅に減った、増えたというような場合は
 ウィキペディア関連のIRCチャットに警告表示がなされます。
 このチャットは管理者を中心に多数の人が見ています。

ウィキペディアは検索結果で常に上位に出てきますね。何か癒着があるのでは・・・?

評価ルールはどこの検索サイトでも、独自の方針がありますから
正確に全部把握している人はそんなにいないと思いますが…
単純問題、Wikipediaは知名度が非常に高い。

そのため、そこにリンクされている他のサイトの数が非常に多いので
そのぶん評価が高くなっていたりします。

このWikipediaの人気が高い理由の一つには
非常に微に入り細に入り、いろんな項目が揃っていることがあります。


#こっから長くなりまつ

たとえば、インターネット利用者の大半はパソコンを使っていて
そのうちたぶん8割くらいは、リカバリーシステムを伴ったWindowsPCを使っています。

リカバリーディスクやリカバリー領域は、今や無くてはならない技術の一つです。


で、2005年夏、Wikipediaに私が作った"リカバリー領域"という項目は
数年の間に、数人によって修正と追記が繰り返されて、関係するいろんな情報を提供しています。
http://ja.wikipedia.org/wiki/%E3%83%AA%E3%82%AB%E3%83%90%E3%83%AA%E3%83%BC%E9%A0%98%E5%9F%9F


対してYahoo百科事典で、リカバリーで検索するとこんな感じです。
http://dic.yahoo.co.jp/dsearch?enc=UTF-8&p=%E3%83%AA%E3%82%AB%E3%83%90%E3%83%AA%E3%83%BC&dtype=0&dname=0na&stype=0&pagenum=1&index=21285700

すでに、リカバリーCDなんか付属していないPCがあたりまえの時代
付いていたとしても、とっくにリカバリーDVDの時代。にも関わらず…
リカバリー領域についての情報は一切ないのがYahoo百科事典です。

「探してもリカバリーCD無いから、このパソコンもう使えないんだ」

と絶望する人もいるんですけど、そういう人のための情報を整備する手段として
Wikipediaはとても便利なんです。目的によっては個人サイトで頑張るより効率的。
このサイトで、そういう質問があったら、WikipediaのURL示すだけでも済みますしね。


Wikipediaには、誤った記述や、悪意ある主張を修正できる余地がありますから
このサイトの、締め切られたら反論も修正もできないシステムに比べると、大幅に信頼性がありますよ。

思い出せないけど、このサイトで誤った回答で終了している質問を見て
Wikipediaの項目に、関連する情報を追記したことも何度かありますよ
それによって、後に同じ悩みを抱えた人は、より多くの情報を得られるんです。

でも、私が最近、大幅加筆した"ドライブレター"の項目みたいに
有用な情報が欠落した項目もあります。問題点ばかりあげつらった項目になっています。
これは、その有用な情報について、私は詳しくないから、書いていないからです。


Wikipediaを見て、項目に不備や誤り,偏りがあるなら
気づいた人がそれを修正していけばいいと考えています。


Webはマーケティングのためにあるわけでもありませんから
検索ヒットの順位が低いから損するという発想自体間違いです。

情報には中立性が求められるという事情もあります。
たとえば、個人がアフィリエイト広告を伴ったサイトを作っていれば
そこでは広告商品を、過剰に褒めることが横行するわけです。

広告が無いにしても、ステマが問題視されている時代です。
ですから、広告なんか無いサイトのほうが信頼される時代でもあるのです。


たとえば、「リカバリーCDが必要です」というアドバイスで、Yahoo百科事典を見たとします。
今私のPCにはLenovoの広告がリカバリーCD項目に表示されています。

「リカバリーCDなんか無いから、もうダメなんだ」と思ったら、
買い替えなきゃならないかなぁ…と思ってLenovoクリックしちゃいますよね。

でも、この5年に販売されたPCのほとんどは
リカバリーCD/DVD無しで、リカバリー領域搭載製品なんですよね。

これ、本当に消費者利益になっているのかなぁ?と、そう思います。


で、最後にちょっと専門的な分野の項目を三つだけ、Yahoo百科事典で見てみました。

Linuxとオープンソースの項目は、焚書レベルに誤りがあります。

Linusがオープンソースを始めたかのような記述があって、なんとRMSの項目自体が無い(爆)
デジタル家電のほとんどに関わり、その説明書にも記述されているGPLの項目も無い。
そもそもオープンソースの項目でライセンスについて一切触れていない。

OSの項目にも、普遍的ではない要素が書かれていながら、重要な役割の一部が欠落。
デバイスの抽象化も、権限の制限も説明せず、OSの説明に分散システムを記述しておいて
OSの例にPlan9が無いとか、分散システムをなんだと思ってんだと…もうね

署名記事でこのレベルだとちょっとおどろくほどがっかりです。

でも、これをYahooの指示や依頼無しに修正する手段は誰にも無いのです orz
これじゃ、検索ヒットの優先度が高くできるわけが無いと思います。

参考になるページを見つけたので、No.4の補足として、それに基づいて書いておきます。なお、このページは間違ったこともかなり書いているので、ご注意ください。そもそも内容が5年も前の話になり、検索エンジンのアルゴリズムも現在とは大幅に違います。そういった点を修正し、足りない点を追加して、以下に書き直しておきます。

1.大量のページ数
検索エンジンはページ数の多いサイトのページを上位表示する傾向が非常に強いです。Wikipediaは記事数ベースで、現時点で1140万ページ(うち日本語のページが81万ページ)もあります。個人的経験の範囲内での話ですが、個人のホームページでは10ページから数十ページが程度が多く、ブログでも最大で5千ページ前後ぐらいまでが普通ですから、全く太刀打ちできません。ページ数を独立した指標にしているのかどうかは不明ですが、結果的にはそうなっています。ページ数が多ければ、内部リンクの数が増えますから、間接的に寄与しているかもしれません。

2.大量の内部リンク数
Wikipediaは、網の目に様にドメイン内部でリンクが張り巡らされています。個人のホームページでは、内部リンクが少ない傾向にあるので、ここでも差がつきます。しかも、同じ用語が何度も同一ページに現れる場合、全部の出現場所からリンクを貼らず、一つだけからリンクを貼っているので、スパム行為になりません。つまり、過剰なリンク数で検索エンジンに減点されません。

3.関連性の高いページからのリンクの数が多い
内部リンクもそうですが、外部リンクもその傾向が高いです。個人のホームページでは、相互リンクが多いため、関連性のあるページからのリンクとは限らず、関連性のないページからのリンクの割合がかなり高いと思います。

4.良質なコンテンツが多い
必ずしも最高のコンテンツとは限りませんが、一般の閲覧者には良質であるに違いないと認識されているので、じっくり読んでもらいやすく、閲覧者数や閲覧状況で優位に立っています。検索エンジンが人間の目でチェックを入れてきても問題になることはまずありません。

5.大量の外部リンク数
正確な外部リンク数はわかりませんが、ドメイン単位でも、Alexaの調べで219万ドメイン以上あるので、その10倍の2200万ドメイン以上は確実にあるでしょう。特に有名な人とか有名なサイトを除き、特別に自分で宣伝していない個人のホームページでは、普通、10ドメインもあればいい方でしょう。全くゼロか一つぐらいが圧倒的に多いと思います。検索順位では、これが最大の要素になると思われますので、全然太刀打ちできないことがはっきりわかります。不公平さについて言えば、Wikipediaの記事だと個人のホームページの記事よりも2200万倍良いかというと、そうとは言えない場合が少なくないところが不公平なわけですね。

6.HTMLがよい
個人のホームページの場合、HTMLがよくない場合が多いです。しかし、WikipediaのHTMLは単純できれいなので、有利です。但し、これは実際にはあまり検索結果に影響はないでしょう。それに、WikipediaのHTMLは、きれいですが、画一的です。個人のホームページだと、一般に各ページ特異なHTMLになっていますから、その点、ほんの少し有利です。個人のホームページの唯一有利な点ですが、他の指標での差を打ち消すほどの効果は全くありません。

7.ページごとにコンテンツが特化している点
検索エンジンで上位に表示されるには、1ページ、1テーマであると有利ですが、Wikipediaはそうなっています。

8.検索エンジンの利用者が探している情報に合致するコンテンツを持つ
検索エンジンを利用している人は、特定の情報を探している場合がほとんどです。Wikipediaのページは、そういう情報と合致する情報を提供している場合が多いので、閲覧状況がよく、検索エンジンから高い評価を受けやすいです。検索エンジンを利用した人がどのサイトのどのページを時間をよくかけて、じっくり読んでいるのか、検索エンジン側は大体把握しています。

9.PageRankが高い
Google及びGoogleを使っている検索エンジン(Yahoo!Japanなど)での話に限定されますが、wikipedia.orgは、GoogleのPageRankが高く、現在0~10の11段階で9になっています。PageRankと検索順位の相関はかつて0.7ぐらいあったという話もあります。今は、かつてほどの威力はないようですが、現在でも、PageRankはかなりの影響力があるものと思います。これはGoogleやYahoo!並のPageRank(ページランク)ですから、検索で優位になっても当然です。普通の個人のホームページのPageRankは「なし」か「0」ぐらいが圧倒的に多く、高くても「4」ぐらいです。「4」以上の個人のホームページやブログは、特別に有名なものに限定されます。4や5でも9には到底かないません。個別の記事でも同じ傾向で、たとえば、「織田信長」で検索すると、Wikipediaの記事のPageRankは「5」です。一方、個人の独自ドメインのホームページと思われるsengokujidai.netの「織田信長」はPageRank「3」です。また、個人の無料ホームページのgozaru.jpの「織田信長の館」は「1」にすぎません。

10.相互リンクがない
Wikipediaは相互リンクがないか、ほとんどありません。全部常に一方向だけのWikipediaへ向けた片側リンクです。Wikipediaからの発リンクはすべてnofollow属性で無効になっています。一方、個人のホームページは、相互リンクが多く、せっかく外部リンクがあっても、検索エンジン側で両方ともほとんど無効にされています。わかりやすく言うと、Wikipediaというサイトは、リンクの効果を他人からもらうだけで、誰にも与えていないわけです。スパム防止が目的ですが、リンクの貼り方としては不公平です。いずれにせよ、自分へ向けた片側リンクが多いサイトは、検索で上位表示されるため、Wikipediaの記事が上位表示されやすくなっています。



以上、細かく分析すると、こうなるわけですが、なぜ同じ内容でもWikipediaでは検索結果で上位表示されるのかという話になると、結局の所、domain authorityの差ということになるのではないかと思います。不公平だと感じる人は、Wikipediaへのリンクは貼らないようにするのがいいと思います。

なお、さらに追加すると、癒着というのはないと思いますが、検索エンジン側で人の手が入って、Wikipediaが上位表示されるようになっている可能性は否定できません。根拠としては、確か、政府関係のサイトは、最初から上位表示されるように人の手が入っていたと思います。個人的な見解ですが、Wikipediaの検索順位に人の手が入っている可能性は半分ぐらいあるような気がします。

ついでに書いておくと、同様の検索結果上の不公平な現象は、Wikipedia以外でも、このような質問サイトやはてなキーワードなどでも現れています。困ったものですね。

1.ウィキペディアで調べ物をすることはありますか? 2.記事の信頼性について、どうお考えですか? 3.どれぐらいの頻度で利用されてますか? 4.過去に、記事の正確性について疑問を持ったことはありましたか?

1・あります
2・90%
3・毎日
4・元々調べ物をする時には一箇所ではなく多数で行いますし、
それ専門のHPや本など図書館も利用しますから
いくつかの情報のひとつとして捉えています。

1.あります。
2.参考文献等で出典が明らかなもので確認できたものは信頼性は比較的高いと思います。中には自説を書いているだけのモノもあります。仕事上使うときで厳密さを必要とする場合はウィキペディアそのままではなく、記載されたキーワードや資料から自分で調べるなりして補強あるいは訂正します。
3.週に2-3回。ただし、1回の調べる量は複数項目でかつ、他の文献もあたります。
4.疑問を持ったことはあります。というか今も持っています。編集者によっては裏付けのない酷い記述もあります。だからこそ自分で別の文献で裏をとります。

1 ウィキペディアで調べ物をすることはありますか?
はい。

2 ウィキペディアの記事の信頼性について、どうお考えですか?
理系分野ではかなり信頼できると見ています。政治が絡むと信頼性は下がるという印象。

3 利用されている方は、どれぐらいの頻度で利用されてますか?
ほぼ毎日。

4 過去に、記事の正確性について疑問を持ったことはありましたか?
ありますが、wikiに限らず、ネットの情報を単独で利用することはあまりないので、特に問題視していません。
昔は図書館で百科事典のハシゴをしたものですが、それに比べると楽にはなりました。

1 ウィキペディアで調べ物をすることはありますか?

あります。

2 ウィキペディアの記事の信頼性について、どうお考えですか?

98%

3 利用されている方は、どれぐらいの頻度で利用されてますか?

ほぼ毎日。

4 過去に、記事の正確性について疑問を持ったことはありましたか?

中には、明らかな間違いのページもある。
なので、参考にしてあとは、確証を探すようにすれば問題ない!’

ウィキペディアに寄付のお知らせが出ていました。資金繰りなどに困っているのでしょうか

元々寄付で成り立っているところでスタッフもボランティアが中心です。
で元ネタはおそらく会長の発言からでしょう。
http://zen.seesaa.net/article/33407146.html
3ヶ月しか運用資金がないという主旨の発言が、いつのまにあと3ヶ月でつぶれるという風に伝わり一部で大騒ぎされました(今年の2月のことです)。

ただしそれはこちらで釈明されているように、(突然収入が0になったとしても)3か月は運用できるだけの資金はあるという意味だったそうです。でそれを6か月分ぐらいは確保しておきたいということでもっと寄付を下さいという内容でした。
http://wikimediafoundation.org/wiki/Press_statements/Wikipedia,_Stronger_and_More_Stable_than_Ever,_thanks_to_our_Community's_Support/%E6%97%A5%E6%9C%AC%E8%AA%9E

ウィキペディアはもともと寄付で成り立っています。
あれだけのサイトですから、企業広告を載せれば運営は楽勝なのですが、
中立性を確保するため、企業の色を付けない方針で、
広告は一切載せていません。

たまにウィキペディアの記事を広告付きで載せているサイト
(フレッシュアイウィキペディア・goo-wikipedia)などがありますが、
あれはウィキペディアの運営団体とはまったく関係ありません。
ウィキペディアの著作権ライセンスは、自由な転載・改変・商用利用を認めていますので
無許可で転載が可能であるだけです。(ただし、記事の履歴やウィキペディア
から作成したことを明記する必要があります)

したがって、ウィキペディアの運営団体はいっさいを寄付に頼ることになります。
日本で寄付というと、よほど貧しい団体を連想しますが、欧米では珍しいことでは
ありません。また、ウィキペディアの日本語版は、あくまで「日本語版」であって、
「日本版」ではないんですね。

まとめ

このユーザなら私の疑問や悩みを解決してくれそうと思ったら、
質問への回答をリクエストすることができます。

特集


感謝指数をマイページで確認!

ピックアップ

ページ先頭へ