• ベストアンサー

ネット検索エンジンを自作してみたい

検索エンジンの有名どころではgoogleがありますが、自分でも出来るのですよね?物理的には。実際には何を用意するとか、なにを勉強すればいいのですか? 他人のIP突っつくのでしょうから、攻撃とか不正アクセスと見なされないでしょうか?

質問者が選んだベストアンサー

  • ベストアンサー
  • akadama12
  • ベストアンサー率100% (4/4)
回答No.1

ちゃんとした技術と知識があれば自作する事も可能です。 しかし、個人が直ぐに出来るような物ではありません。googleが今の検索エンジントップになるために、他のYahoo!やMSN、goo等よりも優れたサービスを実装しているからです。 具体的に覚える知識は多量です。多いので必要だと思う分だけ書きだしてみます。 ・HTMLやCSS ・PHP ・Perl ・OSの知識 ・ネットワーク関連 ・データベース 以上は、最低限だと私は思っています。検索エンジンで要になる要素は以下です。 1,WEBページをどうやって登録するか? (googleの様に自動で巡回するボットやクローラーを用意する。) 2,登録情報をどの様に管理するか? (MySQL等の既存のデータベースで管理する。) 3,登録したWEBページをどうやって参照するか? (PHP等を利用してデータベースから情報を引き出す。) Yahoo!等は、以前まで自己申請形式で登録を行なっていました。それらも検索エンジンに加えられます。もし、クローラーやボットも自作というなら、WEBアプリケーションの知識も必要になってくるでしょう。今、人気な言語にC#等が挙げられます。 質問者さんの言う、他人のIPを突くと言うのは、クローラーの事を指していると思います。これは、googleが管理しているサーバに潜んでいるプログラムで、HTMLに含まれているリンクを辿りながら、データベースにHP等のWEBページを登録します。そもそも、WEBページは他人に見せるように出来ているので不正アクセスにはなりません。不正アクセスになるのは、許可されていない領域に侵入した時等が当てはまります。でないと、私達も不正アクセスしてる事になってしまいますよね? 少しだけ専門な話になりますが、質問者さんの言う検索エンジンの利用者層も考慮しないと、準備する設備の規模が変わります。  例えば、家族や身内しか使わないなら中古パソコン一台で事足りると思います。しかし、これを外のネットワーク=インターネット上のWEBページを管理する場合、規模が変わります。 最低限、常時接続・常時起動のパソコンが一台は必要になると考えてください。 他の人に利用して貰う事も考慮しているなら、サーバを構築する時で良いのでセキュリティの事について詳しく調べてください。

over_the_galaxy
質問者

お礼

詳細な回答をありがとうございます。 検索らしきことを興味本位でやってみたいだけなので、クローラーから勉強してみたいと思います。

関連するQ&A

  • ハードディスク用の検索エンジン

    Bing、Google、Yahooのようなネット上を検索するものではなく、ハードディスク内のドキュメントなどを検索するエンジンはありませんか。以前、Googleのハードディスク用の検索エンジンを使っていたことがあります。しかし、ハードディスクの全部の書類がGoogleのサーバーに記憶されるのは避けたいと思っています。個別PC向けの検索エンジンがあるようでしたら、ご教示ください。有料の方が安心感があり、5000円くらいまでなら支払う用意があります。

  • 自作ホームページと検索エンジン

    ホームページ初心者です。 自分のホームページが、検索エンジン(google、yahooなど)で検索した時に、なるべく上にヒットされるようにしたいのですが、どうしたらよいでしょうか? googleには登録しました。htmlが多少分かりますがheadやmeta、cssがよく分かりません。キーワードも準備しています。 どなたか教えていただけると助かります。

  • 検索エンジン

    検索エンジンで引っかかるようにしたいんですがどうすれば可能ですか?Yahoo、GOOGLEに載せようと申請したのですがひっかかってないようです。 それと自分のHPで独自の検索エンジン(配布されているもの)をおきたいんですが配布されているんでしょうか。 どなたかお願いします

  • 検索エンジン以外の方法は・・?

    自分が作ったサイトを、 『検索エンジンに登録してSEO対策する』以外で、 有名にしたりアクセス数を増やす方法はありますか? 例えば、 ヤフーやグーグルと言ったサイトが初めてこの世に誕生した時は、 (当たり前ですが)検索エンジンがまだ無かった時代ですから、 他の方法で有名かつアクセス数を増やした訳ですよね? (ヤフーやグーグルなんかはあくまで例えですが、 検索エンジンに登録する際のキーワードがどれも競合になって来て、 SEO対策が難しい今日、 他にアクセス数を増やす方法はあるのかな? と思いまして

  • 検索エンジン

    googleの検索エンジンはgoogle製、yahooの検索エンジンはyahoo製、goo、infoseek、excite、msnの検索エンジンはどこが作っているのでしょうか? わかる方お願いします。

  • 検索エンジンに引っかかるようにするには

    自分の作ったHPがyahooやGoogleなどの検索エンジンに引っかかるようにするには、どうしたらいいのでしょうか?

  • 使っている検索エンジンは何ですか?

    使っている検索エンジンは何ですか? 僕が使っている検索エンジンは、Googleです。 皆さんが、使っている検索エンジンは何ですか?

  • 検索エンジンにで検索されないようにするには・・・

    ロボット型検索エンジン(特にgoogle)において、自分のHPを検索されないようにする事は可能でしょうか? 又、googleのキャッシュページを消す事はできるのでしょうか? 自分なりに調べた限りでは、上記の事はできない可能性が高いとみたのですが... 例えば、自己紹介のページで自分のニックネームを検索エンジンで検索できないようにする(画像として保存する以外)ということでもかまいません。 できません!という解答でも結構です。 自分なりの対策としては・・・ リンクページを作らないようにしておりますが、 少々の効果はありますでしょうか?・笑

  • 検索エンジン

    検索エンジン(googleなど)の特定サイトにおいて自分の名前を検索できないように設定することは可能なのでしょうか??

  • 検索エンジンについて

    自分のサイトでWEB検索について検索エンジンgoogle、yahoo、msn、百度のどれかと提携しリスティング広告をした場合オーバーチュアのように自分のサイト内では広告料がもらえる検索エンジンてないですか。