• 締切済み

検索サイト

n_breakdownの回答

回答No.1

インストールや設定作業が発生してしまいますが、オープンソースの検索エンジン「Nutch」なら、要件を満たせるのではないでしょうか。 http://www.nutch.jp/ http://ueshin.happy-camper.st/wiki/index.jsp?pid=Nutch%E6%A4%9C%E7%B4%A2%E3%82%A8%E3%83%B3%E3%82%B8%E3%83%B3

参考URL:
http://www.nutch.org/
remind5215
質問者

お礼

ご回答ありがとうございます。 たしかに、これは良さそうです。 ただ、JAVAでの動作みたいなので、サーバに結構負担がかかりそうですが大丈夫でしょうか。(スペック低いので・・・) これで特定のサイトのみの検索を実施しようと思っているのですが、可能ですか。 また、Rastとゆうのを見つけたのですが、これはどうなのでしょう。 もしご存知でしたら、ご教授願います。

関連するQ&A

  • 一度ロボット検索されてしまったサイト

    教えてください。 一般の人には見られたくないサイトがロボット検索されてしまいました。あるキーワードで検索するとひっかかってしまいます。 一度ロボット検索されたサイトを検索結果から削除する事は可能でしょうか? ロボット回避をしておけば、次のロボット巡回の時に 自動的に消されるのでしょうか? よろしくお願い致します。

    • ベストアンサー
    • CSS
  • 検索サイトから見えないサイトにするには?

    今、ウェブサイトを作っているのですが、 検索サイト経由で人が来て欲しくないので google, MSN, Yahoo 等の検索にヒットしないように したいと考えています。 確実にこれらの検索をはじくようにするには どのようにすればよいのでしょうか? また、3つそれぞれの検索ロボットに対する 対策は違うのでしょうか。

  • 検索サイトについて

    ディレクトリ型とロボット型があると本にありましたが意味が良く分かりません 分かりやすくお願い致します。 また検索サイトに登録依頼しなくても勝手にHPを立ち上げた場合検索サイトに 出てくるのでしょうか、よろしくお願い致しますm(__)m

  • ロボット検索について

    ホームページ上のソースコード 例: <script type="text/javascript" src="ext_web.js"> を記述しているサイトをピックアップすることが出きるロボットを開発したいのですが、技術的に可能かどうか教えていただけますでしょうか? また、既存で検索出来るTOOLなどございましたらご教授お願いいたします。

    • 締切済み
    • PHP
  • 検索サイトとエンコード

    人から頼まれてフランス語と日本語が混在する。ホームページを作りました。 フランス語のアクセントの都合上unicode(utf-8)で、 保存しサーバーにのせました。 ロボット型の検索サイトに数件登録したのですが、 unicodeでもきちんと読み取って検索サイトに乗るのでしょうか。 それともjisコードでないと日本語の場合は読み取れないとかあるのでしょうか。 どなたかご教授ください。

  • サイト内検索をしたい ロボット検索を拒否していても

    仲間内での掲示板の書き込みの過去ログを、自分のHPスペースに保管しています。仲間内の秘密を守りたいので、すべてのログはロボット検索エンジンを拒否する設定にしています。 しかし過去ログが増え過ぎて、サイト内検索をする必要が出てきました。高額な企業用のサイト内検索を導入することはできません。 無料のサイト内検索では、ロボット検索エンジンで検索する所ばかりです。ページにロボット検索エンジン拒否の設定meta name="robots" content="noindex,nofollow"にしていても、なおかつ自分のページの中だけはサイト内検索をしたい。そういう我儘を聞いてくれるところがないでしょうか。

  • 検索サイトでの検索に不具合が・・・

    昨日からなのですが、検索サイト(ヤフーやGoogle)で検索を実施し、表示されたリンク先をクリックすると海外の検索サイトが表示されるようになってしまいました。検索まではできるのですが、リンクがまったく機能しません。インターネットエクスプローラの履歴などは全部削除し、数日前の復元ポイントでの復旧も行ってみましたが同じ症状です。 何か情報があればよろしくお願いいたします。 使用しているOS はWindows XP (SP1)です。 IE のバージョンは6でSP1になります。

  • サイト内検索

    ロボットの検索エンジンにてサイト内検索サービスを利用する場合、ドメインの指定したディレクトリ以下のみを検索対象にできないのでしょうか? 例えば、プロバイダのHPスペースを利用している場合等です。 希望はgoogleを利用したいと思っているのですが・・。

  • 検索ロボットに携帯サイトだと認識してもらうにはどうすればいいですか?

    ケイタイサイト製作王3で作成した携帯用のページを作りましたが、検索ロボットはこのサイトを携帯用だとは認識してくれずPCサイトとしてしかみてくれません。 携帯で検索してみても PCカテゴリの検索結果に入っています。 どうすれば携帯用のサイトだと検索ロボットにわからせることができますか?

  • ロボット検索の開発方法を教えてください

    ロボット検索のシステムを開発したいと思います。 どなたか、その方法やヒントが書かれている書籍やURLを教えてくれますでしょうか。 よろしくお願いします。