• ベストアンサー

リンク先のHPを全文検索したいのですが

自分のホームページにリンクしているホームページのみを全文検索したいのですが、方法はあるでしょうか。 numazuだとサーバー内だけと聞いていますし、一般の検索エンジンを使うとリンクしていないホームページまで検索してしまうので、目的に合いません。 本格的なデータベースを構築すると費用がかかるので、簡易なデータベースあるいはフリーのソフトで行う方法があれば教えて下さい。 検索したいリンク先の件数は、約1000件を予定しています。

質問者が選んだベストアンサー

  • ベストアンサー
  • kokucho81
  • ベストアンサー率61% (157/255)
回答No.2

『httpdown』 と 『全文検索』 を組み合わせることで可能ではありますが、多分、1000件という数字は現実的ではないですね。 少なくとも、あらかじめ、検索インデックスを作成していない状態で1000サイトものサーバ外サイトを検索したら、検索ボタンを押したら制御は当面かえってこず、検索エンジンとして成立しないでしょう。 やはりnamazuなどインデックス生成型全文検索システムを改造して、「その1000件のサイト」を対象とする「WWW収集型ロボット」を作るしかないと思います。

kawasaku
質問者

お礼

ご回答ありがとうございます。 やはりCGIプログラムを組まなければ難しいのでしょうか。 検討させていただきます。

その他の回答 (1)

  • a-kuma
  • ベストアンサー率50% (1122/2211)
回答No.1

自分でソフトを組む方法ではなく、一般の検索サイトの話です。 Google の「検索オプション」では、URLに関連しているページに 絞って検索をすることができます。

参考URL:
http://www.google.com/intl/ja/
kawasaku
質問者

お礼

ありがとうございます。 早速試してみます。

関連するQ&A

  • 検索エンジン探しています

    現在ホームページを立ち上げています。 1000件ほどのリンク先のホームページ内の情報を検索したいと思っています。 できれば全文検索をしたいのですが、検索先を、リンク先に限定 したいのです。  複数の検索エンジンを使ってキーワード検索できるフリーソフトは あるようなのですが、検索先をリンク先に限定できるのでしょうか。  リンク先のみ検索できるフリーの検索エンジンがあれば教えて下さい。

  • Solaris8+Apacheで全文検索

    Solaris8+ApacheでWebページの全文検索エンジンの構築を 考えているのですが、みなさんご意見をお願いします。 普通に考えればNamazuなんですけど、Namazuだと 単語での一致ですよね。(?) 完全一致(grep)ではないと思うので、完全一致の検索 エンジンを探しているのですが、何か良いものを ご存じないでしょうか? 商用・フリー等気にしません。 よろしくお願いします。

  • HP内だけの全文検索ソフト

    IE6を使っていますが「このページの検索」しかできないようなので悩んでいます。 探している文字列のありそうな「お気に入り」に登録済みHPの中だけで掲示板の全文検索したいのですが・・・。検索機能のないところもあって手間暇がかかって困ります。 なにか良いフリーソフトがあれば教えてください。 私も探してはみたのですがどれが該当するものか分かりませんでした。他に良い方法などもありましたらよろしくお願いします。

  • 商品検索ホームページの構築

    商品検索のホームページを運用しています。 現在データの件数が4000件ほどですが、約70万件に増える予定になっています。 テストしてみたところ2万件ほどで登録エラーになってしまいました。 現在の仕組みは、CSVファイルを取り込みHTMLページとして表示しているような感じで、データベースソフトは使用していません。(PHPで作られています) WEBサーバーはホスティングの共用サーバーを使用しています。 また、各データの項目は、番号、商品名、型式、台数、内容、写真(4枚)です。 データ件数から考えると専用サーバー、データベースの構築が必要でしょうか? 詳しい方のアドバイスをお願いします。

  • ヤフーのような全文検索をする方法は?

    私はMySQLを使ってデータベースを作り、そこにデータをいれて情報を活用している者です。 MySQLのようDBで、あるいは他の方法でも構わないのですが、データを全文検索する方法が解りません。 1つのフィールドに検索をかけると全文検索にはなりませんし、1つのフィールドにすべてのデータを入れる方法という事なのでしょうか? 良い方法知っている方は教えて頂けないでしょうか?お願いします。

  • 全文検索プログラムを作りたい!

    今度、仕事で全文検索を行うプログラムを作ることとなりそうです。 もちろん日本語対応で、WordやExcelファイル内の文字列を検索する仕様です。 しかし、どのような方法でプログラムを作るのかチンプンカンプンです。 とりあえず今時点でわからないところが3つほどあります。 全文検索の技術に精通している方いましたら、是非アドバイスお願い致します。 (1).全文検索するAPI関数ってないでしょうか?   もしくは、ネット上でフリーで配布されている全文検索する   プログラムってないでしょうか? (2).全文検索するプログラムを作るのに適した   プログラム言語って何でしょうか? (3).市販されている全文検索システムは、インデックスファイルを作成し、   そのインデックスファイルから全文検索をしているようですが、   インデックスファイルを用意するメリットって何でしょうか?

  • DB全文検索について

    このたび、この「教えてGoo」「オンラインショップ』等ののような検索システムを作ることになりました。 「教えてGoo」質問検索の欄にキーワードを入れると、検索されますが、おおよそ40万件の質問や回答の中からすぐ検索結果がでてきます。そのままWhere句で検索してるはずないと感じました。このような全文検索系をデータベースでやる場合のテーブル構成等のテクニックをお教えいただけないでしょうか。よろしくお願いいたします。使用するDBはMySQLです。

  • 検索エンジンについて?

    自分のホームページに検索エンジンのCGIをつけようと思うのですが、現在使っているサーバーがフリーサーバーで50Mまで使えます。YOMIサーチとかを使った場合、何件ぐらいまでは登録できるでしょうか?また、検索エンジンのCGIで何件か以降または何ヶ月かで登録が消えてしまうようなCGIなんかは、ないでしょうか?

    • ベストアンサー
    • CGI
  • データベース内の情報を検索できるフリーの日本語全文検索システムを探しています

    データベース内の情報を検索できるフリーの日本語全文検索システムを探しています。 具体的には、ブログのように、テキストを入力するとページが生成されるような仕組みをPHPで作っています。 入力された情報は、MySQLに保存しているのですが、生成されたページを検索したいのですが、よく使われるNamazuでは、静的HTMLしか検索してくれないようで、使えません。 kabayakiと言う、ライセンス費のかかるシステムは発見できたのですが、費用た大きくかかる為、フリーのものを探しています。 方法論として、生成するページをHTMLベースで吐き出せばNamazuでもできると思いますが、動的なページを直接検索できるシステムがあればと思うのですが、経験者の方、または、ご存知な方がいらっしゃいましたら、是非、お知恵を頂ければと思います。 宜しくお願いいたします。

    • ベストアンサー
    • CGI
  • HPを特定者以外にみて欲しくない(再度)

    数日前、【完全に独立し(どこへもリンクしていない/どこからもリンクしていない)、かつ、いかなる検索エンジンへも登録していないホームページは、URLを知らない者からは見られる恐れはないと考えてよろしいですか?。 目的・・・特定の仲間との情報交換にHPを利用したい。】と投稿したところ、6名7件の回答がありました。回答はそれなりに参考になりましたが、すべての回答が【目的】に対する回答であって、【質問】に対する回答になっておりません。  今年の四月、小生が加入しているプロバイダー(一流)から、『ロボット検索エンジンの場合、他のページからお客様のページへリンクされていれば、そのリンクをたどってデータベースに追加されますが、リンクが全く張られていない場合は追加されません』(原文のまま)との回答を得ています。そこで再度質問します。 【完全に独立し(他のページからリンクされていない)、かつ、いかなる検索エンジンへも登録していないHPを、URLを直接入力せずに開くことは可能ですか?。可能であればその方法は?。勿論、Favorites,History,Temporary Internet Files 等から開くことは例外です。】

専門家に質問してみよう