• ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:文書検索で、このアルゴリズムあたまいい?)

pure perlで文書検索のアルゴリズムを考える

このQ&Aのポイント
  • pure perlで文書検索のアルゴリズムを考えることについての質問
  • mecabを使用して、文書を単語ごとにデータベースに入力する方法についての質問
  • mecabを使用して、文書の単語ごとにデータベースから削除する方法についての質問

質問者が選んだベストアンサー

  • ベストアンサー
回答No.1

ご提案の方式のアルゴリズムはいわゆる転置インデックスだと思います。 http://ja.wikipedia.org/wiki/%E8%BB%A2%E7%BD%AE%E3%82%A4%E3%83%B3%E3%83%87%E3%83%83%E3%82%AF%E3%82%B9 "全文検索エンジン"などの言葉で検索するといろんな人が色んな物を作っているので、自分だったらそれを再利用できないかをまず考えます。 一応、自作するとしたら参考になりそうなURLを貼っていきます。 http://gihyo.jp/dev/serial/01/search-engine http://gihyo.jp/dev/serial/01/make-findspot ご提案の方式は上記の説明に比べるとちょっとナイーブかもしれません。

ymda
質問者

お礼

ありがとうございます。 実装をなるだけ複雑にしたくないこともありというのもあり シンプルなものを考えていました。 さすがに、完全な転置インデックスが(mecabが使えなくて)使えなくても 高速な検索をできるようにというのから、考えていました。

関連するQ&A

専門家に質問してみよう