• ベストアンサー
  • すぐに回答を!

テキスト検索の英文の説明をお願いします。

  • 質問No.3016491
  • 閲覧数128
  • ありがとう数2
  • 気になる数0
  • 回答数3
  • コメント数0

お礼率 34% (83/243)

テキスト検索について知識が無いのですが
こちらのページ(http://hpsupesu.gozaru.jp/
の内容をを都合があり理解しなければ
ならないのですが英語を訳してもテキスト検索についての
知識がなく専門用語等でよくわかりません・・・。
出来るだけわかりやすく説明していただければ
本当に助かるかります。
本当に申し訳ないのですが宜しくお願いいたしますm(_ _)m

質問者が選んだベストアンサー

  • 回答No.2
  • ベストアンサー

ベストアンサー率 42% (161/378)

1.「辞書」は、単語と、単語が使われている場所を記録したファイルへのポインタと、類似語を記録した別の辞書へのポインタを持つ。
2.「データ(名前がないので)」は、どのドキュメントでそれぞれ何回、どの場所で単語が使われているのかを表す。(章、文、語の番号で位置を記録)
3.ドキュメントは、ドキュメントの本文とインデックスで構成され、「データ」はインデックスへのポインタを持つ
4.インデックスは、プライバシーコードによってそのデータへのアクセス許可を制限する
5.ドキュメントは、段落やドキュメントにタイトルを持つ
6.辞書はISAM形式で保存される

だいたいこんなところですかね。細かい情報はまだありますけど。

ぶっちゃけると、「単語」に分割して、その全ての出現位置を1つずつ記録して、最後にそれを合計して「出現回数」を持った「辞書」を作ります。
あとは、逆に辞書から単語を検索し、使われている文書内の位置を検索できるようになります。
割と単純な手法ですが、辞書を作りやすい英文(日本語だと、空白で区切る習慣がないので「どこからどこまでが単語」という解析が先)では割と効果的じゃないかと思います。
#検索頻度が上がると重くなりそうですが。
お礼コメント
mpacy3

お礼率 34% (83/243)

ご回答ありがとうございます。
回答を参考に訳して結構わかりました。
現在以下の部分の訳がよくわからないのですが出来ればご回答頂ければありがたいです。

STAIRS implements a separate SELECT access system for formatted fields, as opposed to the SEARCH mode used with normal content terms. Methods are provided to process queries containing both objective and content terms.
投稿日時:2007/05/24 03:20

その他の回答 (全2件)

  • 回答No.3

ベストアンサー率 42% (161/378)

#2です。
私も翻訳機だよりなので、あまり期待しないでください。

元ページの前後の文脈から、「formatted fields」というデータの用途に触れているみたいですね。
通常のSEARCHモードに加えて、書式化された情報(例えば参考書籍の為に[GoF95]と著者+年を記載する、とか)を検索するSELECTモードを備えている、かな。
  • 回答No.1

ベストアンサー率 40% (157/390)

う~ん。。。
これ、「STAIRS」というテキスト解析検索システムのファイル構造図のようなんですが、
一般人に見せても大丈夫なものなんですか?
こういうのは、「どのようにデータを持ち、高速に検索することができるか」が
ノウハウになるはずなので、公開できるとおもえないんですが。。。
お礼コメント
mpacy3

お礼率 34% (83/243)

学校の課題で出たので自分も一般人でよくわからないのですが見ても問題ないと思います。
英文は図を説明しているのはわかるのですが専門用語等で全くわからない次第です・・・。
投稿日時:2007/05/21 18:20
結果を報告する
このQ&Aにはまだコメントがありません。
あなたの思ったこと、知っていることをここにコメントしてみましょう。
関連するQ&A

その他の関連するQ&Aをキーワードで探す

ピックアップ

ページ先頭へ