リストの単語がテキストファイルで何回出てくるか

締切り済みの質問

リストの単語がテキストファイルで何回出てくるか

「人の苗字+改行」がたくさん入力されているname.txtと
「苗字が登場する会話文」がたくさん入力されているconv.txtの
二つのファイルがあります。

【name.txt】
鈴木
田中
佐藤
・・・

【conv.txt】
昨日の山田さんの話によれば、明日は佐藤さんが担当だそうだ。
京都の中山君が来たときに荷物を届けてほしい。
・・・

これらname.txtのそれぞれが、conv.txt全体で何回出てきたかを求めるprelのプログラムを作りたいのですが、どのようにしたら良いでしょうか。
アウトプットは
鈴木 256
田中 982
佐藤 157
・・・
となるようにしたいと思っています。
皆さまのお知恵をお貸しくださいませ。

投稿日時 - 2008-09-05 10:50:45

連想キーワード:

QNo.4305160

すぐに回答ほしいです

2人が「このQ&Aが役に立った」と投票しています

[  前へ  |  次へ ]

回答(3件中 1~3件目)

ANo.3

この課題で検索のアルゴリズムを考えるときは、以下の点に留意したほうがいいでしょう。
・二重カウント(「森」さんは「森田」さんでもヒットしてしまいます)
・苗字と普通名詞・地名等との区別(「川原で」「上野駅」など)

投稿日時 - 2008-09-06 11:00:35

ANo.2

> なんとなく、処理内容はイメージできていたのですが、
> 具体的なスクリプトはどのようになるでしょうか。
>
>name.txtもconv.txtも、数万行のオーダーになっていまして、
>どのようにすれば速いか、というのも気になっています。

まず自分のイメージをコードにしてみて、そこで問題が出ているのなら
それを聞くべきではないでしょうか。

これじゃ丸投げ。

投稿日時 - 2008-09-05 14:36:51

お礼

確かにおっしゃるとおりでした。
一旦閉めて、またあらためることにします。

ありがとうございました。

投稿日時 - 2008-09-05 18:40:32

ANo.1

name.txt を1件読む度に、その苗字をキーにして conv.txt を検索する、ということを繰り返すという処理内容が、一般的だと思います。

投稿日時 - 2008-09-05 11:01:06

お礼

どうもありがとうございます。

なんとなく、処理内容はイメージできていたのですが、
具体的なスクリプトはどのようになるでしょうか。

name.txtもconv.txtも、数万行のオーダーになっていまして、
どのようにすれば速いか、というのも気になっています。

投稿日時 - 2008-09-05 11:22:05

あわせてチェックしたい
  • 日本の五大名字「佐藤・鈴木・高橋・田中・渡辺」が主人公という例を教えて・・・ ...
  • 「鈴木さん」・「佐藤さん」 ...
  • 「佐藤、鈴木、高橋」・・・イメージの違いは? ...
PR
【回答募集中】花粉にひと言、物申す![ 詳細 ]

OKWaveのオススメ

教えて弁護士さん!

お金の悩みQ&A特集はこちら