• ベストアンサー

コーパスのメリット

質問ですが、コーパスは google などの検索に比べて何が便利なのでしょうか? この前、コーパスなるものを知り合いに教えてもらいました。 しかし、よく考えると、google などの検索エンジンでも、"look at" などとして検索すれば、文例が山のように出てきます。おまけに、ソースのテキストはほぼ無尽蔵です。 いまいち、コーパスを使うメリットがわかりませんでした。 http://www.okweb.ne.jp/kotaeru.php3?q=564801 を参考に使ってみたのですが、重たいし、ちゃんとしたのは有料だし、なにかメリットがないと・・ よろしくおねがいします。

質問者が選んだベストアンサー

  • ベストアンサー
  • d-y
  • ベストアンサー率46% (1528/3312)
回答No.3

コーパスの良いところは、 (1) 実際に通じる文章が集めてある。 (2) 集めてある文章に、分野の偏りが少ない。 悪いところは (1) 無料のは、データ量が少ない。 (2) ちょっと重たいかな。 検索エンジンの良いところは、 (1) お手軽。 (2) ソースのテキストが膨大。 悪いところは (1) 英語を知らない人が書いた間違った文章が、たくさん含まれている。 (2) 同じ文章が引用されて、あちこちのページに掲載されている等、データの偏りが激しい。 どちらも一長一短あります。 コーパスも良いですが、検索エンジンも(短所を分かった上で使えば)捨てがたいと思います。

white-tiger
質問者

お礼

わかりやすい説明をありがとうございます!

その他の回答 (2)

noname#140046
noname#140046
回答No.2

No.1 の Adjective さんと同じで、わたしも「コーパスを使う」を、どういう意味で使われているのかちょっと分かりかねますが、たとえばコーパスを使って編纂されている今の英英辞典を使うこと自体、「コーパス」を使っていることにもなります。(87年に英国でコウビルド英英辞典が出版されたときは衝撃でした。)それとも、「用例を調べたいときに使ってみる」という意味でおっしゃっているのでしょうか。いずれにせよ、用例を調べる上で、コーパスの役割と検索エンジンの役割はずいぶんと違うと思います。 おのおのの辞書が使っているコーパスは、それぞれ出版社の個性が出るものですが、信頼できる大きなコーパスであればあるほど、そこに入力されていることばは日常生活で触れえるさまざまな分野のことばをできるだけカバーしているものです。たとえば、「学生同士が日常会話で使う言葉・恋人同士のささやき・恋文・新聞の記事・小説・ニュース原稿・家庭内での会話・市井の人の手紙・電話で使用される言葉遣い・大学の講義・論文・駅のアナウンス、遺言状、硬軟取り混ぜての書物、幼児のおしゃべり、広告コピー、などなど」思いつくだけ挙げていってもきりがないのですが、そこは専門家がやること。もっともっと広範囲な場面で使われている現代の言語を数十億語、ともすると数百億語もコンピュータに打ち込んでいるのです。これにより、頻度も簡単に探り出せます。 一方、検索エンジンで引っかかってくる表現というのは、あくまで「現在のWEB上に乗っている言語」にとどまります。したがって、量的には無尽蔵に見えても、かなり用例が偏っていて、現代英語の一面しか見ることができないのではないかと思います。(基本的な日常語彙などの検索には問題ないでしょうけど。)それに、コンピュータでデータ処理されているわけではないので、「頻度」とか「硬い言い回し」、「ぐにゃぐにゃのやわらかい言い回し」、「正しい用法でないが、通用している用法」、「ちょっと古臭い」といったことは一切わかりません。 わたしはS社の回し者ではないことをお断りしておきますが、英和辞典で言えば WISDOM が、日本の出版社で初めてコーパスに全面的に基づいて編纂された辞書です。とはいえ、いまはどの英和辞典も進化してきましたから、どれを使おうと「じっくり読みこなす」という習慣をつければ、力はついていきます。

white-tiger
質問者

お礼

だいぶん事情が分かってきました。 ありがとうございます。

  • adjective
  • ベストアンサー率17% (241/1356)
回答No.1

質問の意味が今一分かりません。 >コーパスのメリット >コーパスは google などの検索に比べて何が便利なので>しょうか? googleもネット上のコーパスと言えるでしょう。 ソースが違うというのが一つでしょう。googleはNETのみでは? Cobuild辞書のコーパスは新聞・雑誌も含まれます。教養のある人の書いた文からの引用がある。 例えば日本語ですが、ロボット検索系では日本語でも個人ページの文にHITします。 また検索にHITするような裏技があるので厳密な意味で 正確な語句や頻出表現順というわけにはいきませんが・・・。特に正しい語句の使い方かというのは怪しいですよね。 未知の言語の正しい表現を学ぶ意味では辞書系のコーパスの方がいいと思いますけどね。

white-tiger
質問者

お礼

お返事遅れてすみません。 そうですか、Googleもコーパスと言っていいんですね。

関連するQ&A