- ベストアンサー
日本語の単語を五十音別に分類したときの割合を教えてください
日本語の単語(例えば、国語辞典に掲載されている言葉)を五十音で分類したとき、各音ごとの単語数の割合はどうなっているのでしょうか? つまり、 「あ」で始まる言葉が何パーセント 「い」で始まる言葉が何パーセント : という具合です。 そのような統計データをご存じのかた、どうか教えてください。 自分で調べるとしたら、国語辞典のページ数でおよその割合を把握するしかないと思っていますが、ページ数の割合が必ずしも単語数の割合と近似しているとは限らないと思うのです。 よろしくお願いします。
- みんなの回答 (3)
- 専門家の回答
質問者が選んだベストアンサー
『CD-ROM版 広辞苑第五版』と、goo辞書の『大辞林第二版』+『デイリー新語辞典』+αを検索した結果の一部を、参考までに挙げておきます。 固有名詞(地名・人名・作品名等)や、カタカナ表記の外来語(これもいちおう日本語)を含んでいます。 広辞苑/大辞林 あ 7942 / 5699 い 7913 / 6579 う 4797 / 3884 え 3243 / 2483 お 7668 / 6557 か 13895 / 12143 き 8178 / 7606 く 4468 / 3602 け 3423 / 3284 こ 10242 / 8855 さ 6561 / 5817 し 15921 / 14498 す 3824 / 2730 せ 5617 / 5418 そ 3847 / 3578 少ないほう ぬ 662 / 487 る 444 / 204 を 6 / 16 ん 8 / 22 広辞苑や大辞林の収録語彙数は約23~24万項目、日本国語大辞典は約50万項目。ほかにも国語辞典に載らない専門用語や新語は数え切れないほどあります。 すべての単語を網羅した辞書は未来永劫ないでしょうから、あくまで特定の辞書に採録された語彙の範囲内での比率を求めるしかないでしょう。
その他の回答 (2)
- tanuki4u
- ベストアンサー率33% (2764/8360)
テレビ番組で トリビアの泉 というのがあります。 その番組で、辞書の真ん中にある単語はなんだ? ということをやっており、あたまからと おしりから 一週間ほどかけて順番に 読み合わせしていました。 それが本になっていると思いますので、それを探してはいかがでしょう ※ 番組では 馬鹿のように 頭から担当と おしりから担当がお互いに一つづつの単語を言い合っていた・・・orz
- nishikasai
- ベストアンサー率24% (1545/6342)
和英辞典には平仮名から探すものとローマ字から探すものがありますが、英語と違って日本語はKの字から始まる単語の多いこと! Kのページがなかなか終わらないのでローマ字でさがす和英辞典は面食らいます。英語なんかKで始まる単語はごくわずかですから。 回答になってないけど、ちょっと感想を述べさせてもらいました。
お礼
レスポンスありがとうございます。 なるほど、和英辞典という切り口もありますね。 「か行」の言葉と「さ行」の言葉(中でも特に「し」で始まる言葉)が多いということは経験的に知っているのですが、きちんとした統計データがなかなか見つけられずにいます。 引き続き回答をお待ちしています。
お礼
azuki24さん、貴重なデータの提供、ありがとうございます! コンピュータにカウントさせたのでしょうか。大変参考になります。 ちなみに私が知りたいのは、それぞれの構成比(パーセンテージ)なので、いただいたデータを元に整理すると次のような考えでよろしいのでしょうか? <広辞苑> <goo国語辞典> あ 約7500語÷23万語=3.26% 約5700語÷25万語=2.28% : し 約16000語÷23万語=6.96% 約14500語÷25万語=5.8% : ご指摘の通り、辞書の収録語数によってバラツキはありますが、最も比率の高い「し」で、6%前後というのが1つの目安になりそうです。 どうもありがとうございました。大変助かりました!