• ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:統計学・確立論から見ての割合)

統計学・確率論から考える、文字の割合について

このQ&Aのポイント
  • 統計学・確率論から見て、全ての文字が「潰れ文字」となり、それが都合よく重なって本来の記事とは異なる記事として読めることはありえないかについて教えてください。
  • 過去の新聞記事には文字が「潰れ文字」になっているものがありますが、それでも文法論的な観点や「潰れ文字」の大雑把な形から推測して記事を読むことができます。
  • しかし、全ての文字が「潰れ文字」となり、さらに違う文字に形が変わってしまった「潰れ文字」が都合よく重なって本来の記事とは異なる記事として読めることは、統計学・確率論的に考えるとありえないのでしょうか?

質問者が選んだベストアンサー

  • ベストアンサー
  • Ishiwara
  • ベストアンサー率24% (462/1914)
回答No.3

#1,2です。 > 無造作に10文字を選出して意味のある10文字の文章ができる確率は、限りなく0%に近いと考えて問題ないのでしょうか? そのとおりです。ただし、選出した後で勝手に順序を変えないものとします。順序を変えてもよいことにすると、意味の有る確率がグンと上がります。そのようなパズルを「アナグラム」といいます。 > 10文字で考える場合「あああああああああい」と言う文も「48の10乗」の中に入っているわけですよね? そのとおりです。 > 無造作に10文字を選出して、どれだけの文字列ができるかを考えるとき、どうして「48の10乗」という数になるのか、その理由だけでも教えて頂けますか? 詳しく説明するには、確率論の教科書から「重複順列」の項をそっくり引用しなければなりませんので、簡単な説明でかんべんしてください。(48という数は、詳しく吟味すれば正しくないのでしょうが、まあ適当にやっているわけです。) 1文字なら、 あ、い、う、、、ん----で48とおり。 2文字なら、 ああ、あい、あう、、、あん----で48とおり いあ、いい、いう、、、いん----で48とおり うあ、うい、うう、、、うん----で48とおり ‥‥ んあ、んい、んう、、、んん----で48とおり 合計48×48とおり。 同様にして、 3文字なら、48×48×48とおり、 4文字なら、48×48×48×48とおり、 10文字なら、48×48×48×48×48×‥‥×48とおり、 (48が10回掛け算されています)

siniti009
質問者

お礼

分かりました。 何度も回答誠にありがとうございました。 感謝致します

全文を見る
すると、全ての回答が全文表示されます。

その他の回答 (2)

  • Ishiwara
  • ベストアンサー率24% (462/1914)
回答No.2

#1です。 子規が「俳句は有限個しか作れないから、いつかは滅亡する」と悩んでいたのは本当らしいのですが、彼がどのくらい数学の素養を持っていたかは、不明です。しかし、当時の文化人は垣根を越えて(漱石と寅彦のように)交流していたらしいので、だれかから知識を得ていたかもしれません。 あああああああああああああああああ から んんんんんんんんんんんんんんんんん まで 「48の17乗」しかない、しかも、その中で意味を持つものは、ごく僅か、というのが、その根拠のようです。しかし、これは、空が落ちてくると心配していた昔の中国の人みたいなものでしょう。「48の17乗」匹のバイキンを集めれば、地球の大きさよりはるかに巨大なお団子ができます。まあ、話題として楽しむていどにしておきましょう。

siniti009
質問者

お礼

回答ありがとうございました。 確立も低いことはよく分かりました。 本当に何度も回答ありがとうございます。 また補足質問をしてしまいましたが 時間がある時に申し訳ありませんが再度回答 して頂けると助かります。 回答ありがとうございました

siniti009
質問者

補足

つまり無造作で10文字を選出し意味ある 10文字の文章を作る事は確率論で考えれば限りなく0%に近いと 考えて問題ないのでしょうか? 10文字で考える場合「48の10乗」で考えられると思うのですが この場合「あああああああああい」と言う文も「48の10乗」の中に 入っているわけですよね? 無造作で10文字を選出して、どれだけの文字が 出来るかを考えるとき、どうして「48の10乗」と言う数式が 出きたのか、その理由だけでも教えて頂けますか? 本当に何度もすみません。

全文を見る
すると、全ての回答が全文表示されます。
  • Ishiwara
  • ベストアンサー率24% (462/1914)
回答No.1

数学的には「有りえる」 実用的には「有りえない」 数学では、確率が0でない限り「有りえる」とします。 正岡子規が「俳句は何とおりできるか」考えたそうですが、たった17字でさえ、むちゃくちゃに大きな数となり、その中で「意味のある」俳句は、むちゃくちゃに小さい割合となるでしょう。まして、一般の文章では気が遠くなる数字となります。 それでも、数学では「0」と「0より大きい数」を峻別します。

siniti009
質問者

お礼

回答誠にありがとうございます。 正岡子規の例など物凄く参考になりました。 本当にありがとうございます。 しかし、また補足質問をしてしまったのですが 時間が空いた時で構いませんので申し訳ありませんが 再度、回答して頂けると本当に嬉しいです。 回答して頂きありがとうございました。

siniti009
質問者

補足

申し訳ありません。 もう少し詳しく聞きたいのですが 正岡子規が「俳句は何とおりできるか」 考えたとありますが、これは、およそ100文字の 中から無造作に17字を選んだ場合17文字の組み合わせで さえ意味が通る文が出来る可能性は0%に近い割合に なると言う事でしょうか? ましてや記事の様に長い文章を書く時に無造作に文字を 選んで意味が通る文章が出来る確立は本当に限りなく0%に 近くなると言う事でしょうか? この様な計算は、どの様な数式を用いれば計算出来るのでしょうか? 本当に何度も質問をしてしまい御迷惑をかけ申し訳ありません。 何度も質問をしてしまい申し訳ありません。

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • 確率と統計

    サイコロを10回投げると、奇数が出る確率は0.8/2だった 100回投げると1.2/2だった。 1000回は、1/2だった。 この統計が統計学で結果1/2が確率で、 奇数の目が出る確率且つ4以上の確率を求めるのが確率論なのでしょうか? 結局、統計自体は、帰納法で求め、 確率論はそれを公理(前提)として組み立てたと言う事でしょうか?

  • 「ナンバーズ」「ロト」における確率論について。

    確率論について、教えて下さい。 確率論を語る上で、よく例に挙げられるのが、サイコロの出目で すが、あくまでも確率の問題であり、サイコロを振って、次に出る 目を予知することはできませんよね? そうだとするならば、「ナンバーズ」や「ミニロト」「ロト6」にお いて、よく週刊誌などで、「次の狙い目は、この数字だ!」みた いな記事を見掛けますが、これは意味があるのでしょうか? 「ナンバーズ」や「ロト」の専門の雑誌も、ありますよね。 オカルトなのか、若しくは、「統計学」なのか、どうなのでしょう? 仮に、「ナンバーズ」や「ロト」における「狙い目予想」を「統計学 」だとするならば、この場合の「統計学」に意味があるとは思え ないのですが、如何でしょうか?

  • 確率論関して

    再質問になってしまい申し訳ないのですが お願いします。 例えば「2」と言う字体が崩れ「4」と言う字体に 完全に変化してしまう確率は0%に近いと言う事ですが どうしてそう思うのか、もう1度教えて頂いてよろしいでしょうか? 確かに「文字の崩れ方」に規則性はありませんし確率論で求める 事は出来ないと思いますが条件が揃えば「2」が「4」に変化する 可能性も十分ある気がするのですが、この条件が揃うこと自体が 限りなく0%に近い。と言うことなのでしょうか? どんあな意見でも構いませんので回答お願いいたします。

  • 統計のやり方について【早めの回答お願いします】

    学期末レポートに使いたいデータのまとめ方に困っています。 ある期間とテーマを設定して、その期間中のテーマに沿っている一日ごとの新聞記事の件数とその記事の文字数の合計をまとめました。 その2つのデータから設定したテーマの注目度、即ち期間中の取り上げられ方の推移を数値で分かりやすく算出し、グラフにまとめたいのです。 統計に関しては全くの素人なので右も左もわからない状態なのですが、少しインターネットで調べたところ多変数解析というのが関連あるのかなあ、と思いました。 使っているソフトはマイクロソフトのエクセル2008です。 どのようにしたらいいか全く分からないので、方法を、そして無理でないならばなぜそのような方法で求めるのか?というのを教えていただけると嬉しいです。 レポートの締切りが近くに迫っているので回答お願いします。

  • 文字検索可能なPDFをコピーする方法はありますか。

     新聞を文書スキャナー(SsanSnap)で、全文検索(文字検索)が可能なPDFにして新聞記事のスクラップを作っています。しかし、写真付きの記事を文と同時に(記事丸ごとということ)コピーしたいのですが、うまく出来ません。文字検索出来ないかたちのPDFは出来るのですが。検索可能なPDFでもコピーする方法はありますか。

  • 勤労統計問題

     毎月勤労統計の不正調査 厚生労働省の毎月勤労統計調査で、従業員500人以上の事業所を全数調査すべきところ、2004年から東京都分について約3分の1の抽出調査にしていた問題。04~17年は抽出した数値を全数に近づける復元処理を行っていなかったため、給料が高い東京都の大企業の比率が本来より小さくなり、平均賃金などが低くなっていた。 との記事があります。 この文章では、大事業所全てからデータを取っていたが統計処理するとき3分の1を採用したのか、3分の1の企業からしかデータを取っていなかったのかわかりません。 前者なら、データを追加処理すれば正しい事になり、後者なら2004年から2017年に至る過去のデータを集めねばなりません。 マスコミも野党もこの点を明確にしていないのでお尋ねします。 問題発覚から3ヶ月で、正しいデータにしたというのだから前者と理解はしていますが。

  • 論理力を鍛えたいのですが

    理工系大学へ通っている者です。  質問についてですがまず、現代文ができるようになりたいです。ここでいう現代文ができるというのは、現代文の問題が解けるということだと定義します。論理力を鍛える手段として、現代文が解けるように勉強したいのです。それは現代文の問題は論理的に解くものであり、それゆえに論理的に考える能力、いわゆる論理力が鍛えられていない人には解けないからです。  さらに現代文と英語は繋がっていると良く聞きます。それは論理とは言語を手段としていますが、本質は世界共通のものであるために、論理力が鍛えられていれば、従って英語の文章を読み書きするのも論理的に理解できるようになるからです。私は英語が苦手で、受験で何度も泣かされました。じつは英語ができるようになりたいと以前からずっと思っていたのですが、いくら勉強してもなかなか入試問題の文章を読んで理解することすらできなくて諦めていました。  さらに論理というのは理系科目にも直結影響するもので、自分の大学の成績にも関わってくるはずです。  また、自分は今まで、人より優れたものを見つけたことはありません。勉強だって受験の結果は良くなかったです。スポーツだって部活でやっていた水泳を10年くらいやっていましたが、要領の良い人であれば2.3年で練習していた人にタイムを越されてしまいますし、大学の授業でやっているバスケだって、週1で4日も練習しているのに、シュートをスリーポイントエリア内から10回投げても3回くらいしか入りません。仕事のバイトだっていつまでたってもノルマを達成しない業績です。部活だってロボットを作る活動をしているそれに所属していますが、誰よりも部活に出席しているのに、全く作業が進まない上に、要領が悪いせいで図面を書き直しになったりして、、先輩からは能力がないと見放されそうです。このように全てができない原因は、物事をイメージでしか理解しようとせず、字を用いて論理的に考える力が書けているのも一つだと思っています。  このような理由で、論理力を鍛えるために、現代文の勉強をしようと思っています。が、うまく行きません。 自分が思い当たることは二つあります。日本語の文法や語彙力がまず自信がありません。それと、出口先生の『システム現代文(解法公式集)』を解いているのですが、どうも自分にとって解説が分かりづらいのです。  現代文が解けるようになるために、現代文の問題を解くことがすごく苦手な人というのは、まずどんな勉強をするべきでしょうか。やっぱりがむしゃらに現代文の問題を解きまくったり、本(ラノベ)を読みまくる しかありませんか。

  • やさしい統計学(日本経済新聞より)

    お世話になります。最近、日本経済新聞にやさしい統計学という記事が掲載されていると思います。この欄をきっかけに、基礎から統計学の習得を試みているのですが・・・。さっそくつまづいているため、どなたかフォローアップをお願いします。 【質問】 標準偏差をどのように出していますか? 本日(2013年8月1日)の掲載分を一部下記に抜粋します。 「仮説36人を検定しましょう。36人がそれぞれ五分五分の確率で電話をかけてくるとすると、かけてくる人数は平均値が18、標準偏差が3の正規分布にほぼあてはまります。」 問題背景としては、昨日(2013年7月31日)の掲載分の内容を下記に補足いたします。 「あなたは、新築マンションの販売員で、新聞にちらし広告を入れたとします。あなたは見学者の人数を予想する必要があります。見学を決めている人たちは五分五分の確率で事前に電話をかけてくることを、経験的に知っているとします。今、10人のお客さまから電話がありました。実際の見学者は何人でしょうか。」 記事では、実際の見学者の人数を36人・16人などの仮説を立てることで導こうとしています。 【質問の経緯】 標準偏差は、分散の平方根により求められると理解していました。 標準偏差=3の時、分散=9だと考えますが、 この分散=9は、324(平均値18の二乗)÷36(仮説としての実際の見学者の人数)により求められたと今は理解しています。 この324は、平均値18を二乗したものですか? それとも、この324は、「電話した人=0」「電話しない人=-1」として合計の値を-18として、 この-18を二乗したものですか?(これは僕の勝手な妄想です) 標準偏差は、分散の平方根により求められると理解しており、 分散は、そもそも平均値との差を二乗していることから求めると思っていました。 そのため、 「仮説36人を検定しましょう。36人がそれぞれ五分五分の確率で電話をかけてくるとすると、かけてくる人数は平均値が18、標準偏差が3の正規分布にほぼあてはまります。」 という記載が、腑に落ちず、色々と考えてしまいました。 平均値を単純に二乗していることから求めている気がしてしまい。 どなたか教えて頂けますと幸いです。 駄文失礼いたしました。

  • 文字の大きい「本」の事

     お世話になります。  私は加齢とともに新聞や文字の大きい記事しか  読まなくなりました。 質問ですが新聞の文字と  同じ大きさで出版されている「本」ジャンルは  小説や紀行文等です。よろしくお願します。

  • 英語の省略について

    英語の省略についてお伺いしたいのですが、従属節の中や共通構文とみなせるもの以外にも、口語や新聞記事等では、言わなくても分かる事であれば基本的に何でも省略してしまってよいと考えてよろしいのでしょうか。新聞の見出しであれば品詞・構文のみならず文法的な流れは無視してもキャッチーなものであればよいと?一番お伺いしたいのは、ニュースから日常会話レベルの口語でネイティブが本来、我々の学校英語で正しいというか適正とされているというか例文として扱われている文章から、どのレベルまで省略をしてしまうのかということなのです。