• ベストアンサー

X人の集団の最高点が分かっている時ある得点の出現率を調べる方法

X人の集団の最高点が分かっている時ある得点の出現率を調べる方法 300人の集団の最高点が72点、最低点が16点(平均点を44点とする)のテストで、 98.6点をとれるのは何人にただ1人だけですか。 (全員が最大限の能力を発揮し、点数の分布は正規分布に従っているとします) また、偏差値98が何人中ただ1人かを計算するには http://staff.aist.go.jp/t.ihara/normsdist.html 上のページを参考にどのように計算すればいいでしょうか。

質問者が選んだベストアンサー

  • ベストアンサー
  • kzkz_tool
  • ベストアンサー率78% (22/28)
回答No.3

こんにちは p=0.5と言う条件ではPr(X>=260)はほぼ0になります。 Pr(X>=260)=0.001が正しいとすると、p=0.5のような均質な集団ではないと言うことになりますので、モデル化を変える必要がありますね。 どうも遠回りでスミマセン。 Pr(X>=260)=0.001という条件をつければ正規分布での取り扱いも可能になります。 正規分布を特定するには平均とSDを導く必要があります。 平均をとりあえず(100+300)/2=200として、 これとPr(X>=260)=0.001という条件からSDを計算します。 偏差値のURLからα/2=0.001となるようなZは3.09です。 これから、 (260-200)/SD=3.09⇔SD=19.42 と求まります。 後は同じように Pr(X>=c)=Pr{(X-200)/19.42>=(c-200)/19.42} =Pr{Z>=(c-200)/19.42} とやれば求まります。 たとえば、c=280のとき、URLより、Pr(Z>=4.11)=1.98E-05 となります。 このモデルの妥当性については、研究者の感覚に合うかによりますが。。

alice-whacker
質問者

お礼

自分なりに、平均160、Pr(X>=260)=0.003、SD=36.36として 60点以下が1/335、280点以上が1/2000、300点~が1/17,000、355点~が1/2400万 を得ることができました。 このたびはありがとうございました。

全文を見る
すると、全ての回答が全文表示されます。

その他の回答 (2)

  • kzkz_tool
  • ベストアンサー率78% (22/28)
回答No.2

なるほど。 では、ちょっとモデルが違うかもしれませんね。 二項分布でモデル化するといいかもしれません。 p=0.5(100~300回ですので、大体半分とした)の確率で成功するような事象を n=360回繰り返した。このとき、成功回数X>=355となるような確率は? となります。 この確率は Pr(X>=355)=?_(i=355→360) 360Ci p^i q^(n-i)=2.1161*10^(-98) となり、意図的な交配も何もしていない条件のもとでは10の-98乗となり、 とてつもなく低い確率となります。ちなみに成功確率pをもっと小さくすると さらに確率は下がり、大きくすると大きくなります。ただ、成功確率を 300/360=0.833としても、確率は4.6114e-022となり、やはり小さいことには 代わりありません。 ただ、このモデルはp=0.5という集団、すなわち意図的な交配がない集団で このようなことが起こる確率です。意図的な交配は偶然でないため、 この数値でそのまま評価することはできません。 蛇足ですが、npおよびnp(1-p)が十分に大きければ、Xは平均np=180、分散np(1-p)=90 の正規分布に近似的に従うので、 Pr(X>=355)=Pr((X-180)/√90>=18.97)≒0となります。 ご質問のURLでz=18.97でのα/2はあまりに小さすぎるために存在しません。

alice-whacker
質問者

お礼

ありがとうございます。 二項分布で成功回数X>=260(100回以下の失敗)とした場合はどうなるでしょうか。 (Wolfram_Alphaにチャレンジしましたが計算できませんでした) 一般のラット数百匹のうち、このようなラットが1匹はいるので、 モデル化が正しければX>=260の場合、0.1%以上の確率になると思います

全文を見る
すると、全ての回答が全文表示されます。
  • kzkz_tool
  • ベストアンサー率78% (22/28)
回答No.1

これは何かの問題集の問題でしょうか? この問題は不完全で一意の答えを持っていないと思います。 正規分布を一意に特定するためには平均と分散の二つのパラメータが必要ですが、 レンジと平均とサンプルサイズだけでは分散を有効に推定することは不可能です。 大体このくらいかな~とあたりをつけることはできますが。。 ちなみに、老婆心ながら98.6点と偏差値98は違うものです。 偏差値は平均50、SD10に基準化したときの値です。 偏差値98だと平均+4.8SDなので、Z=4.8のときの上記HPの値7.94E-07 を使い、偏差値98以上(ここ大事)となる割合は1/7.94E-07=約126万人に一人です。 ちなみに、連続データでは偏差値がちょうど98になる確率は0になります。 その辺は密度という概念を修めてもらう必要があります ただし、点数と偏差値は別物なので、上記の問題の答えにはなりません。

alice-whacker
質問者

お礼

ご回答ありがとうございます。 これは問題集の問題ではありません。 このニュースが元です。 http://www.asahi.com/science/update/0727/TKY201007270578.html 求めたいのは正解率98.6%(355/360)を出すラットが自然に出現する確率です。 大体でいいので分かりませんか? 下の問題は別件です。単純にどう計算するか知りたかっただけです。 紛らわしくてすみません。

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • 得点分布の偏差値などをエクセルで求める方法

     次の(1)(2)について教えてください。 (1) 人数の少ないクラスの得点のデータ(100点満点)が 例えば 「19、35、58、65、71、85、98」 とした場合  得点分布グラフの中心付近の面積の90%以下(90%に入らない)の点数 と 90%以上の得点が何点になるかを エクセルで求める方法を教えてください。    可能であれば、具体的に「19、35、58、65、71、85、98」の 例で教えてもらえると助かります。  (2) テストの点数でなく、単なる 「数」 の場合も(1)と同様の計算になるのでしょうか?   例えば 5人の人の小銭を持っている枚数の場合   例「3枚、6枚、8枚、9枚、14枚」であった場合の  保有枚数分布グラフの中心付近の面積の90%以下(90%に入らない)の枚数 と 90%以上の枚数が何枚になるかを エクセルで求める方法も教えてください。  この90%以上、以下が偏差値というのか分からず、標題と異なる質問かも知れませんが、ご回答よろしくお願いします。

  • テトリスの最高得点教えてください

    つい先日、押し入れの中から10年ぶりくらいにゲームボーイを発見しました。 一時期狂ったようにはまった「テトリス」もでてきて、またまた今はまりまくっています。 そこで質問なのですが、これって一体どのくらい得点(もしくは本数)取れるものなのでしょうか? というのもわたしの最高が、ポイントでいうと30万点を越えることが何回か、本数で言うと200を越えることが何回かというところで、点数はともかく、200本を越えると落ちてくる速度がはやすぎて、とてもコントローラーでさばききれないくらいの勢いになってしまいます。 「こんなスピードで落ちてきたらできるわけないだろ!」とひとりで怒っていますが、たしかテトリス全盛時代には、それなりの「プロ」みたいな人がたくさんいましたよね。 彼らは一体どれくらいのレベルだったのでしょうか。 自薦他薦を問いません。 あなたがご存知の、そして実在の最高スコア(点数か本数)を教えてください! ※ファミコンではなくゲームボーイのみでお願いします。

  • 正規分布の標準化について

    たとえば、Aという母集団で、変数X(あるテストの点数)は、正規分布(μ1、σ1^2)に従うとします。 Bという母集団は、変数Y(おなじテストの点数)は、正規分布(μ2、σ2^2)に従うとします。 ここで、母集団AとBに関わらずテストの点数の偏差値を比べることができるためには標準化を行えばいいわけですよね? Xについては、標準化を行い、(X-μ1/σ1)が標準正規分布(0,1)に従い、 Yについては、標準化を行い(Y-μ2/σ2)が標準正規分布(0.1)に従う。 として、(X-μ1/σ1)と(Y-μ2/σ2)を比較してどちらが偏差値が上か比較することは可能ですよね??? 私の考え(解釈)は合っていますか?どこか間違っていますか? 何か自信がないので訂正などあればアドバイスお願いします。

  • 相加平均とN数しか分からないときには?

    テストの結果で、そのテストの全体の相加平均(平均点)とN数(受験者数)、自分の得点しか分からないときには、どのようにしてその集団内の順位、または偏差値を知ることができるのでしょうか。 ばらつきを意味する標準偏差などはわかりません。 テストは100点満点です。 もしも、正規分布だったとしたらということで考えて下さい。 統計学や分析については素人ですので、四則計算でできる計算式を教えて下さい。

  • 統計学が全くわかりません。

    以下の問題の解答および、解法手順を教えていただけると幸いです。 1・ある生徒の集団の、ある科目の点数の偏差値は、平均50、標準偏差10の正規分布を仮定して計算している。 (1)この集団で偏差値が65以上の生徒の割合はいくらか。 (2)この集団で、偏差値が55から60までの割合はいくらか。 (3)この集団で偏差値が45以下の生徒の割合はいくらか。 2・無作為に選んだn=100人の大学生からの図書館利用率調査で、利用者をX人とするとき、学生全体の中での利用率pの90%信頼区間を求めよ。 (1)実際にⅹ=64人が利用していたとき、pの点推定値としてのp(上にちょぼっとしたマークがついています)はいくらか? (2)Xは2項分布に従うが、これを正規分布で近似するとすれば、この正規分布の平均uおよび分散oの2乗はnやpを用いてどうあらわせばよいか。 (3)p(上にちょぼっとしたマークがついています)=X/rを正規分布で近似するとすれば、この正規分布の平均uおよび標準偏差oはnやpを用いてどう表せるか。 (4)p(上にちょぼっとしたマークがついています)=X/nを標準化してZ=・・・の形で表せ。 (5)(1)のp(上にちょぼっとしたマークがついています)を用いて学生全体の利用率pの90%信頼区間を小数3位まで求めよ。

  • 得点の補正方法を教えてください

    学生のテスト得点の補正方法(補正式)について教えてください. コンピュータシステムの関係で採点結果が60点以上が合格と採点されてしまいます. この得点をエクセルで計算させ、合格者は70点以上の点数になるように表記を書き換えたいのです. 事情は割愛させていただきますが、そもそもの配点を問題毎に変えるなどの細工は出来ません. また、単純に10点加算のようにゲタを履かせるだけでは0点は0点でなくなりますので、全ての得点に係数のようなものをかけて全体を変換できるのが理想です. 条件は、 1.0点は0点のまま 2.100点は100点のまま 3.60点が70点になる(正確には60点が70点以上となり、59点は70点未満になる). 4.合格もしくは不合格にしなくてはならない人数は特に考える必要はない. ということです. 数学に通じていないので、突拍子もない無理難題なのかも知れません. このように変換する事自体可能でしょうか. 可能もしくはこの条件に近い変換をするためにはどういう計算式を使うのがよいのか教えてください. よろしくお願いいたします.

  • 偏差値と順位

     資格試験の模試の結果の平均から、自分が上位何パーセントに知りたいのですが、情報は点数・偏差値・平均点のみです。  ここで偏差値から順位を求める際に必要な標準偏差がないのですが、一般的な公式『偏差値={10(点数-平均点)÷標準偏差}+50』を以下のように変形して、上記情報から標準偏差を求めてみました。  標準偏差=10(点数-平均点)÷(偏差値-50)  これを基に、Excelで正規分布関数(NORMDIST)を使って上位何%の位置にいるのか算定しようとしたのですが、偏差値が53.43なのになぜか上位0.0何%とかいうへんてこりんな数字が出ちゃいました。  数式は『1-NORMDIST(偏差値、平均点、標準偏差、TRUE)』です。  なお、そのデータは、点数20点、偏差値53.43、平均点19.1点です。  点数の分布は一応、それなりに正規分布に近い形になっていると思うのですが、なぜこうなるのでしょうか?  原因が分かる方、教えて下さい。なお、当方は統計学ド素人です。

  • 2つの正規分布が合わさる?問題

     2集団における得点分布は、平均だけ異なる正規分布N(50,100)、N(55,100)にしたがうとする。これの集団から得られた得点をそれぞれ、X、Yと表すとき、平均の小さい方が大きくなる事象、つまり、前者の方が後者より得点が大きい、X>=Yとなる事象の確率を求めよ。 という問題なのですが、自分で調べたところ、2つの独立な正規分布から作った線形結合、aX+bYも正規分布に従うらしい・・・ということはわかったのですが、イマイチどのように利用すればいいのかがわかりません。どなたかご教授よろしくお願いします。

  • 正規分布

    あるN人が試験を受けたとします。得点分布が正規分布に従うと仮定し、最高点Mと上位U人の平均点A、上からU人目の得点Lは与えられているものとします。 このとき、ある人の得点からその人が上から何番目か求めることはできますか? できないとすれば、どのような条件を加えれば求まりますか?

  • 標準偏差について

    ある正規分布(標準偏差a)に従う集団からある正規分布(標準偏差b)に従う集団を引いたもの(または足したもの)の正規分布の標準偏差cは、aとbを用いてどのように表せるのでしょうか? 確か数式があったと思うのですが、ど忘れしました。 平均はただ足しただけだったと思うのですが、 標準偏差は足してルートとったりとかしてたような気が… ネットで調べてもうまく見つからないので、 覚えている方がいればお願いします。 稚拙な説明で申し訳ありません。