分位点と正規分布で成績を測る

このQ&Aのポイント
  • 学校でのアンケート調査で自分のテスト順位を10位単位で答えてもらいました。各学年で人数が違うので、偏差値を使って学力を測る必要があります。
  • 成績を順位で聞いた場合、分位点で偏差値を割り振る方法があります。これには正規分布の分布表が必要です。
  • 正規分布の分布表は、平均値や標準偏差から各順位の分位点を求めるために使用されます。これを利用して偏差値を計算することができます。
回答を見る
  • ベストアンサー

分位点と正規分布で成績を測る

学校でのアンケート調査で自分のテスト順位を10位単位で答えてもらいました(例:10~20位 や50~60位など) 各学年で人数が違うので、75人いる学年は70~80位までの回答になり、100人いる学年は100~110位のまでの回答になりました。 全員が正確に回答したら、例えば75人いる学年ならば、 1~10位が約10人、 10~20位も約10人、 20~30位も約10人・・・・ となるはずですが、実際はバラバラな人数でした。 これら各学年の人数が違いますが、学年を超えて一括してその学力を測るには、偏差値が必要になります。 普通なら、100点満点のテストで偏差値をとりますが、 この場合成績を順位で聞いていますので、分位点で偏差値をわりふる必要があるそうです。 そして、このばあい正規分布の分布表を使う必要があるそうです。 分位点で偏差値を割り振る方法を教えてください。 そして、この場合の正規分布の分布表はどのようにだすのですか?? その分布表をどのように使うのでしょうか。 わかりにくかったらごめんなさい。 よろしくお願いします。

noname#98923
noname#98923

質問者が選んだベストアンサー

  • ベストアンサー
  • sanori
  • ベストアンサー率48% (5664/11798)
回答No.2

こんばんは。 >>>わかりにくかったらごめんなさい。 全然そんなことないですよ。 >>> 全員が正確に回答したら、例えば75人いる学年ならば、 1~10位が約10人、 10~20位も約10人、 20~30位も約10人・・・・ となるはずですが、実際はバラバラな人数でした。 当然です。 試験の得点分布は確率事象であり、工業製品の寸法ばらつきなどと同じことが起こります。 大概、このようなグラフになります。 http://images.google.com/images?hl=ja&rls=com.microsoft%3Aen-US&sa=3&q=%E8%A9%A6%E9%A8%93%E3%80%80%E5%BE%97%E7%82%B9%E5%88%86%E5%B8%83 そもそも、どの順位の区間でも人数が同じならば、それは正規分布ではありません。 >>> 分位点で偏差値を割り振る方法を教えてください。 そして、この場合の正規分布の分布表はどのようにだすのですか?? その分布表をどのように使うのでしょうか。 学年内での順位と、学年全体の人数の情報はあるわけですよね? では、下記のように求めることになります。 正規分布表 http://www.biwako.shiga-u.ac.jp/sensei/mnaka/ut/normdisttab.html <例1> 30人中3位とか300人中30位とかの人の場合を考えます。 その人の上には、全体×0.1 の人数がいて、 その人の下には、全体×0.9 の人数がいることになります。 (この 0.1、0.9 という値が分位点に相当します。) この場合は、正規分布表において0.9に最も近い数字を探します。 それは、0.8997 です。 0.8997 からまっすぐ左に行くと、「1.2」と書いています。 0.8997 からまっすぐ上に行くと、「+0.08」と書いています。 合計すると、1.28です。 これは、平均点よりも標準偏差の1.28倍だけ上の成績であることを示しています。 偏差値というのは、平均点を50、標準偏差を10 としたものです。 ですから、この人の偏差値は、 50 + 1.28×10 = だいたい63 です。 <例2> 30人中27位とか300人中270位とかの人の場合を考えます。 その人の上には、全体×0.9 の人数がいて、 その人の下には、全体×0.1 の人数がいることになります。 この場合も、正規分布表において0.1に最も近い数字を探すことになりそうですが、 0.5未満の数字は表に載っていません。 その代わり、「下から数えて何位か」のような考え方をします。 (上記の正規分布表の上にあるグラフを左右逆にして考えるということです。) つまり、その人の偏差値は、 50 - 1.28×10 = だいたい37 です。 以上、ご参考になりましたら。

noname#98923
質問者

お礼

すいません、補足のところに書いてしまいました。 上は質問者の私charmsky82が書いたものです。

noname#98923
質問者

補足

丁寧な回答ありがとうございました。 とても参考になりました。申し訳ないですが、また疑問点ができたのでもう一度お聞きしてもよろしいでしょうか。 ・回答にWeb上で見つけてくださったと思われます正規分布表ですが、私も「正規分布表」で検索をかけてみたら、たくさんでてきました。しかし、どれも中の数字がちょっとずつ違うみたいなのですが、 正規分布表の数値はどのようにしてだしているのでしょうか。 自分にあった正規分布表を作ってから偏差値を求めるのでしょうか。 ・計算方法を参考にして実際に計算してみました。 1~10位 7人 10~20位 14人 20~30位 11人 30~40位 10人 40~50位 13人 50~60位 7人 60~70位 2人 の計64人の学年です。 この場合だと、20~30位の人は先の分布表を使った場合 50+0.00×10で偏差値50 また、50~60位の人は 50-1.08×10で偏差値39.5 という計算方法で大丈夫なのでしょうか? 長文すいません、 よろしくお願いします。

その他の回答 (3)

  • arrysthmia
  • ベストアンサー率38% (442/1154)
回答No.4

> 例えば、75人全員が「私は一位だった」と書いてきた場合、 > そこから何が判りますか? については、考察してみて戴けたでしょうか? テストの得点分布が、正規分布であろうが、一様分布であろうが、 他のどんな分布であろうが、順位で見て1~10位は10人、 11~20位も10人でなければなりません。そうでなかった分は、 アンケートの回答が、ウソまたは間違いを含んでいる…ということ になります。成績ではなくて、回答された「順位」の誤差が 正規分布する…と考える問題なのでしょうか?

noname#98923
質問者

お礼

アンケートは中学生を対象にしたもので、 かつ質問内容も「いつもだいたいどのくらいの順位をとっていますか」 というようなはっきりしたものにはしなかったので 間違いやウソを多少含んでしまっているのを承知したうえで あくまで推定として、調査をしています。 もちろん回答されなかった無記入のアンケートもたくさん ありましたし。 ただ、全員や大多数が同じ順位を選択することはありませんでした。 ありがとうございました!!!

  • sanori
  • ベストアンサー率48% (5664/11798)
回答No.3

お礼のお言葉をありがとうございました。 >>>上は質問者の私charmsky82が書いたものです。 ええ。大丈夫です。補足欄には質問者しか投稿できませんので、わかりますよ。 ^^ >>>しかし、どれも中の数字がちょっとずつ違うみたいなのですが、 >>>正規分布表の数値はどのようにしてだしているのでしょうか。 前回に私が示した正規分布表は、縦線から左に向かって無限遠までの、黒塗り部分の面積を表す表です。 ほかの例を挙げますと、この正規分布表は、 http://www.koka.ac.jp/morigiwa/sjs/standard_normal_distribution.htm 縦線から左に向かって中央までの部分の、黒塗り部分の面積を表す表です。 これらの面積(=表の中の数字)は、解析的に解くことができないので、 コンピュータを使って計算します。 円周率をコンピュータで計算する、という話は、おそらくお聞きになったことがありますよね? それと同様です。 >>> ・計算方法を参考にして実際に計算してみました。 1~10位 7人 10~20位 14人 20~30位 11人 30~40位 10人 40~50位 13人 50~60位 7人 60~70位 2人 の計64人の学年です。 あれれ? 合計人数は必要ですが、各階級の人数のデータは、今回のQ&Aの趣旨から言えば不要なのでは。 それから、 10位の人は、1~10位のグループと、10位~20位の両方に入るわけではないですよね? ですから、たとえば 1~10位 7人 11~20位 14人 21~30位 11人 31~40位 10人 41~50位 13人 51~60位 7人 61~70位 2人 のようになるのではないでしょうか? ・・・であるとして、 階級値は、各階級のど真ん中にするべきですので、 1~10位 → 5.5位 11~20位 → 15.5位 21~30位 → 25.5位 31~40位 → 35.5位 41~50位 → 45.5位 51~60位 → 55.5位 61~70位 → 65.5位 分位点は、 1~10位 → 5.5/64 = 0.0859375 → 1 - 0.9140625 11~20位 → 15.5/64 = 0.2421875 → 1 - 0.7578125  21~30位 → 25.5/64 = 0.3984375 → 1 - 0.6015625 31~40位 → 35.5/64 = 0.5546875 41~50位 → 45.5/64 = 0.7109375 51~60位 → 55.5/64 =  0.8671875 61~70位 → 65.5/64 = 1.0234375 正規分布表で数字を見つけます。 1~10位 1 - 0.9140 → 標準偏差の 1.37倍 → 偏差値63.7 11~20位 1 - 0.7578 → 標準偏差の 0.70倍 → 偏差値57.0 21~30位 1 - 0.6015 → 標準偏差の 0.26倍 → 偏差値52.6 31~40位 0.5546 → 標準偏差の 0.14倍 → 偏差値48.6 41~50位 0.7109 → 標準偏差の 0.56倍 → 偏差値44.4 51~60位 0.8671 → 標準偏差の 1.11倍 → 偏差値38.9 61~70位 1.0234 → 1より大きいため、圏外 以上、ご参考になりましたら。

noname#98923
質問者

お礼

全部の順位に対する偏差値を書いていただき、本当に手間かけてすいませんでした。 本当にありがとうございました。 あれから統計の基礎を一から勉強しなおして ようやくわかってきた気がしました!!! もっと勉強したくなりました。 参考にして他の学年もだしたいと思います。 丁寧なご指導ありがとうございました。

  • arrysthmia
  • ベストアンサー率38% (442/1154)
回答No.1

順位のデータだけからは、偏差値を推定することはできません。 例えば、10人が受けた試験の成績が、 100, 9, 8, 7, 6, 5, 4, 3, 2, 1 点だった場合と 100, 99, 98, 97, 96, 95, 94, 93, 92, 91 点だった場合とで、 一位の人の偏差値は、それぞれどうなりますか? また、何らかの方法で偏差値を推定できたとしても、 そのことで > 1~10位が約10人、 > 10~20位も約10人、 > 20~30位も約10人・・・・ > となるはずですが、実際はバラバラな人数でした。 の問題を解決することはできません。 例えば、75人全員が「私は一位だった」と書いてきた場合、 そこから何が判りますか?

noname#98923
質問者

お礼

回答ありがとうございました。 確かにarrysthmiaさんのおっしゃるとおりのような気がしますが・・・ ちなみに順位はひとつのテストでなく5教科総合の順位なので、極端に偏ることはないと思ったので・・・。 知識も考え方も未熟で;・・・申し訳ありませんでした。 ありがとうございました。

関連するQ&A

  • 四分位偏差と四分位範囲

    四分位偏差と四分位範囲 正規分布に従うデータには、平均 +/- S.D.で表せば良いと思います。 それでは、正規分布に従わないデータはどのように表せば良いのでしょうか? 中央値 +/- 四分位偏差だと思っていたのですが、 色々と調べていくうちに四分位偏差と四分位範囲があることを知り、 どちらを使えば良いのかわからなくなってしまいました。 また、 四分位偏差=(第3四分位点-第1四分位点)/2 四分位範囲=第3四分位点-第1四分位点 と理解しているのですが、正しいでしょうか? この2点について教えて下さい。 よろしくお願いします。

  • 正規分布に関する問題

    正規分布に関するこの問題が分かりません。誰か教えていただけないでしょうか。 「ある検査では、検査したものの35%は不合格で上位8%は優秀品として認定される。昨年の検査では、合格点が1000点満点で420点、優秀品の最低点は800点であった。検査の得点が正規分布に従うとするならば、この検査の平均点はXで、標準偏差はYである。」 お願いします。

  • 正規分布に関する問題

    受験者1,000人の4教科のテスト結果は表のとおりであり,いずれの教科の得点分布も正規分布に従っていたとする。90点以上の得点者が最も多かったと推定できる教科はどれか。 教科、平均点、標準偏差 A、45、18 B、60、15 C、70、8 D、75、5 分かりやすく解説お願いします。

  • 正規分布の問題

    大学の小テストの過去問なのですがわかりません。。 ある大学の男性の平均身長は170cm,標準偏差10cm      女性の平均身長は156cm,標準偏差9.6cmで正規分布である。 この大学からランダムに男性1人,女性1人を選んだ場合,男性の身長が女性の身長より高い確率を求めよ。 テスト用紙には標準正規分布表があります。 お願いします。

  • 正規分布

    正規分布に関する問題です。 ある中学校の男子の身長の平均は163.0cm、標準偏差8cmの正規分布に従う。このとき男子2人を無作為に選ぶとき、2人の身長の差が5cmを超える確率を求めよ。 2人を比べるというと分布表の使い方がわからなくなってしまいました。誰か解き方を教えてください。

  • 正規分布表 ひとつの標本に対して1つ?

    正規分布表について。正規分布表は標準偏差と平均値で変化するのでひとつの標本に対して1つしか正規分布表はありませんよね?(標準偏差も平均値もサンプル数にしか左右されないので[あってますか?]) たとえば、AとBの場所について個体数、分類群数のデータがあったとして個体数についての統計をかけ、 ZからPが出て仮説を棄却するか判定するといことを分類群数もして、正規分布表を作ろうとした時に、 個体数、分類群数で正規分布表は変わらず、同じものですよね? わかりににくて申し訳ありません。回答よろしくお願いします!!! (一応、使用してる検定はマーホイットニーのU検定です)

  • 正規分布の標準化について

    たとえば、Aという母集団で、変数X(あるテストの点数)は、正規分布(μ1、σ1^2)に従うとします。 Bという母集団は、変数Y(おなじテストの点数)は、正規分布(μ2、σ2^2)に従うとします。 ここで、母集団AとBに関わらずテストの点数の偏差値を比べることができるためには標準化を行えばいいわけですよね? Xについては、標準化を行い、(X-μ1/σ1)が標準正規分布(0,1)に従い、 Yについては、標準化を行い(Y-μ2/σ2)が標準正規分布(0.1)に従う。 として、(X-μ1/σ1)と(Y-μ2/σ2)を比較してどちらが偏差値が上か比較することは可能ですよね??? 私の考え(解釈)は合っていますか?どこか間違っていますか? 何か自信がないので訂正などあればアドバイスお願いします。

  • 正規分布していない状態での偏差値

    教えてください。 正規分布していない or 世紀分布しているか怪しい状態で、試験の成績などのばらつきを偏差値で表すことに、意義はあるでしょうか? 正規分布でなければ偏差値が使えないのではなく,正規分布でなければ例えば「偏差値40~60が全体の約68%をカバーする」などと言えないだけだ、と書かれたwebページを見て、確かにそうだと思いました。 では、たとえば正規分布しているか怪しい状態、たとえば50人程度の少数の塾で模擬試験を行い、成績を偏差値で表したします。 その偏差値には「塾の講師として指導するための実務的な意味で」あっても、意味はない、と考えるべきでしょうか? 「50人という少人数の試験結果だから偏差値自体に誤差のようなものがあるが、生徒の学力を大まかに把握して、指導方針を立てる」というような使い方をしても良いものでしょうか?

  • 正規分布

    どうやって解いていけばよいのでしょうか。よろしくお願いいたします。 作業1を完了するのに必要な時間は平均時間は75分、標準偏差は15分の正規分布に従う。作業2に関しては平均100分、標準偏差10分の正規分布であるとする。作業2の平均所要時間よりも、より長くかかる1の割合は如何ほどか?一方、1の平均所要時間よりも、短い時間ですむ2の割合は如何ほどか?

  • 正規分布

    正規分布を勉強し始めたところです。 いくつか問題をやってみたのですが模範解答と答えが合わない、私の分布表の見方が正しいかどうか自信が無い、で困っています。 質問1) 問題→ Given that X~N(20,16), find: P(17≤ X ≤ 27) 回答 → 0.7333 私の出した答え → 0.6865 模範解答の途中式も(0.9599 – (1 – 0.7734)で 私は間違っていると思うのです。私は(1-0.7734)+(0.9599-0.5)=0.6865 です。 質問2)問題は画像通りです(すみません一番上に写っている =0.7333は関係無いので無視して下さい。 わからないのは下の方に鉛筆で書き込んでいますが 正規分布表から得た数字が私のとは違うのです。 昨日こちらで違う質問をした時 「正規分布表には、バリエーションが ある」というのを初めて知りました。 が、私の使っているのは模範回答者のと同じでP(Z ≦ t) の表です。 ですから私の表の読み方が間違っているのかどうか教えて欲しいのです。 0.714 .....の私の読み方→ まず左端から0.71が 0.7611 それに右端から4 →12 をプラスして 計0.7623になります。(うまく書けなくてすみません) 私の表の読み方は間違っていますか? 質問3)質問1の問題では ≤  質問2の問題では <  を使っています。 この違いはこの場合考慮しなくていいのですか? 模範解答では配慮していないのですが... 質問が多くてすみません、どうぞ宜しくお願い致します。