• ベストアンサー

標準偏差およびt-分布表について

教えてください。 本に下記の例題がありました。 「取り出した標本が10、20、30、40であった と仮定します。この平均値の信頼区間をt表でもとめてください。」 回答は以下のようです 「平均xは(10+20+30+40)/ 4=25 標準偏差sは SQR{((10-25)^2+(20-25)^2 ・・・+(40-25)^2)/4)}=11.2 このxとsを下記の式に代入して t=(x-μ)/(s/SQR(n-1)) と記述して計算しますとあります。 質問1 標本から取り出したサンプルからの標準偏差の分母は 標本数nでなく、標本数nから1を引いた値n-1を分母として計算すると習ってきましたが、なぜこの問題ではsを求めるのにn-1でなくnで割ってあるのでしょうか? t分布表を使うときの標本の標準偏差はnで計算した値を利用しておこなうと考えるのでしょうか? 質問2 標本の標準偏差の分母はn-1とすると習ってきましたが、標本数が2のときには2-1ではなく2のままで標準偏差を計算すのですか? 標本が3を超えたときn-1を適応するのでしょう か?

質問者が選んだベストアンサー

  • ベストアンサー
回答No.5

こんにちは。補足にお答えします。 じつは,間違ったことを書いてしまったので,管理者に回答の削除要求メールを出したのですが,まだ実行されません。 なにがなんだか分からなくさせて,ごめんなさい。 補足で質問してくださってありがとうございました。 言葉の定義は, ごらんになった参考書のものが正しいです。 わたしのNo.3回答は取り消して,再度書き直します。 ・標本の(√nで割った計算で求めた)標準偏差は「標本標準偏差」 ・√(n-1) で割った計算値は,母標準偏差の不偏推定値です。(不偏分散の平方根 ともいいます)

masa104
質問者

お礼

なんどもありがとうございました。 よく理解できました。 ご親切にご指導いただきましたこと感謝します。

その他の回答 (5)

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.6

nとn-1ですが、素人の私が理解できている範囲で。  母集団の場合は、nで除算をします。しかし、母集団全体を利用できる場合は、1年A組とB組を比較するなど標本数が少なくて、全てを計算に利用できる場合に限られています。また、蛍光灯の寿命を比較する場合などは、全部の蛍光灯を試すと、販売のための商品がなくなってしまい、現実的ではありません。  そこで、母集団から抜き取った標本を利用して母集団の値を推定します。その場合、標準偏差なら母集団はnで除算をするわけですから、標本の場合は、危険性を配慮して、やや大きめになるように、n-1で除算をします(nで割るより、n-1で割った方が大きな値になる)。  ある本に、nの値が小さいうちは、危険性が少なくなるし、nの値が大きい場合は、nでもn-1でも大して違わない、と書いてありました。確かに、99で割ろうと100で割ろうと、大して違わないかと。別の本には、n-1が適正(n-0.5でもなくn-2でもない)なのは、数学的に証明できると書いてありました。

masa104
質問者

お礼

具体的な内容でりかいできました。 ありがとうございました。 今後ともよろしくお願いいたします。

  • ymmasayan
  • ベストアンサー率30% (2593/8599)
回答No.4

No.1のymmasayanです。補足にお答えします。 >補足質問ですが、はじめの標準偏差の計算の分母をn-1として求めた場合には、 >t分布の式のsにこの値を代入して、自由度はn-1(4-1=3)ではなく >n=4のt値を求めるのでしょうか? √nと√(n-1)が入れ替わっても一見よさそうですがt検定でやっぱりまずいですね。 正解が間違っているということで訂正をしてください。 最初の標準偏差の計算は4でなく3で割ります。 t値を求めるときは√4を使います。 t表を使うときの自由度は4-1=3を使います。

回答No.3

No.2です。用語が少し違っていましたので若干訂正します。 標本標準偏差=不偏分散の平方根のことでした。すなわち,母標準偏差の不偏推定値のことです。(n-1)を分母にしたときの値です。 標本データの(分母nでの)標準偏差計算値は,単に標準偏差というようです。

参考URL:
http://www.ssri.com/software/ex2000/function/basicstat.htm
masa104
質問者

お礼

ありがとうございました。 統計についても初心者なので、理解できるお言葉で説明いただきまして感謝します。 今後もよろしくおねがいします。

masa104
質問者

補足

言葉の定義を再度教えてください。 標本標準偏差=母標準偏差の不偏推定値とのことですが、他の参考書によりますと以下のように書いてあります。なにがなんだかわからなくなりましたのでお教えください。 標本分散(s^2)は母分散の不偏推定値(k^2)ではないので下記に式をもちいて変換すると記述してあります。 k^2=n/(n-1)×s^2・・・(1) この参考書によりますと 母集団の各名称は  母平均、母分散、母標準偏差 母集団の不偏推定値の名称は  母平均の不偏推定値、母分散の不偏推定値、母標準偏差の不偏推定値 標本では  標本平均、標本分散、標本標準偏差 との名称をしようするとなっています。 仮にこれが間違えでないとすると、教えていただいてる標本標準偏差=母標準偏差の不偏推定値と定義するのは正しくないと考えます。 母分散の不偏推定値を求めるのに標本分散を(1)式に代入して算出するとの記述が正しいとするなら、標本標準偏差は母分散の不偏推定値であるとの定義は適切ではないとおもわれますがいかがでしょうか? 言葉の定義がわかりません。 ご指導お願いします。

回答No.2

masa104さんの習ったこと(あるいはその記憶)に少し間違いがあると思います。 ・標本データの標準偏差(そのもの)すなわち,標本標準偏差を求めるときは,分母を √n(=n^(1/2))としてください。これは約束事(定義)です。 ・標本データを使って,母集団の標準偏差すなわち母標準偏差,の推定値を求めるときには, 分母を√(n-1)(=(n-1)^(1/2))としてください。これは,その方が不偏推定値としてふさわしいからです。  

  • ymmasayan
  • ベストアンサー率30% (2593/8599)
回答No.1

質問1. 疑問に思われるのは無理ありません。普通はおっしゃるとおりですがt分布の式に√(n-1)が入っています。 √nと√(n-1)はどちらがどちらにあっても構わないのです。紛らわしいですね。 質問2. 標本数が少なすぎると推定や検定の意味がありません。 せめて標本数が6個以上くらい欲しいところです。 √nと√(n-1)の適用は設問1のとおりです。

masa104
質問者

お礼

最後箇所で理解できました。 お忙しいのに補足に対するご回答を早速いただきまして感謝したおります。 今後ともよろしくお願いいたします。

masa104
質問者

補足

ありがとうございます。 補足質問ですが、はじめの標準偏差の計算の分母をn-1として求めた場合には、t分布の式のsにこの値を代入して、自由度はn-1(4-1=3)ではなくn=4のt値を求めるのでしょうか? お願いいたします。

関連するQ&A

  • 母標準偏差・標本標準偏差と標本平均(Xバー)の標準偏差

    (聞きたいのは、最後の3行がメインです) http://oshiete1.goo.ne.jp/qa3478996.html の質問をしたものです。 標準偏差を求めるとき、(ルートの中の)分母が「n」か「n-1」 の2種類があることはわかりました。 母標準偏差であっても標本標準偏差であっても「n」で求められる が、標本から母標準偏差を推定するときが「n-1」を使うという ことで理解しました。 ところで、「n」にしても「n-1」にしてもそんなに値としては 変わらないということなんですよね? 高校の時の教科書で、「標本平均(Xバー)の標準偏差」という のがありました。  「母平均m、母標準偏差sの母集団から大きさnの無作為標本  抽出するとき、標本平均Xバーの標準偏差σ=s/(ルートn)」 というのがありました。  「標本標準偏差」とこの「標本平均Xバーの標準偏差」というの は全然違うものなんですよね?(値も全然違うものになってしま うと思います。)

  • 標準平均Xバーの標準偏差について

    たびたびすみません。 http://oshiete1.goo.ne.jp/qa3484149.html を質問させていただいたものです。 まず、「標準平均Xバーの標準偏差」というのは「標本誤差」という のですか? そもそもこの標本誤差というのは何に役立つのでしょうか? 高校の数学の教科書の問題で、下記のようなものがありました。 「ある県の17歳男子の体重の平均値は62kg、標準偏差は9kgである。  この県の17歳男子100人を無作為抽出で選ぶとき、100人の体重の  平均Xバーの期待値と標準偏差を求めよ。」 この標準誤差?というのは9/√100で0.9kgとなると思うのですが、 この0.9kgはどんな意味をもつのでしょうか? 100人全体の標準偏差は、「標本標準偏差」というものになり本来は 分母をn-1にして、これが母標準偏差の推定値ということなんです よね?それでこれはだいたい9kgに近いということですよね? (分母をnにしたものを標本標準偏差と呼ぶの?) 文章下手ですみません。 よろしくお願いします。

  • 標準偏差について

    エクセルで、標準偏差の式は4種類あり (STDEV、STDEVA 、STDEVP、STDEVPA) 違いがよくわかりません。 はじめの2つは分母が(n-1)、あとの2つは分母がn となっています。 高校の数学で習ったときは、分母はnだったと思います。 この違いはなんですか? (2つずつ同じ数式ですが、Aがあるのと無いのでは何が  違うかわかりますか?) エクセルのヘルプでは、下記のように書いてあります。 STDEV 引数を正規母集団の標本と見なし、標本に基づいて母集団の標準偏差の推定値を返します。 STDEVA 数値、文字列、および論理値を含む引数を正規母集団の標本と見なし、母集団の標準偏差の推定値を返します。 STDEVP 引数を母集団全体と見なし、母集団の標準偏差を返します。 STDEVPA 数値、文字列、および論理値を含む引数を母集団全体と見なし、母集団の標準偏差を返します。

  • 標準誤差の式について

    標準誤差を求める式、SE = SD / √nについて質問がございます。 現在、標準誤差を勉強しております。 標準誤差が標本平均の標準偏差だと知り、 下記母集団を単純な例にして標準誤差を求めました。 ■1 母集団「2,3,4」 標本集団「2,3」「3,4」「2,4」 ■2 母平均:μ=3 母標準偏差:σ=√[{(2-3)^2 + (3-3)^2 + (4-3)^2} / 3] = √(2/3) ■3 標本平均:μ1=2.5、μ2=3.5、μ3=3 標本平均の平均:x=3 標本平均の標準偏差(標準誤差): s=√[{(2.5-3)^2 + (3.5-3)^2 + (3-3)^2} / 3] = √(1/6) ■4 標準誤差の式にあてはめ SE = SD / √n =√(2/3) / √3 =√(2/9) 3は標準偏差の公式に当てはめました。 4は標準誤差の公式に当てはめました。 計算間違いあるいは値の代入間違いでなければ、 3の標準誤差と4の標準誤差は同じになるはずだと思うのですが、 なっておりません。 何故なのでしょうか? 3の計算方法が間違っているのでしょうか? お教えていただければ幸いです。 以上、宜しくお願いいたします。

  • 正規分布の標準偏差

    「質問」 下記の画像に記述されている標準偏差の意味がわかりません。 「質問の経緯」 標準偏差や分散の意味については理解できているつもりです。 下記の画像の赤線の部分には正規分布nの分散は120^2 と書かれています。なので当然標準偏差は120です。 ところが、この後標準偏差を無作為標本の標本数で割っています。 正規分布の標準偏差を無作為標本の標本数で割った数のことを 標準偏差と書いているようなのですが、ここについてよく分かりません。 「質問のまとめ」 正規分布の標準偏差を標本数で割った数字を改めて 標準偏差としている意味がよく分かりません。 教えてほしいです。

  • 標準誤差と標準偏差の違いは何?

    誤っているのはどれか? 1. 算術平均値とは対象群のすべての変量の総和をその対象群の総数で徐したものをいう 2. 2集団の平均値が同じであっても2集団を構成する標本の分布が等しいとはいえない 3. 集団の標本が正規分布している場合、平均値±標準偏差の範囲には標本中の約68.27%が抱合される 4. 集団における平均誤差の絶対値は常に標準誤差の絶対値より大きい 5. 正規分布する標本数の等しい2集団において、標準偏差の絶対値が等しければ平均誤差の絶対値も等しい ――――-―――――――------------------------------------- このような問題を考えています。 自分なりに答えを出すと・・・・・・ 1. 算術平均値とは対象群のすべての変量の総和をその対象群の総数で徐したものをいう →(○)正しい。  定義どおりだと思います。 小学校で習った平均値ですね。 2. 2集団の平均値が同じであっても2集団を構成する標本の分布が等しいとはいえない →(○)正しい。 極端な例が混ざれば平均値は同じでも、バラツキがちがう 3. 集団の標本が正規分布している場合、平均値±標準偏差の範囲には標本中の約68.27%が抱合される   →(○)正しい。 そのとおり標準偏差(SD)のSD±1は68.27%である。 SD±2はたいか95%くらいでしたっけ。 SD±3は99.9%くらいだね。 つまりバラツキの度合いに占めるパーセンテージだと。 4. 集団における平均誤差の絶対値は常に標準誤差の絶対値より大きい →(○)正しい。 これがうさんくさい。 でも、私の持論によると・・・・・ ■SEχ(標準偏差の平均値)=σ/ √n     σは標準偏差です。 ■SDχ(標準誤差の平均値)=s/ √n      sは限られたサンプルより抽出した標準偏差の「予想値」です。                          そしてnはサンプルのサイズ(数)です。 つまり、標準偏差(SD)は国勢調査などで「全員」の数が把握できている場合であり、標準誤差(SE)は、大阪のミナミの繁華街の商店街の「全員」ということで つまり、 ■SEχ(標準偏差の平均値)=σ/ √n          →σ/ √日本の総人口 ■SDχ(標準誤差の平均値)=s/ √n          →s/ √大阪ミナミの商店街の人口 ・・・・ということで分母が小さくなりますから、 1/1000 と 1/10 では、1/10がおおきいですね。 つまり、調査の数が少ないと、誤差も大きくなるとそういうわけで、 誤差の絶対値は標準偏差よりも高くなるというわけです。 ですから一見この選択肢が誤りに見えますが、実は正しいのだと思います。 間違っていればどこがまちがっているか教えてください! 5. 正規分布する標本数の等しい2集団において、標準偏差の絶対値が等しければ平均誤差の絶対値も等しい →(○)正しい。 そのとおり。 本物と同じだから誤差も無い

  • 標準偏差

    体積計のキャリブレーションをします。 3回測定して標準偏差を出すんですけど、標準偏差の式の分母はnにするんですか?それともn-1にするんですか? ネットで検索したら、標準偏差の式はnでやってるものもあればn-1でやってるのもあってどっちが正しいのかわかりません。 教えていただければ嬉しいです。

  • 正規分布の標本標準偏差

    今、抵抗の正規分布の実験をしています。 ここで、1.6KΩの抵抗200本をLCRメーターを用いてKΩ単位で測り、これをエクセルに入力しました。 これをΩの単位に直すために1000倍して、これらの数値から標本標準偏差を出そうと思っています。 しかしながら、どう計算させても10.59という馬鹿大きい数値が出てきてしまいます。 最初はエクセルのSTDEV関数を用いて算出しましたが、どうにも信用できない数値なので、STDEV関数は使わず標本標準偏差の基本式を少しづつ崩してエクセル上で計算させたのですが、やはり10.59という数値になってしまいました。 試しに、KΩ単位のままで標本標準偏差を出してみたところ、0.01という、Ω単位の時の1000分の1倍の数値しか出てきませんでした。 標本平均は1590Ωと、少し低い値ですが、許容誤差範囲だと認識しています。 エクセルのシートを変えて計算させてもこの数値にしかなりません。 標本標準偏差は1に近いほど良いということですが、どのくらいの数値の範囲に収まるのが理想的なのでしょうか? また、このような経験のある方、こうじゃないか?と思われる方、エクセル、標本標準偏差に詳しい方がいらっしゃいましたら、ご回答をよろしくお願いします。

  • t検定におけるt値の求め方について

    母平均の検定(1群を母平均と同じか検定)でt検定を行う際に、 T=(標本平均-母平均)÷(標本標準偏差)*√(n-1) と教科書にありました。ただ、次のサイト https://bellcurve.jp/statistics/course/9405.html を見ると、同じT値でも、 T=(標本平均-母平均)÷(不偏分散の標準偏差)*√(n) と書いてありました。不偏分散を求めるときに、n-1とするのは知っており、結局同じ式にはなっているのかと思いました。 以下質問ですが、 ①上の式はt検定なので√(n-1)は自由度を反映しているのだと思うのですが、自由度が違えば、下の式の不偏分散の求め方も、n-1で割るのではなく、n-2になったりするのでしょうか? ②以下のサイトに、nが大きければ、標本分散S²を母分散とみなしてz検定を行い、nが小さければ不偏分散を母分散とみなしてt検定をするとあります。 https://www.geisya.or.jp/~mwm48961/linear_algebra/t_test2.htm これは正しいですか?更に別の教科書には、nの数によって標本分散と不偏分散を使い分けるが、両方とも検定統計量Tを求めるとありました。それで、nが大きければTをZ分布表と比較すると書いてありました。 t検定は、サンプルが少ない時に使う確率密度のt分布表を使っていて、そもそもサンプルが小さい時点でt値を求めているから、比較先はt分布表だと思うのですが、、、。 解説のホームページによってかなりバラバラでどれが正しいのかわかりません。どうなっているのでしょうか。

  • 標準偏差と誤差

    初めて質問します。 一般に標準偏差の計算は,母集団=標本集団とすると (測定値-平均値)の2乗の和をデータ数で割ったものの平方根だと思います。 (EXCELのSTDEVP関数もこの計算をしているようです。) ところで,大学のときに習った平均自乗誤差は, 母集団=標本集団の場合 (測定値-平均値)の2乗の和をデータ数の2乗で割ったものの平方根 ただし,母集団>標本集団の場合は, (測定値-平均値)の2乗の和を (データ数*データ数-1)で割ったものの平方根 以上のように習いました。 そこで質問です。 1.分母が標準偏差は1乗で,平均自乗誤差は2乗なのはなぜでしょうか? 2.母集団>標本集団の場合は,(データ数*データ数-1)になるのはなぜでしょうか? 3.EXCELには母集団=標本集団のSTDEVP関数と 母集団>標本集団のSTDEV関数がありますが,母集団>標本集団の場合の標準偏差の計算というのはどんな計算をしているのでしょうか。 よろしくお願いします。