• ベストアンサー

標本分散、普遍分散。t検定がサッパリです

大学の授業で統計を習っています。 今t検定をやっているのですがさっぱり分かりません。 参考に・・ともらったプリントも記号だらけで何が何だか…という具合です。 用語もいっぱいでてきて混乱してしまいました… できればt検定をやさしく、本当に簡単に教えていただきたい(本を紹介してほしい)のですが、 とりあえず今分からないことを…。 標本分散と普遍分散の違いって何ですか? 同じだと思っているのですが、どうも違うような気がしまして…。 ご回答お願いします。

  • Rolily
  • お礼率82% (453/552)

質問者が選んだベストアンサー

  • ベストアンサー
  • myrrb
  • ベストアンサー率44% (23/52)
回答No.1

統計難しいですよね。 数式をあまり使わずにt検定のことを知りたいのであれば、 吉田寿夫 1998 本当にわかりやすいすごく大切なことが書いてあるごく初歩の統計の本 北大路書房 がおすすめです。 個人的には、研究者になられないのでしたら、t検定を使える(解釈できる)レベルで理解していればいいのではないのかと思います。そう考えると、二つの群の平均値を比べて、統計的に差があるかどうかを調べる手法がt検定、と覚えておけば十分です。 標本分散と不偏分散について 標本分散は、標本における分散であり、不偏分散は母集団における分散であると解釈しておけばよいのではないかと思います。標本というのは母集団から取り出した(母集団を表している)サンプルのことです。 例えば、日本人の大学生の平均身長が知りたかったとします。北は北海道から、南は琉球まで、各大学に打診して、健康診断の結果を送ってもらい、平均値を出すというやり方が考えられます。しかし、現実的にはかなり手間がかかりますよね?そこで、現実的にとることが可能である自分の通っている大学の学生のデータから、日本の大学生全体の平均身長を推測するのです。自分の通っている大学の学生が標本にあたり、日本の大学生全体が母集団にあたるわけです。 標本分散は字のごとく、標本における分散のことです。一方、不偏分散は母集団の(推定している)分散のことです。計算式の分母がnとn-1で異なっていますよね?これについては、不偏分散は推定値なので、標本分散から推定するときに1引かれるんだ、ぐらいで理解しとけばいいのではないかと思います。

参考URL:
http://www.amazon.co.jp/gp/product/476282125X/ref=pd_sim_b_1/250-5862250-2815410?ie=UTF8
Rolily
質問者

お礼

非常にわかりやすい解説、ありがとうございます。 オススメの本も教えていただき、助かります。 標本分散と不偏分散は違うものなんですね。 書かれているのをみてそういえばそう聞いたきがする…と思いました。笑 本当にありがとうございます。

関連するQ&A

  • t検定と1×2の分散分析の違い

    ある統計の本に、t2乗=Fであり、 t検定と1要因2水準の分散分析は同じだ、と書かれていました。 そうすると、t検定が存在する意味がなくなってしまう (分散分析だけですんでしまう)ことになると思うのですが、 なぜt検定をするのでしょうか。

  • t検定におけるt値の求め方について

    母平均の検定(1群を母平均と同じか検定)でt検定を行う際に、 T=(標本平均-母平均)÷(標本標準偏差)*√(n-1) と教科書にありました。ただ、次のサイト https://bellcurve.jp/statistics/course/9405.html を見ると、同じT値でも、 T=(標本平均-母平均)÷(不偏分散の標準偏差)*√(n) と書いてありました。不偏分散を求めるときに、n-1とするのは知っており、結局同じ式にはなっているのかと思いました。 以下質問ですが、 ①上の式はt検定なので√(n-1)は自由度を反映しているのだと思うのですが、自由度が違えば、下の式の不偏分散の求め方も、n-1で割るのではなく、n-2になったりするのでしょうか? ②以下のサイトに、nが大きければ、標本分散S²を母分散とみなしてz検定を行い、nが小さければ不偏分散を母分散とみなしてt検定をするとあります。 https://www.geisya.or.jp/~mwm48961/linear_algebra/t_test2.htm これは正しいですか?更に別の教科書には、nの数によって標本分散と不偏分散を使い分けるが、両方とも検定統計量Tを求めるとありました。それで、nが大きければTをZ分布表と比較すると書いてありました。 t検定は、サンプルが少ない時に使う確率密度のt分布表を使っていて、そもそもサンプルが小さい時点でt値を求めているから、比較先はt分布表だと思うのですが、、、。 解説のホームページによってかなりバラバラでどれが正しいのかわかりません。どうなっているのでしょうか。

  • 母分散と標本分散

    母分散と標本分散の違いで混乱しています。 『例題で学ぶ 初歩からの計量経済学』白砂堤津耶著のP26以降の記述が理解できません。何で標本分散だと(n-1)で割るに母分散だと単純にnで割るのですか? さらにネットで調べてみると、上記の本と違う内容(たとえば、標本分散のほうをnで割り、母分散を(n-1)で割る)などがあり混乱しています。実際は何が正しのでしょうか? もし宜しければご回答よろしくお願いします。

  • t検定について

    統計を勉強中の者です。今、A群20人とB群25人の平均の差の検定でt検定を行うとします。 t検定は、母集団が正規分布するときに使うが、標本が十分大きければ正規分布でなくともOKと本にかいてありました。 20人と25人では大丈夫でしょうか?よろしくおねがいいたします。

  • 標本平均、分散、期待値・・・混乱しています。。。

    統計の勉強をしていますが、 標本平均、分散、期待値とたくさん用語が出てきて、計算の仕方も混乱しています。 まず、標本平均x’(’は上の棒線) の期待値E[x']とは何を表しているのでしょうか? E[x]=npとの違いは?  pは確率 nは個数? あと、標本平均の分散V[x']=σ^2/nと 分散V[x]=npq  の違いが解りません。 i番目のV[xi]やE[xi]と言うのも出てきて更に混乱しています。 問題によって表し方が違うのでしょうか?

  • 標本数が少ないときの検定の仕方

    まず、私が今、行おうとしている検定の仕方をご説明します。 1. 非常に時間のかかる測定結果が数件あり、そのうちの1件(標本A)が平均から大きく外れた値を示しています。おそらく測定時になにかの外乱があり、このような値を示したのでしょう。原因を追求するのは、困難なのでこの値をすててしまいたいところです。 2. そこで平均、分散、標準偏差を計算しました。*** 3. 標本が正規分布をなすことを仮定して、標本Aよりも大きな平均よりのずれを示す確率を正規分布確率表で確認したところ、16%と出ました。 4. と、いうことはそのような値が生じる確率は16%ある訳で、この値を捨てるのは適切ではない。うーん。残念。←今、ここ。 さて、お聞きしたいのは***の部分です。 今回の場合、この異常値・標本Aを平均、分散、標準偏差の計算に用いることで、大きくこれらの値が変わってしまっています。 たとえば、標本Aを取り除いた上で、平均、分散、標準偏差の計算を行ってみると、標本Aの値が生じ得る確率は0.04%になります。ということはなにか変なことが起こったんだろうね、ということでこの値は捨てていいことになると思います。 しかし、異常値かもしれない値を、最初から取り除いて(つまり特別扱いして)行う検定というのもなんだか、ズルをしているようで変な気がします。 このような計算の仕方(検定の対象となる異常値をあらかじめ除いて検定を行うやりかた)は統計上、正しい手順なのでしょうか? そもそも標本数が少ないときにはもっと別の手順で検定を行うべきなのでしょうか? なにぶん、素人なので定義に反した用語の使い方をしているかも知れませんが、何卒よろしくお願いいたします。

  • 一要因の分散分析と、t検定について、教えてください。

    現在、心理学を勉強中です。 統計のところで、よくわからないところ不があるので、教えてください。 一要因の分散分析と、t検定の区別がはっきりわからず、 どのように使い分ければいいかがわかりません。 教えてください。 よろしくお願いします。

  • 分散分析かt検定か

    統計に関しては素人です. 要因は2つで,それぞれに水準が2つあります. ですので,セル(グループ?)は2×2で4つあります. 各セルのデータ数は45で,総データ数は180です. ちなみにそれぞれのセルで度数分布表を作ると正規分布します. どの要因が有意なのか知りたいのですが,二元配置の分散分析と総当 たりのt検定のどちらを行えばよいのでしょうか? また,総当たりのt検定を行った場合,結果をどのように解釈すれば 良いのでしょうか? 手もとと近所の図書館の本をザッと調べましたが結局参考になりませ んでした. 何か参考になりそうな本やHPを教えて頂けないでしょうか? よろしくお願いいたします.

  • excelの対応のないt検定について

    こんにちは。統計について質問させてください。 対応のないt検定を行おうと思っているのですが、比較しようとしている集団Aと集団Bの被験者の人数が異なっています。(例 集団A=68名 集団B=48名) (1)この場合、t検定は行えますか? (2)エクセルで行う場合、データタブのデータ分析、t検定等分散を仮定した2標本による検定でよろしいでしょうか? 宜しくお願いいたします。

  • 母分散が未知の場合の母平均の検定について

    統計学初心者の社会人です。 母分散が未知で小標本の場合の母平均の検定を行うには t分布を活用できる、ということを知りました。 その中で使用する値(検定量?)の導き方として、さまざまな書籍やサイトをあたったところ、 (1)t=(標本平均-母平均)/(標本標準偏差/√標本サイズ) と表記されているものと (2)t=(標本平均-母平均)/(標本標準偏差/√標本サイズ-1) と表記されているものがあります。 いったいどちらが正しいのでしょうか? 或いは、根本的に私の考え方がどこか間違っているのでしょうか? ご教授頂けると幸いです。