統計学 t検定・カイ二乗検定の手計算について

このQ&Aのポイント
  • 統計学に関連するt検定とカイ二乗検定の手計算方法について質問があります。大学院入試に備えて勉強している学生です。試験では単純計算機能のみの電卓とカイ二乗分布表が使用可能です。
  • 具体的な問題として、男女それぞれ10人の給料を調査した結果が与えられており、男女の給料格差について検定する必要があります。帰無仮説と対立仮説を立て、母分散が等しいと仮定する場合と等しくないと仮定する場合の両方について検定する必要があります。
  • また、母分散が等しいかどうかを有意水準1%で検定する方法についても知りたいです。t検定ではなく、カイ二乗分布表を用いた検定方法があるのでしょうか?上級の分析手法を必要とするのかも気になります。
回答を見る
  • ベストアンサー

統計学 手計算による t検定・カイ二乗検定の計算について

統計学に関する質問です。 私は来週行われる大学院入試のため、統計学を勉強している学生です。 過去問を解いていたところ、どうしても解き方がわからない問題があ り、教えて頂きたく質問を投稿いたしました。 問題は以下のとおりです。 ※試験では単純計算機能のみの電卓、カイ二乗分布表が使用可能。 問.同じ年齢・学歴・職種の男女10名ずつの給料を調べたところ、   次の表の通りであった。 男性 15.4 18.3 16.5 17.4 18.9 17.2 15.0 15.7 17.9 16.5 ------------------------------------------------------ 女性 14.2 15.9 16.0 14.0 17.0 13.8 15.2 14.5 15.0 14.4 (万円) (1)帰無仮説、対立仮説を立て、男女の給料格差について検定しなさ い。ただし、母分散は等しいと仮定し、有意水準は5%とする。 (2)母分散は等しいと仮定しないで、同一の検定をしなさい。 (3)母分散は等しいかどうか、有意水準1%で検定しなさい。 1と2はt検定、3はF検定かと思ったのですが、t分布表がないため t検定が使えません。 カイ二乗分布表を用いて検定する方法があるのでしょうか? 何かもっと上級の分析手法を用いなければならないのでしょうか? 問題を標本分布としてではなく、母集団自体として考えて正規分布を 想定すれば計算できるのかなとも思ったのですが、それは問題文の解 釈がおかしいような気がします。 私の知識不足に起因する面が多いのですが、試験も迫っており困って おります。どなたか教えて頂けませんでしょうか。 よろしくお願いいたします。

質問者が選んだベストアンサー

  • ベストアンサー
noname#227064
noname#227064
回答No.3

> この問題に対して尤度比検定を用いる場合、(1)(2)の仮説はどのようになるのでしょうか? 尤度比検定とは、対立仮説及び帰無仮説における同時密度関数をそれぞれf及びgとすると、 2log{max(f)/max(g)} が棄却限界cを超えた場合に帰無仮説を棄却する検定です。 棄却限界cは、帰無仮説での母数の数がq、対立仮説での母数の数がp+qであったとき、漸近的に自由度pのカイ二乗分布の上側α点と一致します。 (1)の場合で説明します。 母集団の分布は正規分布を仮定しております。 帰無仮説において、母平均及び母分散は等しいのでそれぞれμ及びσ^2とします。男性nx人、女性ny人のデータをx及びy(添え字省略)とすると、同時密度関数は、 g = (2πσ^2)^{-(nx+ny)/2}exp[-{Σ(x-μ)^2+Σ(y-μ)^2}/2σ^2] となります。 尤度関数gを最大にするμ、σ^2はそれぞれ、 μ = (Σx+Σy)/(nx+ny) σ^2 = {Σ(x-m)^2+Σ(y-m)^2}/(nx+ny) ですので、これをfに代入すると、 max(g) = (2πs0^2)^{-n/2}exp(-n/2) ただし、 n = nx + ny s0^2 = {Σ(x-m)^2+Σ(y-m)^2}/n とおいた。 対立仮説において、母平均は異なり、母分散は等しいので、男性の母平均をμx、女性の母平均をμy、母分散をσ^2とします。 同時密度関数は、 f = (2πσ^2)^{-n/2}exp[-{Σ(x-μx)^2+Σ(y-μy)^2}/2σ^2] となります。 尤度関数fを最大にするμx、μy、σ^2はそれぞれ、 μx = Σx/nx μy = Σy/ny σ^2 = {Σ(x-Σx/nx)^2+Σ(y-Σy/ny)^2}/n ですので、これをfに代入すると、 max(f) = (2πs1^2)^{-n/2}exp(-n/2) ただし、 s1^2 = {Σ(x-Σx/nx)^2+Σ(y-Σy/ny)^2}/n とおいた。 したがって、尤度比検定は 2log{max(f)/max(g)} = [(2πs1^2)^{-n/2}exp(-n/2)]/[(2πs0^2)^{-n/2}exp(-n/2)] = {(s1^2)/(s0^2)}^(-n/2) > χ^2(1) となると帰無仮説が棄却されます。 以上が尤度比検定になりますが、(3)も同じように考えればできるのですが、(2)は難しいように思えます(すくなくとも私には)。 その問題は尤度比検定まで求めていないように思えます。

ss2119
質問者

お礼

その後、無事試験は済んだのですが、どうしてもこの問題が 引っかかり、私も色々な参考書や教科書を調べてみました。 その中で、なんとこの問題と全く同じものが載った教科書を 見つけてしまいました。 どうやらそこからの転載だったようです。 あいにく、詳細な解き方が載った教科書ではなかったのですが、 当然のごとくその教科書の巻末にはt分布表がついております。 また、t検定に関する記述の演習問題としてついていた問題で したので、おそらくt検定で解くので間違いないようです。 おそらく、うちの大学の教授が問題を教科書より転載した際に、 解き方をあまり確認せず添付資料を作ったのではないかと思い ます。。。 どうもありがとうございました。

その他の回答 (2)

noname#227064
noname#227064
回答No.2

尤度比検定がありました。 これならカイ二乗分布表があれば検定できます。 調べてみてわからないところがあれば補足してください。 尤度比検定を使うことがなかったので忘れていました。

ss2119
質問者

お礼

ご回答ありがとうございます。 尤度比検定の方法を昨日今日と調べてみたのですが、まだちょっと使い 方がよく理解できておりません。。 この問題に対して尤度比検定を用いる場合、(1)(2)の仮説はどのように なるのでしょうか?

noname#227064
noname#227064
回答No.1

> 1と2はt検定、3はF検定かと思ったのですが、 私も質問を読んでそう思いました。 何故、カイ二乗分布表しかないのでしょう? > 問題を標本分布としてではなく、母集団自体として考えて正規分布を 想定すれば計算できるのかなとも思ったのですが、それは問題文の解 釈がおかしいような気がします。 ひょっとすると、データから求めた分散を母分散として考えているのかもしれません。 そうすると、問題1の場合、 (男性の平均-女性の平均)^2/(2*分散/10) は帰無仮説において自由度1のカイ二乗分布に従うことになりますが…… そうだったら嫌な問題ですね。

関連するQ&A

  • カイ二乗検定 求めた値の扱い方

    2×2分割表のカイ二乗検定を行います。 手元のカイ二乗分布表では, 有意水準 10% 2.706 5% 3.841 2.5% 5.024 1% 6.635 となっています。 これらの値は片側検定で使用できるのでしょうか? それとも両側検定で使用できるのでしょうか? また,使用できない方で検定したい場合,どうすればよいのでしょうか?

  • カイ二乗による適合度検定におけるカイ二乗値の分布

    カイ二乗による適合度検定で、期待度数と観測度数の差からカイ二乗値を計算するんですが、帰無仮説が正しい(すべての期待度数が観測度数と一致する)場合は、この検定統計量のカイ二乗値の分布はその自由度のカイ二乗分布になります。 帰無仮説が正しくなく、実際にある乖離(たとえば効果量w=0.3とか)があった場合、計算された検定統計量のカイ二乗値はどんな分布をすると理論的には言えるのでしょうか? 全体の総度数によってもかわるように思うのですが、いまいちわかりません。 平均の差の検定ではたとえば、t検定統計量が帰無仮説が成立しない場合非心t分布をとるのですが、カイ二乗検定ではこれは非心カイ二乗分布なのでしょうか? であったらその非心パラメタはどういうものなのでしょうか? カイ二乗による適合度検定で、検出力の計算をどうやるんだろうかと考えていたら、こういう疑問がわきました。

  • カイ二乗分布のパーセント点について

    母分散の区間推定などにカイ二乗分布を使うときに たとえば有意水準5%で推定するときに両側検定をすると カイ二乗分布表の上側確率0.025%の部分と0.975%の部分を見ることになりますよね。 そのとき、0.025%の部分のカイ二乗値から0.975%の部分を計算することはできるのでしょうか。 たとえば、F値の場合F(0.975)=1/F(0.025)の関係があるようにカイ二乗値にも右側と左側で関係性があるのかどうかということです。 うまく説明ができていないかもしれませんが、ご解答いただければ幸いです。

  • カイ二乗検定を行いました。正しいでしょうか?

    Χ二乗検定を行いました。素人のため、上司に見せる前に間違っていないか 見ていただきたいです。 添付ファイルをご覧ください。 職場の年間インシデント件数が83件ありました。 エクセルを使用しグラフにしてみると、発生時間帯に差がある、 つまり、発生しやすい時間帯があるように思います。 そのため、素人のために検索を行いながら、 カイ二乗検定を行いました。 上の図のたて列は、 O(観測度数) E(期待度数) O-E (O-E)の二乗 (O-E)の二乗/E で並んでいます。 検定の結果は、 (1)自由度=12-1=11 (2)カイ二乗分布表から、自由度が11、p=0.05の値(有意水準5%)の値は、19.6751 (3)計算で出したカイ二乗値は52.2311 (3)そのため、有意水準5%で「発生時間帯に差は無い」という帰無仮説は棄却される。 つまり、インシデントが発生しやすい時間帯がある という結論が出たのですが、ここで皆さんの意見をお聞きしたいです。 (1)この検定は正しいか?間違いか? (2)正しい場合、8~9時台、16~17時台が、インシデントが発生しやすい時間帯と判断してよいのか? (3)検定は正しい、しかし、時間帯の判断はできない場合、なぜ判断できないのか? (4)検定が間違いの場合、どこに問題があるか? (5)より信頼度を上げる検定方法はあるか? 皆さんのお知恵を、よろしくお願いします。

  • カイ自乗検定について

    カイ自乗検定をする際、求めたカイ自乗値を有意水準によって判断するわけですが、 カイ自乗値>カイ自乗分布表(有意水準と自由度)から求めた値 と、なった場合、帰無仮説が否定されたということでよろしいのですよね? 授業でノートに書いたものと、ネットで調べたものが異なっていたので、混乱して分からなくなってしまいました。 よろしくおねがいいたします。

  • カイ二乗検定を教えてください。

    卒論のため、統計の本でカイ二乗検定を勉強しています。 しかし、途中でどうすれば良いのか分からなくなりました。     A  B  合計 C   46 57 103 D   20 24  44 合計 66 81 147 上記を計算したところ、0.00786328となりました。 この数字は、合っていますか? 有意水準を0.05として、差があるのでしょうか? また、統計の分かりやすい本があれば、教えてください。 宜しくお願いします。

  • カイ2乗検定って何??;;

    タイトルのとおりですが…大学で統計の基礎な授業を一般教養で受けています。だけど知らない&説明のない言葉がいっぱぃで、全くついていけません(>_<)) 「人が一番選ばなさそうな数字」を何度か投票した結果があって、その数字は無作為に選ばれてるかどうか、有意水準1%としてカイ2乗検定をして判断する、という問題があるのですが、カイ2乗検定自体、授業でちらっと言葉は使ったものの、計算の仕方、使い方の説明等はなく、まったく手がつかずにいます;;ネットでも調べてみましたが、どう使っていいのかまでは分かりませんでした。 知識の無い私でもわかるようなものがあれば教えて下さいっっ!お願いします。

  • 統計学(検定)の問題なのですが…

    母平均が既知、母分散が未知である正規母集団の母分散σ^2>0について、 帰無仮説:σ^2=σ_0^2 対立仮説:σ^2>σ_0^2 と設定し、片側検定を有意水準5%で行うことを考える。真の値がσ^2=(1/3)σ_0^2であるとき、97.5%以上の確率で帰無仮説が棄却されるために必要な標本数の最小値はいくらか。 という問題が解けず、どなたか考え方をお教え頂けると幸いです(σ_0は添字です)。本文ではこの下にずらずらとカイ二乗の値が並んでいます。答え自体は分かっていて、22個ということでした。自分は東大出版会の統計学入門という本で学んだのですが、これに類する問題は目にしたことがなく、いささか戸惑っています。 また、もし宜しければこのように少し応用しなければ解けない統計学の問題集をご存知の方がいらっしゃいましたら教えて頂けると光栄です。単なる検定なら実行できるのですが、応用力が全く身に付かず困っています…。 長くなりましたがどうぞ宜しくお願い致します。

  • t検定について

    A) サンプル数 300  平均22.5  標準偏差4.00 B) サンプル数 1400  平均23.0  標準偏差5.90 のt 検定を」というご質問が出されていました。 私も興味ををもって解いてみましたが、best answer に選ばれた回答も出されておりましたが、ヒントであって、解は出ていませんでした。 次のようなことでいいのでしょうか。ぜひともお教えいただきたいので、よろしくお願いいたします。 この問題は仮説検定のうち、2つのサンプルの平均値に差があるかどうかを検定する問題だと思いました。 帰無仮説は 2つのサンプルの平均値には差がない」とします。 両群の平均的な分散は   ((300-1)*4^2*(1400-1)*5.9^2)/(300+1400-2)=31.50 このとき検定統計量は t=0.5/√(31.5(1/300-1/1400))=1.40 この問題では自由度が1698となり、分布表からは正確な数が出ませんが、正規分布になるときの数とから、有意水準5%なら 1.9779~1.9600 の間にありそうですので、検定統計量のほうが小さいと判断できると思いました。 よって「帰無仮説を棄却するすることはない。」と結論しました。 このようなことでいいのでしょうか。特に自由度が1698で分布表から具体的な数がきっちり求められないので、他のやりかたでなければならないのでは?と不安を感じているのですが。

  • 統計学の問題です。

    統計学の問題です。 初心者なのでよくわからないのです。よろしくお願いします。 下の表(同年齢、同学歴、同職種での各10人ずつの男女賃金格差)について(1)適当な仮無仮説、対立仮説を立て、男女の賃金格差について検定せよ。母分散は等しいと仮定し、有意水準は5%とする。 (2)母分散は等しいと仮定せずに、同一の検定を行え。 (3)母分散は等しいか。有意水準1%で検定せよ。 この3問なのですが、特に「適当な仮無仮説、対立仮説」をどのように立てるのかがわからないので前に進めません。また有意水準を用いた計算も式の立て方がイマイチわからないのです。一度詳しく解説をしていただけないでしょうか。よろしくお願いします。 男:15.4 18.3 16.5 17.4 18.9 17.2 15.0 15.7 17.9 16.5  (単位:万円) 女:14.2 15.9 16.0 14.0 17.0 13.8 15.2 14.5 15.0 14.4  (架空例)