• ベストアンサー

統計学(独立性の検定)についての質問です。

1.期待度数は、なぜ「それぞれのセルの縦軸と横軸を掛け、全度数で割る」で求めるのかが具体的にイメージできません。 2.統計検定量を求める際、(実測度数-期待度数)の2乗を期待度数で割りますが(さらに、それらを足すが)、なぜ期待度数で割るのでしょうか?「分散をイメージすればよい」とする文献もありますが、分散の場合、n-1で割りますが(不偏分散の場合)、期待度数で割っているし・・・。 宜しくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
noname#227064
noname#227064
回答No.1

1についてだけですが、   P Q 計 X a b x Y c d y 計 p q t というデータが得られているとします。 例として、XかつPとなる事象の期待度数はxp/tで求めますが、これはt*x/t*p/tを計算したものです。 帰無仮説のもとでは、縦の要因と横の要因は独立ですので、XかつPとなる事象がおきる確率はXとなる確率とPとなる確率を掛けた値となります。 Xとなる確率とPとなる確率の推定値はそれぞれx/t, p/tとなるので、これに全度数を掛ければ求める期待度数が得られます。

161016
質問者

お礼

ご回答、有難うございます。説明に従い、自分で具体例を作って考えてみたら、理解できました。

関連するQ&A

  • 統計学(独立性の検定)について

    独立性の検定の検定統計量を求める式の意味がわからず、調べていたところ、「例示的な説明」としながらも、該当箇所が見つかりました。が、自分には難解で、わかりにくいです。どなたか、以下の内容を噛み砕いて教えていただけないでしょうか? 「Eiはi番目の観測単位(セル)の理論値だが、観測値であるOiが、パラメーターがλiのポアソン分布に従うとすると、Ei=λiとなる。(ポアソン分布の分散は期待値と同じくλiなので)、 Σ(Oi-Ei)の2乗/E =Σ(Oi-E(Oi))の2乗/σ2乗(Oi) となる。ここで、E(Oi)とσ2乗(Oi)はi番目のセルの期待値と分散である。これは、 カイ2乗=Σ(Xi-μ)/σ2剰と同じである。」 特に、「観測値であるOiが、パラメーターがλiのポアソン分布に従う」のところが、具体的にイメージできません。 例えば、   ダイエットに興味がある ダイエットに興味がない 男    50             150 女    150             50 の場合、50や150という度数がポアソン分布に従うということでしょうか? 宜しくお願い致します。

  • 統計学の適合度検定についての質問です

    統計学初心者です。 観測度数が理論度数の誤差の範囲内かどうかを調べたいのですがどうしたらいいでしょうか? 適当な数値ですが、画像データのAの実測度数が理論度数の誤差の範囲内かどうかを検定するための具体的な計算方法を教えてください。 有意水準は5%、カイ二乗分布 カイ二乗検定で”全体”の検定は x^2=(60-50)^2/50+(20-30)^2/30+・・・+(2-1)^2/1 =6.8444・・・ となり、自由度4のカイ二乗分布、有意水準5%が9.49なので x^2<9.49 有意差はない(誤差の範囲内) というのでまずは合ってますでしょうか? 次にAのみの観測度数と理論度数を検定(誤差の範囲内かどうかを知りたい)したいのですが、 x^2=(60-50)^2/50+(40-50)^2/50 =4 自由度2-1=1のカイ二乗分布、有意水準5%が3.84なので x^2>3.84 有意差はあり(誤差の範囲外) AとB~Eの2個に分けて計算してみましたが、そもそもこの方法が合っているのかどうか分かりません。 アドバイスよろしくお願いします。

  • 統計学の検定について

    標本15個の観測度数と期待度数を有意水準5%で検定する、という問題なのですが どのような仮説を立て、検定統計量Tを決めたらよいでしょうか?

  • 社会統計について質問です。

    大学生です。社会学部の友人に統計学の課題について、助けを求められたのですが、これが私にもさっぱり分かりません。どなたか私達を助けて下さい。以下のような課題です。 母平均μ、母分散σ二乗を持つ正規分布でない母集団から、標本数900のデータを得たところ、標本平均は92、不偏標本分散は100であった。この場合、大標本であると見なして良い。ただし、母分散は未知である。 (1)仮説検定に用いる統計量は何か。また、その統計量は近似的にどのような分布に従うか。 (2)母平均の99%信頼区間を求めよ。 (3)帰無仮説をHo:μ=90としたとき、適切な検定統計量を求め、5%水準両側検定、1%水準両側検定、5%水準右片側検定、1%水準右片側検定をそれぞれ実施せよ。 よろしくお願いします。

  • 正規性の検定でのカイ2乗検定の自由度について

    エクセル統計p051に記されているものです。 標準化値(-1.2,-0.4,0.4,1.2,∞) 理論確率(0.1151,0.2295,0.3108,0.2295,0.1151) 観察度数(4,10,6,9,3) 期待度数(3.6822,7.3443,9.947,7.3443,3.6822)を 列に変換してください。 n=32のデータです。その正規性の検定をするためカイ2乗検定を行ったのですが、自由度が2になることが分かりません。よろしくお願いします。

  • 統計

    卒論のために、統計(検定?)を勉強しています。 データの数が多くなくて、2×2のχ二乗検定もしくはFisher解析をまず行いました。 その後、3群比較が必要になり、2×3の検定を行いたいのです。セルの期待度数が小さく、Fisher解析のほうがいいのかと思ったのですが、これは2×3はできないのでしょうか。 検討違いの質問内容でしたら、ご指摘下さい。 いろいろ本を見てみたのですが、 よくわからないのです、すいませんが よろしくお願い致します。

  • 検定について教えてください。

    検定について教えてください。 アンケート調査をクロス集計し、χ2乗検定を行ったのですが、期待度数が5未満のセルが多く検定にかけられませんでした。 カテゴリーを結合するとよいと知り、5つあったカテゴリーを2つにして検定をし有意差5%未満となったのですが、この場合、最初の5つのカテゴリーのクロス集計表の扱いはどうなりますか? 有意差がなくても、クロス表をグラフにしたものはこういう結果でした。と結果だけ出しても差し支えありませんか? 内容: あることの継続を望む人と継続を望まない人と、体調をクロス集計しました。 体調は質問票では「良好である」「まあまあ良好である」「あまり良好でない」「少し不調である」「とても不調である」の5つとしましたが期待度数5未満が33%だったため 「良好である-まあまあ良好である」「あまり良好でない-とても不調である」の2つに振り分けなおしました。 統計についてよくわかっておらず、なんとかχ2乗検定までたどりつきましたが、これからがすすみません。 的外れでわかりにくい質問かもしれませんが、よろしくお願いします。

  • 統計学

    現在大学で統計解析関係のゼミに所属しているものです。 現在はカイ二乗検定をしているのですが、 その時に「期待度数」が出ていたのですが、 この言葉の意味は多少わかるのですが、 公式の 横計×縦計÷総計=期待度数  によってなぜ期待度数が出てくるのかが分かりません。 よろしかったら教えていただけませんか? 申し訳無いのですが、私は統計学の表面しか知らない者です。 なるべく分かりやすく教えて頂けると光栄です 

  • t検定におけるt値の求め方について

    母平均の検定(1群を母平均と同じか検定)でt検定を行う際に、 T=(標本平均-母平均)÷(標本標準偏差)*√(n-1) と教科書にありました。ただ、次のサイト https://bellcurve.jp/statistics/course/9405.html を見ると、同じT値でも、 T=(標本平均-母平均)÷(不偏分散の標準偏差)*√(n) と書いてありました。不偏分散を求めるときに、n-1とするのは知っており、結局同じ式にはなっているのかと思いました。 以下質問ですが、 ①上の式はt検定なので√(n-1)は自由度を反映しているのだと思うのですが、自由度が違えば、下の式の不偏分散の求め方も、n-1で割るのではなく、n-2になったりするのでしょうか? ②以下のサイトに、nが大きければ、標本分散S²を母分散とみなしてz検定を行い、nが小さければ不偏分散を母分散とみなしてt検定をするとあります。 https://www.geisya.or.jp/~mwm48961/linear_algebra/t_test2.htm これは正しいですか?更に別の教科書には、nの数によって標本分散と不偏分散を使い分けるが、両方とも検定統計量Tを求めるとありました。それで、nが大きければTをZ分布表と比較すると書いてありました。 t検定は、サンプルが少ない時に使う確率密度のt分布表を使っていて、そもそもサンプルが小さい時点でt値を求めているから、比較先はt分布表だと思うのですが、、、。 解説のホームページによってかなりバラバラでどれが正しいのかわかりません。どうなっているのでしょうか。

  • ノンパラメトリック検定

    心理学でカイ2乗のノンパラメトリック検定分析をしたのですが、結果の書き方が分かりません。 どれも有意差が認められるものでしたが、普通なら「AよりBのほうがCの割合が有意に大きいことが示された」ですがこの場合はどう書けばいいのでしょうか? 観測度数と期待度数と残差や検定統計量は出ています。