• ベストアンサー

統計学

現在大学で統計解析関係のゼミに所属しているものです。 現在はカイ二乗検定をしているのですが、 その時に「期待度数」が出ていたのですが、 この言葉の意味は多少わかるのですが、 公式の 横計×縦計÷総計=期待度数  によってなぜ期待度数が出てくるのかが分かりません。 よろしかったら教えていただけませんか? 申し訳無いのですが、私は統計学の表面しか知らない者です。 なるべく分かりやすく教えて頂けると光栄です 

質問者が選んだベストアンサー

  • ベストアンサー
  • Fooky
  • ベストアンサー率71% (59/82)
回答No.2

具体的なデータが合った方が話し易いので、 例えば、「性別と購入する本のジャンルは 独立である」という帰無仮説を、下のような ある本屋での1日の本の販売冊数から検定 するとします。          男 女 横計 マンガ      10  8  18 ノンフィクション  8  6  14 エッセイ      5  8  13 小説       12 14  26 --------------- 縦計       35 36  71  ここで、1行1列(マンガ、男)の期待度数を 考えます。  仮説では男女の購入冊数の割合は、ジャンルに よって変化しません。ですから、各ジャンルにおける 男女の購入冊数の割合は、全ジャンルの男女別合計 購入冊数の割合に等しくなります。したがって、 仮説に則れば、どのジャンルにおいても、 男:女=35:36になっていることが期待されます。 これは即ち、男はどのジャンルにおいても、 ジャンル毎の合計販売冊数の35÷71=0.49だけの 冊数を購入していることになります。  で、マンガについて考えると、マンガは全体で 18冊売れた訳ですから、男性に対するマンガの 販売冊数の期待度数は、18×35÷71=8.9となり ます。  この、18×35÷71というのは、横計×縦計÷総計 になってませんか?  まとめると、縦計÷総計で、縦列項目(男、女)の 観測値が横計中で占める割合の期待値を求め、 それに横計を掛けているのが、問題の式である訳です。  もちろん、横計×縦計÷総計 = 縦計×横計÷総計 ですから、上記の説明の「男女」と「ジャンル」、 「横計」と「縦計」を入れ替えても、全く同じです。

surface2
質問者

お礼

とても丁寧に教えて頂き、ありがとうございました。 例を挙げて説明して頂けたのでとても良く分かりました。 これから統計解析の勉強をしていく上で、 ハ-ドルを一つ越せたような気がします。 本当にどうもありがとうございました。

その他の回答 (1)

  • ymmasayan
  • ベストアンサー率30% (2593/8599)
回答No.1

専門ではありませんが推測で。違っていたらごめんなさい。 n行m列の表とします。各区画の期待度数(平均度数)をaとすると、横計はma、縦計はnaです。一方、総計をSとするとS=mnaです。 ここで、横計×縦計を計算するとmna^2=Saですね。 これからa=横計×縦計/Sではありませんか。

surface2
質問者

お礼

とても良い説明、期待度数のことが理解できたと思います。 本当にどうもありがとうございました。

関連するQ&A

  • 統計

    卒論のために、統計(検定?)を勉強しています。 データの数が多くなくて、2×2のχ二乗検定もしくはFisher解析をまず行いました。 その後、3群比較が必要になり、2×3の検定を行いたいのです。セルの期待度数が小さく、Fisher解析のほうがいいのかと思ったのですが、これは2×3はできないのでしょうか。 検討違いの質問内容でしたら、ご指摘下さい。 いろいろ本を見てみたのですが、 よくわからないのです、すいませんが よろしくお願い致します。

  • カイ二乗による適合度検定におけるカイ二乗値の分布

    カイ二乗による適合度検定で、期待度数と観測度数の差からカイ二乗値を計算するんですが、帰無仮説が正しい(すべての期待度数が観測度数と一致する)場合は、この検定統計量のカイ二乗値の分布はその自由度のカイ二乗分布になります。 帰無仮説が正しくなく、実際にある乖離(たとえば効果量w=0.3とか)があった場合、計算された検定統計量のカイ二乗値はどんな分布をすると理論的には言えるのでしょうか? 全体の総度数によってもかわるように思うのですが、いまいちわかりません。 平均の差の検定ではたとえば、t検定統計量が帰無仮説が成立しない場合非心t分布をとるのですが、カイ二乗検定ではこれは非心カイ二乗分布なのでしょうか? であったらその非心パラメタはどういうものなのでしょうか? カイ二乗による適合度検定で、検出力の計算をどうやるんだろうかと考えていたら、こういう疑問がわきました。

  • 大学の統計学について

    カイ二乗検定の問題でわからないものがあったので教えてください。 標準データのクロス集計表におけるすべてのセルの期待度数が、母集団における属性ごとの比率と完全に一致している時、カイ二乗値はいくつか? 上記の問題の回答をよろしくお願いいたします。

  • 統計学の適合度検定についての質問です

    統計学初心者です。 観測度数が理論度数の誤差の範囲内かどうかを調べたいのですがどうしたらいいでしょうか? 適当な数値ですが、画像データのAの実測度数が理論度数の誤差の範囲内かどうかを検定するための具体的な計算方法を教えてください。 有意水準は5%、カイ二乗分布 カイ二乗検定で”全体”の検定は x^2=(60-50)^2/50+(20-30)^2/30+・・・+(2-1)^2/1 =6.8444・・・ となり、自由度4のカイ二乗分布、有意水準5%が9.49なので x^2<9.49 有意差はない(誤差の範囲内) というのでまずは合ってますでしょうか? 次にAのみの観測度数と理論度数を検定(誤差の範囲内かどうかを知りたい)したいのですが、 x^2=(60-50)^2/50+(40-50)^2/50 =4 自由度2-1=1のカイ二乗分布、有意水準5%が3.84なので x^2>3.84 有意差はあり(誤差の範囲外) AとB~Eの2個に分けて計算してみましたが、そもそもこの方法が合っているのかどうか分かりません。 アドバイスよろしくお願いします。

  • 正規性の検定でのカイ2乗検定の自由度について

    エクセル統計p051に記されているものです。 標準化値(-1.2,-0.4,0.4,1.2,∞) 理論確率(0.1151,0.2295,0.3108,0.2295,0.1151) 観察度数(4,10,6,9,3) 期待度数(3.6822,7.3443,9.947,7.3443,3.6822)を 列に変換してください。 n=32のデータです。その正規性の検定をするためカイ2乗検定を行ったのですが、自由度が2になることが分かりません。よろしくお願いします。

  • 統計学(独立性の検定)についての質問です。

    1.期待度数は、なぜ「それぞれのセルの縦軸と横軸を掛け、全度数で割る」で求めるのかが具体的にイメージできません。 2.統計検定量を求める際、(実測度数-期待度数)の2乗を期待度数で割りますが(さらに、それらを足すが)、なぜ期待度数で割るのでしょうか?「分散をイメージすればよい」とする文献もありますが、分散の場合、n-1で割りますが(不偏分散の場合)、期待度数で割っているし・・・。 宜しくお願いします。

  • 統計学、何検定を使えばいいですか?

    統計学初心者です。 正常ラットと飢餓ラットの臓器の重量や長さを統計処理し、有意差があることを示したいのですが、何検定を使えばいいのか分かりません。 カイ2乗検定かとも思いましたが、違うような気がします。 何検定を使えばいいですか?教えてください、お願いします。

  • 多変量解析と検定の違いは?

    現在、アンケート調査の回答分析について学んでいます。 しかし、多変量解析と統計的検定の違いがわからなくて困っています。 どんなときに解析を使い、またどんなときに検定を使えば良いのでしょうか? ちなみに多変量解析は共分散構造解析、検定はカイ二乗検定を学んでいます。

  • ノンパラメトリック検定

    心理学でカイ2乗のノンパラメトリック検定分析をしたのですが、結果の書き方が分かりません。 どれも有意差が認められるものでしたが、普通なら「AよりBのほうがCの割合が有意に大きいことが示された」ですがこの場合はどう書けばいいのでしょうか? 観測度数と期待度数と残差や検定統計量は出ています。

  • カイ2乗について

    カイ2乗について、以下サイトを参照していたら疑問が出たため投稿します。 http://www.geisya.or.jp/~mwm48961/statistics/kai2.htm 上記サイトの「簡単な例でイメージ作り(1)」項の「考え方」という項目に下記とあります。  (↓行頭「|」の行はサイトからの抜粋です。)  | この式は,観測値が大きくなると必要以上に大きくなり過ぎる.実際,標本を10倍に増やしたときを考えると,次の分布が上の分布と比較して100倍ずれているとは言えない.  |  血液型 A型 B型 AB型 O型 計  |  観測度数 370 250 120 260 1000  |  期待度数 400 200 100 300 1000  | そこで,各々の(差)2を各々の期待度数で割った次の式を考え,χ2と呼ぶ.  この10倍された、観測度数や期待度数にて、カイ2乗値を計算すると、カイ2乗値についても元の10倍になりました。 そうなると、元々のデータ(10倍していないデータ)での検定結果は下記とありますが、10倍されたデータだとそう言えなくなるということでしょうか?  | χ2<7.81 だから有意水準5%で「有意差はない」と言える.  もし仮に、実際にこの10倍された観測度数や期待度数のような表(血液型の表)が、現実の調査結果として手元に得られたとすると、どのようにすればカイ2乗検定にて「有意差あり、なし」を出せるのでしょうか? (あるいはカイ2乗検定は出来ない…??…標本数が多すぎる??…モヤモヤしてわかっていません。) 小生、統計や数学のド素人でしてわかりやすく教えて頂けると幸いです。 どうぞよろしくお願いします。