• ベストアンサー

カイ二乗分布の「カイ二乗値」について

カイ二乗分布について、下記のような説明がよく見受けられます。 (a)カイ二乗値=Σ{(観測値)-(期待値)/期待値} (b)カイ二乗値=(標本サイズ*標本分散)/母分散 どちらもカイ二乗値という同じ値を表す数式だと思うのですが、 この二つはどのような関係にあるのでしょうか? 「カイ二乗値って何?どうやって求めるの?」と聞かれたとき、どちらが正解なのでしょうか? 漠然とした聞き方で申し訳ありませんが、宜しくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • goma_2000
  • ベストアンサー率48% (62/129)
回答No.3

a)のカイ2乗値は適合度検定などに用いられる時のカイ2乗値になっています。 b)のカイ2乗値は標準正規分布に従う母集団の母分散の検定に用いられる指標になっています。 ですので、 標準正規分布から無作為に選んだ大きさnの標本値の2乗値の合計は自由度nのカイ2乗分布に従う。 というこは、 標準正規分布から無作為に選んだ大きさnの標本値の2乗値の合計をAとでもしますと、このAはカイ2乗分布に従うので、カイ2乗値ということになります。 Aを定式化すると、(x-μ/σ)で変数の標準化を行い、それの2乗和を取ればよく、  A=Σ(x-μ/σ)^2  μはbの平均、σは母標準偏差 となります。 どちらも、検定で用いる指標がカイ2乗分布となることから、カイ2乗値という呼び方をしています。適合度検定で用いられるカイ2乗値はピアソンの適合度基準という呼び方もあるようです。共通するのはどちらもデータのばらつきに関する検定で用いられていることでしょうか。

bisuko1014
質問者

お礼

なるほど、変数の標準化をしていたのですね。 よく分かりました。 何度も回答していただき、どうもありがとうございました。

その他の回答 (2)

  • goma_2000
  • ベストアンサー率48% (62/129)
回答No.2

お恥ずかしいです。。。 これはカイ2乗分布の話ですね。 (b)はカイ2乗分布の性質 標準正規分布から無作為に選んだ大きさnの標本値の2乗値の合計は自由度nのカイ2乗分布に従う。 から来ています。 カイ2乗値=Σ(x-μ/σ)^2 μはbの平均、σは母標準偏差 というとことです。

bisuko1014
質問者

補足

補足ありがとうございます。 申し訳ありませんが、 --  カイ2乗値=Σ(x-μ/σ)^2  μはbの平均、σは母標準偏差 -- の部分をもう少し詳しく教えていただけないでしょうか? 重ね重ねすみません。

  • goma_2000
  • ベストアンサー率48% (62/129)
回答No.1

定義が若干、違うようですね。 (a)カイ2乗値=Σ{((観測値)-(期待値))^2/期待値} (b)カイ二乗値=(標本サイズ*標本分散)/母平均 ではないでしょうか。 標本分散は、(観測地-期待値)^2/標本サイズです。 母平均は期待値です。 ですので、上記の2つの式は同じ式になります。 質問の答えとしてはどちらも同じです。ということになります。

bisuko1014
質問者

補足

回答ありがとうございます。 (a)はご指摘のとおりでした。 (b)についてですが、分母の「母平均」と書かれているところなのですが、 手元にある書籍にはいずれも「σ^2」とあります。 これは母分散のことではないのでしょうか?

関連するQ&A

  • カイ2乗について

    カイ2乗について、以下サイトを参照していたら疑問が出たため投稿します。 http://www.geisya.or.jp/~mwm48961/statistics/kai2.htm 上記サイトの「簡単な例でイメージ作り(1)」項の「考え方」という項目に下記とあります。  (↓行頭「|」の行はサイトからの抜粋です。)  | この式は,観測値が大きくなると必要以上に大きくなり過ぎる.実際,標本を10倍に増やしたときを考えると,次の分布が上の分布と比較して100倍ずれているとは言えない.  |  血液型 A型 B型 AB型 O型 計  |  観測度数 370 250 120 260 1000  |  期待度数 400 200 100 300 1000  | そこで,各々の(差)2を各々の期待度数で割った次の式を考え,χ2と呼ぶ.  この10倍された、観測度数や期待度数にて、カイ2乗値を計算すると、カイ2乗値についても元の10倍になりました。 そうなると、元々のデータ(10倍していないデータ)での検定結果は下記とありますが、10倍されたデータだとそう言えなくなるということでしょうか?  | χ2<7.81 だから有意水準5%で「有意差はない」と言える.  もし仮に、実際にこの10倍された観測度数や期待度数のような表(血液型の表)が、現実の調査結果として手元に得られたとすると、どのようにすればカイ2乗検定にて「有意差あり、なし」を出せるのでしょうか? (あるいはカイ2乗検定は出来ない…??…標本数が多すぎる??…モヤモヤしてわかっていません。) 小生、統計や数学のド素人でしてわかりやすく教えて頂けると幸いです。 どうぞよろしくお願いします。

  • カイ二乗による適合度検定におけるカイ二乗値の分布

    カイ二乗による適合度検定で、期待度数と観測度数の差からカイ二乗値を計算するんですが、帰無仮説が正しい(すべての期待度数が観測度数と一致する)場合は、この検定統計量のカイ二乗値の分布はその自由度のカイ二乗分布になります。 帰無仮説が正しくなく、実際にある乖離(たとえば効果量w=0.3とか)があった場合、計算された検定統計量のカイ二乗値はどんな分布をすると理論的には言えるのでしょうか? 全体の総度数によってもかわるように思うのですが、いまいちわかりません。 平均の差の検定ではたとえば、t検定統計量が帰無仮説が成立しない場合非心t分布をとるのですが、カイ二乗検定ではこれは非心カイ二乗分布なのでしょうか? であったらその非心パラメタはどういうものなのでしょうか? カイ二乗による適合度検定で、検出力の計算をどうやるんだろうかと考えていたら、こういう疑問がわきました。

  • カイ二乗分布のパーセント点について

    母分散の区間推定などにカイ二乗分布を使うときに たとえば有意水準5%で推定するときに両側検定をすると カイ二乗分布表の上側確率0.025%の部分と0.975%の部分を見ることになりますよね。 そのとき、0.025%の部分のカイ二乗値から0.975%の部分を計算することはできるのでしょうか。 たとえば、F値の場合F(0.975)=1/F(0.025)の関係があるようにカイ二乗値にも右側と左側で関係性があるのかどうかということです。 うまく説明ができていないかもしれませんが、ご解答いただければ幸いです。

  • 分散が1でない場合のカイ二乗分布?

    一般的な教科書で定義されているカイ二乗分布は、平均ゼロ、分散1の正規分布に従う確率変数の二乗和が従う分布として導出されています。では、分散がσ2のような一般的な場合はどうなるのでしょうか? このときのカイ二乗分布の分散だけでもわかるとよいのですが・・・、よろしくおねがいします。(この内容が記されている文献やHPの情報でも大歓迎です)

  • [統計学]カイ2乗分布

    カイ2乗分布について多くの入門的教科書では、 > 確率変数 X1, X2 が正規分布 N(0,1) に従うとき、 > Y = X1^2 + X2^2 で与えられる確率変数 Y はカイ2乗分布となり、 > 以下の式で表される: > (分布関数) のような説明がなされていると思います。 このとき、X1, X2 が異なる正規分布 N(e1, v1), N(e2, v2) に従う場合には、 そのカイ2乗分布はどのような式で与えられるのでしょうか。 (e = X の平均値, v = X の分散) おそらく簡単すぎるために、説明が省かれているのだろうと思うのですが、 自分にとっては簡単ではありません。 詳しく載っている書籍・ウェブサイトを挙げるだけでも構いませんので、 御教示お願いいたします。

  • カイ2乗分布?

    「コインを投げて表が出たら座標を+1し、裏が出たら-1する」 という事象をn回繰り返した場合、最終的な座標は正規分布を示すため、 その最終的な座標の期待値からのズレを考えたい場合、 カイ2乗分布を用いることになると思います。 では、コインの表が出る確率が例えば2/3のように均等でない場合はどうなるのでしょうか? 最終的な座標はおそらく正規分布ではないと思うのですが、 この場合の期待値からのズレはどうなるのでしょうか? 宜しくお願いします。

  • カイ二乗検定について

    サイコロがフェアであるかどうか、カイ二乗検定を行いたいのですが テキストには、自由度5で理論度数で割るやり方で解答がなされているのですが これを、自由度6で、二項分布の分散で割るやり方で解くのは間違いなのでしょうか? 具体的には p=1/6 nは理論度数*6=全試行回数 [(標本度数-理論度数)/√np(1-p)]二乗 を1の目から6の目まで足して、それを自由度6のカイ二乗検定に掛けるやり方です。 もし分かる方がいらっしゃったら、教えていただけるとありがたいです。

  • カイ自乗分布の問題について質問です

    カイ自乗分布の問題について質問です 私は高校生で、経済学に興味があるので統計学を自習しております。しかし参考書にわからない問題があり困っております 統計学に詳しい方、よろしくお願いします。 1 自由度100のカイ自乗分布においてχ^2の5%点を正規分布近似により求めなさい 2 平均10 分散5 の正規母集団から抽出した大きさ4の無作為標本に基づく標本分散s^2が8より大きくなる確率は0.05より大きいか 3 平均μ 分散30の正規母集団からの大きさ16の無作為標本に基づく標本分散をs^2とする P(a<s^2<b)=0.95となるような定数a b を求めよ ただしP(s^2はa以下)=0.025とする

  • カイ二乗分布表に上側確率しかない場合

    統計学の試験に向けて勉強しているのですが、過去問を解いていて全く理解できない事柄があるので、質問させてもらいます。 問い あるクラスの統計学の試験の点数の母平均と母標準偏差の信頼区間を推定するために、大きさn=10の標本を抽出したところ、標本平均70点、標本標準偏差7点であった。これだけのデータをもとに、母平均と母標準偏差を95%信頼係数のもとで、区間推定しなさい。なお、この問題の解答に際しては、次項の添付書類を参照しなさい。 上記の問題に対して添付されていたカイ二乗分布表は、上側確率(0.250、0.100、0.050、0.25、0.010、0.005、0.001)のみ載せられた表になっています。 私が持っている参考書や図書館で借りてきた参考書類を調べてみても、上側確率しか載っていないというものはありません。 参考書の例題なども上側確率と下側確率をカイ二乗分布表から読み取って解く方法をとっているので、上記の問題をどう解いていいものか見当がつきません。 試験も迫っており、焦っています。 どうぞ宜しくお願い致します。

  • 単回帰係数の分散の分布

    単回帰係数の分散は V(b^)=σ^2/Σ(xi-mean(x))^2 カイ2乗分布の比ですからF分布ですよね. それでは原点比例式の係数の分散 V(b^)=σ^2/Σxi^2 は何分布でしょうか. 分母が非心カイ2乗分布だから非心F分布でしょうか? また,この場合,V(b^)の 平均の期待値と 分散の期待値は何になるんでしょうか?