• ベストアンサー

カイ二乗分布のパーセント点について

母分散の区間推定などにカイ二乗分布を使うときに たとえば有意水準5%で推定するときに両側検定をすると カイ二乗分布表の上側確率0.025%の部分と0.975%の部分を見ることになりますよね。 そのとき、0.025%の部分のカイ二乗値から0.975%の部分を計算することはできるのでしょうか。 たとえば、F値の場合F(0.975)=1/F(0.025)の関係があるようにカイ二乗値にも右側と左側で関係性があるのかどうかということです。 うまく説明ができていないかもしれませんが、ご解答いただければ幸いです。

質問者が選んだベストアンサー

  • ベストアンサー
  • zk43
  • ベストアンサー率53% (253/470)
回答No.2

ちょっと興味を持って本を見てみましたが、なかなかうまい関係は 見つかりませんでした。 自由度m,nのF分布の上側α点と、自由度n,mのF分布の下側α点が 逆数の関係にあるというのは、確率変数Xが自由度m,nのF分布に 従えば、1/Xは自由度n,mのF分布に従うということを使っていますが、 χ2分布にはこのようなうまい関係は見つかりませんでした。 χ2(m)に従う確率変数Xと、χ2(n)に従う確率変数Yが独立なら、 (X/m)/(Y/n)はF(m,n)に従うというのはありますが、これと上側・下側 α点を関係付けるのは難しい・・・ 他にも、X1,・・・,XnがN(0,1)に従って独立なら、X1^2+…+Xn^2は χ2(n)に従うということから、できないかと考えてみましたがうまく いきません。 たぶん使うこともないし、簡単な関係はないのでは? そもそも表に上側点、下側点の片方しか載ってない表なんてあるのです か。私は、何冊か本を持ってますが、どれにも両方載ってます。

pinkmash
質問者

お礼

やはり両方載っている資料というのが標準なのでしょうね。 ありがとうございました。

その他の回答 (2)

  • backs
  • ベストアンサー率50% (410/818)
回答No.3

> その場合に求める公式があれば知りたいなと考えているのです。 今,手元にないので参照することができないのですが 水野欽司「多変量データ解析講義」朝倉書店 の巻末にp値あるいはカイ自乗値を計算するためのアルゴリズムが載っていたと記憶しています。ですが,上側パーセント点から簡単に(例えば2で割るなどして)求められる方法は載っていませんし,私もわかりません。 > カイ二乗分布表では0.975の行が載っていないものもあります。 余談ですが, 一石賢「道具としての統計解析」日本実業出版社 にはかなり丁寧に表が作成されていますね。0.975の行も記されていたはず。

pinkmash
質問者

お礼

ありがとうございます。 さっそくお勧めいただいた資料を探してみようと思います。

  • backs
  • ベストアンサー率50% (410/818)
回答No.1

> うまく説明ができていないかもしれませんが、ご解答いただければ幸いです。 私もうまく質問の意図を理解できているかわかりませんが(~_~) 例えば自由度19のカイ自乗分布において上側確率0.025となるパーセント点(カイ自乗値)は32.85233ですよね。つまり,この32.85233という値よりも右側の面積が0.025であり,左側の面積が0.975というわけです(だから0.025+0.975=1となる)。 それで質問者さんの知りたい値というのは「下側0.025となるパーセント点」なんでしょうか?それなら,8.906516となるのですが、、、 0から8.906516が下側0.025, 8.906516から32.85233までの面積(採択域)が0.95, 32.85233から∞(まぁ,50くらいですが)が上側0.025ということではないのですか?

pinkmash
質問者

お礼

ありがとうございます。 やはり説明が悪かったみたいです。 つまり、私が聞きたかったのは例で挙げてくださった 上側0.025となるカイ二乗値32.85233から下側0.025となるカイ二乗値8.906516を求めることはできないでしょうかということなのです。 下側0.025を知るためにはカイ二乗分布表の0.975の行を見ることになると思うのですが、カイ二乗分布表では0.975の行が載っていないものもあります。 その場合に求める公式があれば知りたいなと考えているのです。

関連するQ&A

  • カイ二乗検定 求めた値の扱い方

    2×2分割表のカイ二乗検定を行います。 手元のカイ二乗分布表では, 有意水準 10% 2.706 5% 3.841 2.5% 5.024 1% 6.635 となっています。 これらの値は片側検定で使用できるのでしょうか? それとも両側検定で使用できるのでしょうか? また,使用できない方で検定したい場合,どうすればよいのでしょうか?

  • カイ二乗分布の「カイ二乗値」について

    カイ二乗分布について、下記のような説明がよく見受けられます。 (a)カイ二乗値=Σ{(観測値)-(期待値)/期待値} (b)カイ二乗値=(標本サイズ*標本分散)/母分散 どちらもカイ二乗値という同じ値を表す数式だと思うのですが、 この二つはどのような関係にあるのでしょうか? 「カイ二乗値って何?どうやって求めるの?」と聞かれたとき、どちらが正解なのでしょうか? 漠然とした聞き方で申し訳ありませんが、宜しくお願いします。

  • カイ2乗分布表なしでカイ2乗値?

    カイ2乗分布表なしで、例えばFや正規分布表からカイ2乗値を計算することはできますか? 例えば、χ2(自由度が120)で、上側確率 pを.01とします。 これをカイ2乗分布表から算出するのは問題ないのですが(158.950)、例えば表に自由度が100までしかない場合、他の分布表からカイ2乗値を算出できる方法があれば知りたいです。 どうぞよろしくお願いいたします!

  • 自由度とt分布

    自由度19のt分布の上側が2.5%が2.093 であるとき、帰無仮説が有意水準5%で棄却できるというのがわから ないでいます。t分布表の上側2.5%は片側検定? 有意水準5%は両側検定? おしえてください。

  • カイ2乗検定の使い方とp値について

    アンケートを行いました。 結果の考察を行うにあたり、カイ2乗検定で優位差が認められるかを知りたいと思っています。 SPSSやエクセルでカイ2乗検定をしたところ、spssの場合「漸次有意確率(両側)」に「8.89E-13」や「5.964E-27」、エクセルの場合「p値」に「7.15688E-05」などアルファベットの入った数値が出てくることが多かったです。5%や1%水準で有意差が認められるかどうかを知りたかったのですが、この数値の意味が分かりません。 この様な数値が出てくるということは、どこかがおかしいのでしょうか? p値がおかしいこともあって、そもそもカイ2乗検定でよいのかが不安になりました。 「成績」と「開始時期」で、「開始時期が早いほど成績がよい」といったようなことが見たいと思っています。 成績は11項目、開始時期は12項目あります。SPSSで集計結果のクロス集計表を作るときにカイ2乗検定も行ったところ、値が350.994、自由度が110、確率(両側)が5.964E-27でした。 「開始時期が早いほど成績がよい」という結論を導き出したいのですが、この場合「カイ2乗検定で5%水準で有意差が認められた」となったらこの結論を導き出せるのでしょうか?例えば2つの項目の比較ではなく、11×12項目のカイ2乗検定で有意差が認められた場合、何に有意な差が認められたのかがよく分かりません。 クロス集計表を作成し、グラフにしたところ、開始時期によって差がありそうなのですが、単純なパーセントの数値の大小でしか分かりません。調査結果ではなく、卒業論文なので、ただ「これは何パーセントでこれは何パーセントだった。この時期以前に始めた人の方が高い成績を回答している割合が高い」のようなことだけでいいのか…と悩んでいます。 まとまりのない文章で、質問内容も多九手申し訳ありませんが困っています。よろしくお願いします。

  • カイ2乗について

    カイ2乗について、以下サイトを参照していたら疑問が出たため投稿します。 http://www.geisya.or.jp/~mwm48961/statistics/kai2.htm 上記サイトの「簡単な例でイメージ作り(1)」項の「考え方」という項目に下記とあります。  (↓行頭「|」の行はサイトからの抜粋です。)  | この式は,観測値が大きくなると必要以上に大きくなり過ぎる.実際,標本を10倍に増やしたときを考えると,次の分布が上の分布と比較して100倍ずれているとは言えない.  |  血液型 A型 B型 AB型 O型 計  |  観測度数 370 250 120 260 1000  |  期待度数 400 200 100 300 1000  | そこで,各々の(差)2を各々の期待度数で割った次の式を考え,χ2と呼ぶ.  この10倍された、観測度数や期待度数にて、カイ2乗値を計算すると、カイ2乗値についても元の10倍になりました。 そうなると、元々のデータ(10倍していないデータ)での検定結果は下記とありますが、10倍されたデータだとそう言えなくなるということでしょうか?  | χ2<7.81 だから有意水準5%で「有意差はない」と言える.  もし仮に、実際にこの10倍された観測度数や期待度数のような表(血液型の表)が、現実の調査結果として手元に得られたとすると、どのようにすればカイ2乗検定にて「有意差あり、なし」を出せるのでしょうか? (あるいはカイ2乗検定は出来ない…??…標本数が多すぎる??…モヤモヤしてわかっていません。) 小生、統計や数学のド素人でしてわかりやすく教えて頂けると幸いです。 どうぞよろしくお願いします。

  • カイ二乗による適合度検定におけるカイ二乗値の分布

    カイ二乗による適合度検定で、期待度数と観測度数の差からカイ二乗値を計算するんですが、帰無仮説が正しい(すべての期待度数が観測度数と一致する)場合は、この検定統計量のカイ二乗値の分布はその自由度のカイ二乗分布になります。 帰無仮説が正しくなく、実際にある乖離(たとえば効果量w=0.3とか)があった場合、計算された検定統計量のカイ二乗値はどんな分布をすると理論的には言えるのでしょうか? 全体の総度数によってもかわるように思うのですが、いまいちわかりません。 平均の差の検定ではたとえば、t検定統計量が帰無仮説が成立しない場合非心t分布をとるのですが、カイ二乗検定ではこれは非心カイ二乗分布なのでしょうか? であったらその非心パラメタはどういうものなのでしょうか? カイ二乗による適合度検定で、検出力の計算をどうやるんだろうかと考えていたら、こういう疑問がわきました。

  • 分散が1でない場合のカイ二乗分布?

    一般的な教科書で定義されているカイ二乗分布は、平均ゼロ、分散1の正規分布に従う確率変数の二乗和が従う分布として導出されています。では、分散がσ2のような一般的な場合はどうなるのでしょうか? このときのカイ二乗分布の分散だけでもわかるとよいのですが・・・、よろしくおねがいします。(この内容が記されている文献やHPの情報でも大歓迎です)

  • カイ二乗検定の多重比較について

    SPSSで4×4の名義尺度のカイ二乗検定を行ったところ、Pearsonのカイ二乗検定で5%水準で有意差が出たと出力されました。 そこで質問です。 1.この結果は4×4のデータのどこかの組み合わせに差があるということを表している、と解釈していいのでしょうか? 2.差があるとすれば、どれとどれのデータの間の差なのか知りたいので、分散分析のように多重比較をする方法があるのでしょうか? ご指導お願いします。

  • 統計学 手計算による t検定・カイ二乗検定の計算について

    統計学に関する質問です。 私は来週行われる大学院入試のため、統計学を勉強している学生です。 過去問を解いていたところ、どうしても解き方がわからない問題があ り、教えて頂きたく質問を投稿いたしました。 問題は以下のとおりです。 ※試験では単純計算機能のみの電卓、カイ二乗分布表が使用可能。 問.同じ年齢・学歴・職種の男女10名ずつの給料を調べたところ、   次の表の通りであった。 男性 15.4 18.3 16.5 17.4 18.9 17.2 15.0 15.7 17.9 16.5 ------------------------------------------------------ 女性 14.2 15.9 16.0 14.0 17.0 13.8 15.2 14.5 15.0 14.4 (万円) (1)帰無仮説、対立仮説を立て、男女の給料格差について検定しなさ い。ただし、母分散は等しいと仮定し、有意水準は5%とする。 (2)母分散は等しいと仮定しないで、同一の検定をしなさい。 (3)母分散は等しいかどうか、有意水準1%で検定しなさい。 1と2はt検定、3はF検定かと思ったのですが、t分布表がないため t検定が使えません。 カイ二乗分布表を用いて検定する方法があるのでしょうか? 何かもっと上級の分析手法を用いなければならないのでしょうか? 問題を標本分布としてではなく、母集団自体として考えて正規分布を 想定すれば計算できるのかなとも思ったのですが、それは問題文の解 釈がおかしいような気がします。 私の知識不足に起因する面が多いのですが、試験も迫っており困って おります。どなたか教えて頂けませんでしょうか。 よろしくお願いいたします。