確率・統計―カイ2乗統計量の分散の求め方

このQ&Aのポイント
  • 3項分布に従うX, Y, Zから作られたカイ2乗統計量Tの分散を求める方法について説明します。
  • T=((X-Np)^2)/Np+((Y-Nq)^2)/Nq+((Z-Nr)^2)/Nrの平均と分散を求める問題です。
  • V{T}の計算方法については詳細な手順の説明がありませんが、個人的には4または4に収束する値になると思われます。
回答を見る
  • ベストアンサー

確率・統計―カイ2乗統計量の分散の求め方

確率・統計―カイ2乗統計量の分散の求め方 お世話になっております。 Yahoo知恵袋で見かけた未解決に終わった質問です。 3項分布に従うX,Y,Zより作られたカイ2乗統計量Tの平均と分散を求める問題です。添付画像をご覧になってください。 T=((X-Np)^2)/Np+((Y-Nq)^2)/Nq+((Z-Nr)^2)/Nr E{T}のほうはカンタンにできましたが,V{T}の計算方法はわかりません。正解はもっておりませんが個人的には4または4に収束する値になると思いますが,いかがでしょうか。 以下の方向で努力してみました:(1)E{T^2} を求める。(2)Tの積率母関数を求める。(3)行列を使う。(4)確率関数で直接計算する。…不勉強のため失敗しました。 留学生のもので,下手な日本語で失礼いたしました。回答者様には言葉より数式で説明していただけるとありがたいのですが,数式の入力の面倒も十分承知しています。 おアドバイスだけでも,いただければ幸いです。心よりご教授をお願い致します。

質問者が選んだベストアンサー

  • ベストアンサー
noname#227064
noname#227064
回答No.1

T^2を展開し、各項の期待値をX, Y, Zの同時分布の積率母関数から求めて地道に計算すればいいのでしょうが、面倒ですね。 手計算をする気がおきなかったので、Maximaを使いました。 実際の計算はX, Y, Zの同時分布の積率母関数を使わず、 A = (X-Np)/√(Np) B = (X-Nq)/√(Nq) C = (X-Nr)/√(Nr) = (X-N(1-p-q))/√(N(1-p-q)) とおき、A, B, Cの同時分布の積率母関数から、 E(T^2) = E((A^2 + B^2 + C^2)^2) を計算しました。 M(a, b, c) := (p*%e^(a/sqrt(N*p))+q*%e^(b/sqrt(N*q))+(1-p-q)*%e^(c/sqrt(N*(1-p-q))))^N*%e^-(a*sqrt(N*p)+b*sqrt(N*q)+c*sqrt(N*(1-p-q))); f(x, y, z) := (at(diff(M(a, b, c), a, x, b, y, c, z), [a = 0, b = 0, c = 0])); ratsimp((f(4, 0, 0) + f(0, 4, 0) + f(0, 0, 4) + 2 * f(2, 2, 0) + 2 * f(0, 2, 2) + 2 * f(2, 0, 2))); と入力して、X, Y, Zの同時分布の積率母関数M、a = b = c = 0における偏微分係数を求める関数fを定義し、最後にE(T^2)を求めたところ、 E(T^2) = 8-13/N+(pq+qr+pr)/pqrN が得られました。 したがって、 V(T) = 4-13/N+(pq+qr+pr)/pqrN であるので、 > 4に収束する値になると思いますが,いかがでしょうか。 が正しいことがわかりました。

gotouikusa
質問者

お礼

遅れましたが,今日回答を締め切らせていただきます。 おかげさまで問題を解決できたと思います。重ねて感謝申し上げます。 これからもどうぞよろしくお願いいたします。

gotouikusa
質問者

補足

quaestio先生,迅速なご回答,そして面倒な計算をしてくださり,本当にありがとうございます。 わたくしが解けない原因は,多項分布の同時積率母関数を忘れてしまったからでした。これから日本の大学院で数理統計を専攻するものとして,情けない限りです。 先生のご好意に答えるべく,この問題を一般の k 項分布の場合に拡張し,次のページにupload いたしました。お暇なときにでも,ご覧になっていただければ光栄です。 http://blog.goo.ne.jp/gotouikusa/e/76d6f4db44480d5e4da3ada0c09f1e56 これからも,厳しい御指導のほど,よろしくお願い申し上げます。今回は本当にありがとうございました。 *ほかの方 (またはquaestio先生も) からのご意見もお伺いしたいので,もう少し待ってみることに致します。お許しください。*

関連するQ&A

  • カイ二乗分布

    確率変数Xが自由度nのカイ二乗分布に従うとき  φ(t) = E(e^(tX))を求めよ という問題に取り組んでいます。 以下のように考えました。 Xがカイ二乗分布に従うので X = X1^2 + X2^2 + X3^2 + ... + Xn^2 とおけば E(e^(tX)) =E( e^(t(X1^2 + X2^2 + X3^2 + ... + Xn^2 ))) =E(Π(1->n) e^(t(Xi^2)) ) = Π(1->n) E( e^(t(Xi^2)) = (∫(-∞->∞) e^(tx^2) f(x) dx )^n (ここでf(x) は標準正規分布N(0 1)の確率密度関数)  = (∫e^(tx^2) * (1/√(2π)) e^(-x^2) dx ) ^n とここまで計算できたのですが、 この後が計算できません。 ネット上で調べたのですが、カイ二乗分布の積率を求めるときは たいてい、カイ二乗分布の確率密度関数を使っています。 上記の計算で 解きたいのですが アドバイスをいただけないでしょうか。 お願いします。

  • [統計学]カイ2乗分布

    カイ2乗分布について多くの入門的教科書では、 > 確率変数 X1, X2 が正規分布 N(0,1) に従うとき、 > Y = X1^2 + X2^2 で与えられる確率変数 Y はカイ2乗分布となり、 > 以下の式で表される: > (分布関数) のような説明がなされていると思います。 このとき、X1, X2 が異なる正規分布 N(e1, v1), N(e2, v2) に従う場合には、 そのカイ2乗分布はどのような式で与えられるのでしょうか。 (e = X の平均値, v = X の分散) おそらく簡単すぎるために、説明が省かれているのだろうと思うのですが、 自分にとっては簡単ではありません。 詳しく載っている書籍・ウェブサイトを挙げるだけでも構いませんので、 御教示お願いいたします。

  • カイ二乗分布の「カイ二乗値」について

    カイ二乗分布について、下記のような説明がよく見受けられます。 (a)カイ二乗値=Σ{(観測値)-(期待値)/期待値} (b)カイ二乗値=(標本サイズ*標本分散)/母分散 どちらもカイ二乗値という同じ値を表す数式だと思うのですが、 この二つはどのような関係にあるのでしょうか? 「カイ二乗値って何?どうやって求めるの?」と聞かれたとき、どちらが正解なのでしょうか? 漠然とした聞き方で申し訳ありませんが、宜しくお願いします。

  • 分散が1でない場合のカイ二乗分布?

    一般的な教科書で定義されているカイ二乗分布は、平均ゼロ、分散1の正規分布に従う確率変数の二乗和が従う分布として導出されています。では、分散がσ2のような一般的な場合はどうなるのでしょうか? このときのカイ二乗分布の分散だけでもわかるとよいのですが・・・、よろしくおねがいします。(この内容が記されている文献やHPの情報でも大歓迎です)

  • 統計ー分散;σの2乗ー計算

    X=1,2,3,4,5 に対して確率関数p(x)が各1/15、2/15、3/15、4/15、5/15 のとき分散:σの2乗を計算したら 平均は3/15=1/5だから σ^2=E(x^2)-(平均)^2 からσ^2=15-1/25=14.96 となりましたがあっているでしょうか。 分散が15だといわれてもイメージがわかないのですが。 (先に分散が直線にのる例なので、このような規則的な場合の分散は、計算する前に慣れていれば15くらいというのがでてきそうにおもうのですが。誰か納得いく説明をお願いいたします。

  • カイ二乗による適合度検定におけるカイ二乗値の分布

    カイ二乗による適合度検定で、期待度数と観測度数の差からカイ二乗値を計算するんですが、帰無仮説が正しい(すべての期待度数が観測度数と一致する)場合は、この検定統計量のカイ二乗値の分布はその自由度のカイ二乗分布になります。 帰無仮説が正しくなく、実際にある乖離(たとえば効果量w=0.3とか)があった場合、計算された検定統計量のカイ二乗値はどんな分布をすると理論的には言えるのでしょうか? 全体の総度数によってもかわるように思うのですが、いまいちわかりません。 平均の差の検定ではたとえば、t検定統計量が帰無仮説が成立しない場合非心t分布をとるのですが、カイ二乗検定ではこれは非心カイ二乗分布なのでしょうか? であったらその非心パラメタはどういうものなのでしょうか? カイ二乗による適合度検定で、検出力の計算をどうやるんだろうかと考えていたら、こういう疑問がわきました。

  • 確率・統計での分散について

    確率統計における分散について、用語として(文字通り)分散、標本分散、母分散、不偏分散などがあります。 初等的な意味合い(すなわち計算の仕方による定義)としては特段理解が難しいものではないと思いますが、テキストによって定義に若干齟齬があるように思えます。また、エクセルでの計算の実施という意味合いでもやや疑問があるのであらためてお尋ねします。 状況を設定します。 コーヒー豆が1万個ぐらい1つの袋に入っているとします。全部を調べるのが大変なので10個だけ無作為に取り出して調べるということにします(n=10)。 それを何回やるか、また取り出して豆は元に戻すか、ということもありますが、(10個の豆のセットを)1回だけ取り出すということで、元に戻さないということを前提とします(1回だけやるなら同じですね)。 分散:平均からの偏差の2乗和の平均(状況に無関係な一般用語?) 標本分散:1つの標本(10個)に関して分散を取ったもの。10個の豆の平均からの偏差の2乗和をn(=10)で除したもの。 母分散:袋に入っている1万個の豆を全数調査して調べた分散 不偏分散:10個の標本から母分散を推定しようとして標本(10個の豆)の平均からの偏差の2乗和を9(=n-1)で除したの。 このような定義で間違いないでしょうか。確率・統計の本ってものすごくいっぱいありますから本ごとにちょっと違うことが書いてあるように思ったのでお尋ねしました。標本分散のことを不偏分散と書いてある本があったりしたのですが。 その次にエクセルの関数、varp, var についてお尋ねします。 varpは母分散を求め、varは不偏分散を求めると仕様に説明されています。そのエクセルの計算に用いるデータは取り出した1つの標本(10個の豆)しかありません。 後者(var)はいいのですが、前者(varp)は母分散を求めるという仕様で、10個の豆だけで、1万個全数調査してやっとわかる母分散が分かるはずはないと思うのですが。母分散がサンプルから求まるはずはなく、サンプルから母分散を求める努力の結果が不偏分散ということですね。たとえば、母集団(豆袋)から取り出した10個のサンプルをあらためて母集団とみなしてただ単にその分散ということなのでしょうか。そのような入れ子のような解釈をすると混乱するのでそうではないはずなのですが。 長文ですみません、よろしくお願いします。

  • カイ二乗検定と分散分析の違い

    二つの使い方の違いがわかりません。見ることは二つとも差があるかというのであってるんでしょうか? 一例として、4グループあり(グループごとの人数は異なります)、いくつかの調査項目ごとにグループで差があるかを見る時、カイ二乗なのか分散分析(一元配置)なのかが謎です・・・ 例えば、質問項目例1:食事回数 a.3回 b.2回 c.1回以下         例2:身長  (  cm) などあったとすると 例1はクロス表4x3(3x4?)でカイ二乗でできそうなのですが、身長はどうやってするんでしょうか? また、項目ごとでカイ二乗にしたり分散分析にしたりというのは統計学的にありなんでしょうか? 統計については初心者です。色々似たような質問が出ていましたがやはりわかりません。すみませんが、よかったら助言お願いいたします。

  • 統計学の問題で困ってます!

    XとYが独立した確率変数で それぞれの積率母関数が m_X(t)=[0.5/(1-0.5e^t)]^2 , t<log(1/0.5) m_Y(t)=[0.5/(1-0.5e^t)]^3 , t<log(1/0.5) であるとする。 Z=X+Yの確率関数を求めよ といった問で、 m_Z(t)=m_X(t)・m_Y(t) から[0.5/(1-0.5e^t)]^5 負の二項分布の積率母関数 であることはわかりました このあと、確率関数にするのですが 幾何分布の定義 f_X(x)=p(1-p)^x x=0,1,2… にそのまま当てはめればいいのでしょうか(__) よくわからないので どなたか教えてください。 お願いします

  • カイ二乗分布のパーセント点について

    母分散の区間推定などにカイ二乗分布を使うときに たとえば有意水準5%で推定するときに両側検定をすると カイ二乗分布表の上側確率0.025%の部分と0.975%の部分を見ることになりますよね。 そのとき、0.025%の部分のカイ二乗値から0.975%の部分を計算することはできるのでしょうか。 たとえば、F値の場合F(0.975)=1/F(0.025)の関係があるようにカイ二乗値にも右側と左側で関係性があるのかどうかということです。 うまく説明ができていないかもしれませんが、ご解答いただければ幸いです。