• 締切済み
  • 困ってます

母相関0のときの相関係数の標本分布

母相関0の二次元正規分布に従う母集団からn個(n≧3)の標本をとって、その(標本)相関係数rを得たとき、r√(n-2)/√(1-r^2)は自由度n-2のt分布t(n-2)に従うというの多くの統計の教科書で見かけるのですが、その証明はどうやればよいのでしょうか。 rを標本変数の式で実際に書いてみて式変形をするだけだとは思うのですが、うまくできませんでした。よろしくお願いします。

共感・応援の気持ちを伝えよう!

みんなの回答

  • 回答No.1
  • selfer
  • ベストアンサー率76% (104/136)

こんにちは.心理学研究で統計解析法を使っている者です.数学は苦手ですが,統計学そのものには興味があります. 道具論的に統計学を使う場合,多くの統計解析法の使い手(私も含めて)は,どのような原理でその計算式が成立するかは考えていません.正直,統計解析法の教科書にその証明過程が書かれていないのです. とりあえず,手持ちの資料『教育と心理のための推計学 新訂版』で参考になりそうなものを引用します. http://www.amazon.co.jp/exec/obidos/ASIN/4821062046/qid=1104663915/ref=sr_8_xs_ap_i1_xgl/t/250-4552206-6425031 <無相関検定> 無相関検定(母相関0の検定)を行う場合には次のt検定を用いる.    r√(n-2) t=―――――――, 自由度=n-2    √(1-r^2) これは母相関=0のときrの分散の不偏推定値(u^2r)が  u^2r=(1-r^2)/(n-2) であることを利用したものである.なお,ここでいう分散とは,X(またはY)にもとづくY(またはX)の推定の誤差分散のことである. <推定の誤差分散> XからYの推定についての誤差分散は u^2y・x=(Σd^2y・x)/(n-2) ※dy・xとは(実測値のY - Xから推定される推定値Y) YからXの推定についての誤差分散は u^2x・y=(Σd^2x・y)/(n-2) ※dx・yとは(実測値のX - Yから推定される推定値X) …… とりあえず関連がありそうかな? と思われるところをよく分からずに引用しております.私自身はこれ以上はよく分かりませんが,参考になるようでしたら,ご利用下さい. むしろ,その証明が分かりましたら,逆に教えていただければ幸いです.

共感・感謝の気持ちを伝えよう!

質問者からのお礼

ありがとうございます。もう少し考えてみたいと思います。うわさでは母相関ρが一般の場合でも標本分布を具体的に密度関数を用いて表すことが出来るそうなのですが、自力で導くのは無理そうなので、明日以降、図書館で調べてみようと思います。

質問者からの補足

遅くなりました。普通の大型書店においてあるような本にはあまり書いてなく、仕方ないので大学の図書館で調べてみました。母集団分布ρが一般の場合についても二次元ウィシャート分布の密度関数の公式から標本相関係数rの密度を計算することができ、その公式でρ=0の場合は特別にt=r/√(1-r^2)とおくと√(n-2)tがt(n-2)に従うことが示せるようです。ただ一般にウィシャート分布(多次元のχ^2分布に相当するものです)の密度の導出は結構面倒な計算がいるようで、フォローするのも大変でした。無限級数表示されていますので、入門の統計学の本には書いてないのだと思います。ρ=0の場合だけを調べたいならもう少し楽に計算できるように思いましたが、一般の場合についてもフィッシャーのz変換の分布を調べたいという欲求もありますので、この形できちんと証明できた方がよいとも思いました。http://www5d.biglobe.ne.jp/~pomath/study/statistics.htmlこちらに要約ですがまとめておきました。いずれにせよ中級以上の本か、あるいは数理統計の専門書をみないとあまり載っていない気がします。詳しい計算は書かれていないのですが、竹村彰通著、多変量推測統計の基礎、共立出版で扱っていました。多くの書物で触れているのでとか書いてましたので、Kendall & StuartやらAndersonやらの大著を読めば詳しく書いてあるのかも知れません。

関連するQ&A

  • 正規分布でないときピアソンの相関係数を使いたいのですが。

    文献には、ピアソンの相関係数は ・連続変数 ・正規分布に従う。 時に使い、それ以外はスピアマンの順位相関係数を使うとありますが、正規分布をとらないときピアソンの相関係数を使うと問題がありますか?心理学では正規分布の条件は無視した論文もあると聞いたことがあるのですが。どうしてもピアソンで行いたいので、もし、無視できるくぐりぬけかたがあれば教えてください。 都市の「汚染物質排出量」と「イオン濃度」のあいだで相関係数を調べました。 サンプル数は29で「イオン濃度」はおおまかに正規分布をとるのですが「汚染物質排出量」では中央が少なく正規分布をとりませんでした。 相関係数はそれぞれ、ピアソンは、0.67で、スピアマンでは0.56です。 ともにp<0.01水準で有意でした。 どうか、分かる方がいましたら教えてください。お願いします。

  • ピアソンの相関係数の有意検定について

    ピアソンの相関係数 r を求めて、有意検定をするところを勉強していますが、t検定のとき 標本数nと相関係数rから求めますが、 自由度についてよく判りません。 危険率0.05で、棄却域を求めるときの自由度ですが。 (n-1)で検定をするのか、(n-2)なのか判りません。 いろんなサイトで調べると(n-2)のt分布に従うとあり。 私の本では、(n-1)で棄却域が求められています。 共分散の考えから、(n-2)なのでしょうか。 教えてください。

  • 非正規母集団の相関係数の有意性検定法について

    変量(X,Y)に関する,大きさNのデータが既知であるとき,X, Yの相関係数ρの有意性を検定(無相関検定)する方法を探しています。 ただし,データは標本ではなく母集団であり,X,Yに関して正規分布が仮定できないとします。 無相関を仮定して,相関係数の確率密度分布を求め,その分布を利用して検定する(実際の相関係数ρが分布のどの程度端に存在するかを見る)という方法でよいのでしょうか? よろしくお願い致します。

  • 相関がある2つの正規分布

     確率統計の試験の過去問題で分からない問題があったため質問させていただきました。問題分の内容は以下になっています。 (問題) Xは平均1、分散4の正規分布に従い、Yは標準正規分布に従う確率変数である。またXとYの相関係数は0.5である。X+Yが0以下になる確立を求めなさい。    互いに独立な時は正規分布の再生性よりX+YがN(1,4)に従うのですが相関があるときにどうすればよいかが分かりません。 宜しくお願い致します。  

  • χ^2分布と標本の関係

    命題:正規分布N(μ,σ^2)に従う正規母集団から,大きさnの標本X_1,X_2,…,X_nを無作為抽出したとき, Z={(X_1-μ)^2+(X_2-μ)^2+…+(X_n-μ)^2}/σ^2 は自由度nのχ^2分布に従う. というのは理論的に数式から導かれたものなので,納得できました. ところが, 命題:正規分布N(μ,σ^2)に従う正規母集団から,大きさnの標本X_1,X_2,…,X_nを無作為抽出し, 標本平均X=(X_1+X_2+…+X_n)/n を作ると, Z={(X_1-X)^2+(X_2-X)^2+…+(X_n-X)^2}/σ^2 は自由度n-1のχ^2分布に従う. が成り立つ理由が分かりません.数式を用いて理論的に教えて下さい.

  • 統計学の中心極限定理(nが十分に大きいとき、どんな分布から抽出しても、

    統計学の中心極限定理(nが十分に大きいとき、どんな分布から抽出しても、標本平均は正規分布)について質問させて頂きたいと思います。母集団からn個の標本をk回を取り出す場合、上記の「nが十分に大きいとき」とは1.(文字通り)母集団から取り出すn個の標本が十分大きい、2.取り出し回数のk回が十分多い、3.1と2の両方、のどれを意味しているのでしょうか?初学者なので基本的な質問かと思いますがよろしくお願いいたします。

  • 正規分布でない母集団の母平均の信頼区間

    数学を趣味で勉強してます。よろしくお願いします。 質問内容は 正規母集団の母平均は、t分布を使って求められますが 標本を取って行ったら「母集団が正規分布と言えない場合」の 母平均の信頼区間を求めるには、どのように考えればよいのでしょうか。 母集団が正規分布でなくても、 中心極限定理(標本数を大きくしていくと標本平均の確率分布は正規分布に近づく)から 標本数を増やしてt分布使えばいいのかな?と思うのですが、どうでしょうか。 アドバイス、お願いします。

  • 相関係数について

    お世話になっております。 統計初心者で、質問の内容もそもそも,おかしいかもしれませんが、 質問させてください。 以下のような、関連性のない2変数に関して、 両変数間の総合的な類似度を計算する方法に、 ピアソンの積率相関係数及び、スピアマンの順位相関係数を 使用したいと思っております。 変数X |変数Y 177.67 |171.539 156.3 |154.415 143.72 |140.236 141.41 |135.375 127.74 |126.492 127.09 |125.916 125 |116.326 119.99 |116.211 67.24 |62.222 52.59 |47.566 47.31 |45.37 41.47 |35.294 24.85 22.79 21.78 現在は、外れ値がない場合は、ピアソンの積率相関係数を使用しており、 ある程度類似度が算出できています。 スピアマンの順位相関係数に関しては、まだ使用できておりません。 以下、疑問点になります。 (1)そもそも2変数間の類似度を算出するのに相関係数は有用か (2)項目数が違うものに関して、両相関係数は適用可能か (3)両変数間に対応がなく、既に大きさ順に並んでいるものに、スピアマンの順位相関係数は適用可能か また、2変数間の総合的な類似度を算出するのに有用な方法などありましたら、 ご紹介頂ければ幸いです。 何卒、宜しくお願い致します。

  • スピアマンの順位相関係数について教えてください

    論文を書いておりますがスピアマンの順位相関係数での相関のあるなしが次のデータから言って良いのかどうかを教えてください 実際のものとは違いますが、たとえば 変数1を身長として、変数2を最近体のだるさがないを「0」すこしあるを「1」かなりあるを「2」とした時に「身長と体のだるさ」に相関があるかどうかをスピアマンの順位相関係数で言えるのかどうか? このデータで 変数1を身長、変数2をだるさなし群を「0」少しでもあるとかなりあるをあわせて症状がある群を「1」として、対応のないt検定をおこなったところ優位な差がでなかったので他の統計処理を行えば差がでるのか知りたいです。 統計は初心者中の初心者です。 t検定もyou tubeに出てた方法をそのままエクセル2010でおこなっただけです。 これがスピアマンや他の統計処理ができそうなら大学の図書館の統計処理ソフトで行う考えです。

  • AMOS 相関係数が1を超えます

    今ひとつ統計の知識が疎かなまま,AMOSを使わなければならず,ご教示いただきたくお願いします。 ある仮説による尺度を用いて,あるグループにおこなったデータを検証的因子分析で検討しようとしています。 その結果,標準化推定値を求めたところ,ある2つの因子(潜在変数)間の相関係数が1.05となり,1を超えました。 相関係数はー1≦ α ≦ 1の値を取ると思うのですが,この原因や対処法などありましたら教えていただけませんでしょうか。 データを取った集団は,35名と小規模で,無作為に抽出した集団ではなく,比較的似通った回答をしているかもしれませんが,こういったことが一因なのでしょうか。