• 締切済み

2次元以上のデータの分散の計算の仕方

分散の求め方として,  σ2=1/(n-1)Σ(x-mean(x))^2  http://ja.wikipedia.org/wiki/%E5%88%86%E6%95%A3#.E6.A8.99.E6.9C.AC.E5.88.86.E6.95.A3 という式で求めるわけですが,xが1次元の場合はこれで計算すればいいと思いますが, 3次元以上の場合は,どう求めたらいいのですか? また,2次元の場合の分散として,σxx,σxy,σyy の3種類を求めることができる わけですが,データの散らばりが小さい(より小さい半径の円の中に収まる) 度合いを測るには,σxx,σxy,σyyのどれを使うべきなのでしょうか? σxxは,xの平均値から最大値までの長さ σyyは,yの平均値から最大値までの長さ だと思うのでこれがデータを収めるための円の半径になる気がしているので, max(σxx,σyy)で散らばりを測るのがいいのかと考えています。 しかし,σxyが幾何的に何を表しているのかイメージできないのでどれを使うべきか迷ってます。

みんなの回答

  • rabbit_cat
  • ベストアンサー率40% (829/2062)
回答No.1

n次元の分散は、n×nの対称行列になります。共分散といってます。 日本のWikipediaのページはいまいちなので、英語版ですが、定義も載ってます。 http://en.wikipedia.org/wiki/Covariance 質問の後半ですが、 つまり、x、yの平均がともに0である場合について言えば、 x' = xcosθ + ysinθ y' = -xsinθ + ycosθ みたいな変数変換をしたときに、(θをいろいろ動かしたときの)、x'の分散の最大値を知りたい、ていうことですか? σx'x' = (sin^2θ)*σxx + (cos^2θ)*σyy + σxy*2sinθCosθ ですから、これの最大値を求めればいいですね。 高校知識で真面目にやってもいいですし、2次形式なんで適当に処理してもいいです。

nekome___
質問者

補足

補足用のブログを作成しました。 以下のサイトを見て回答お願いします。 http://dataputon.seesaa.net/article/109696533.html

関連するQ&A

  • 共分散行列の求め方

    数個のデータから共分散行列を生成するプログラムを実装しようと 考えています。そこで、次のようなプログラムを書きましたが、 結果があっているかがわかりません。共分散行列の生成方法に 詳しい方がおられましたら、どうか教えて頂きたいと思います。 共分散行列生成に用いた式は Σ = E[(X-E[X])(X-E[X])^T]  です。 (Σ:共分散行列 X:データ E[X]:Xの平均 ^T:転置行列) double xave = 0.0; //式のE[x]にあたる部分 double work [ ]; //データを入れる一次元配列(式のXにあたる) double a[][]; //共分散行列を入れる配列 work[0] = 3; //5つのデータを格納 work[1] = -2; work[2] = 5; work[3] = -3; work[4] = 2; for(i = 0; i < N; i++){   //E[x]を求めるためにxaveに全要素合計を入れる xave += work[i]; } xave /= N;        //全要素合計をデータ数で割る for(i = 0; i < N; i++){   //要素Xから平均を引く(X-E[x]にあたる) work[i] -= xave; } for(i = 0; i < N; i++){ for(j = 0; j < N; j++){ a[i][j] = work[i]*work[j]/N;  //a[][]に値を格納 Nで割っているのは式の一番外側のEにあたる } } <実行結果> 0.0 | 0.0 | 0.0 | 0.0 | 0.0 0.0 | 4.0 | -6.0 | 8.0 | -8.0 0.0 | -6.0 | 9.0 | -12.0 | 12.0 0.0 | 8.0 | -12.0 | 16.0 | -16.0 0.0 | -8.0 | 12.0 | -16.0 | 16.0

  • 統計ー分散;σの2乗ー計算

    X=1,2,3,4,5 に対して確率関数p(x)が各1/15、2/15、3/15、4/15、5/15 のとき分散:σの2乗を計算したら 平均は3/15=1/5だから σ^2=E(x^2)-(平均)^2 からσ^2=15-1/25=14.96 となりましたがあっているでしょうか。 分散が15だといわれてもイメージがわかないのですが。 (先に分散が直線にのる例なので、このような規則的な場合の分散は、計算する前に慣れていれば15くらいというのがでてきそうにおもうのですが。誰か納得いく説明をお願いいたします。

  • 【緊急です】期待値、分散について

    【緊急です】期待値、分散について 今日の統計学の試験勉強をしていたら以下の質問がわからなくなり、困っています。 平均E(x)=5、E(x^2)=30のとき分散Var(x)=??となる。さらにE(y)=1,E(xy)=-1ならば、共分散Cov(x,y)=-6である。n-3のとき平均u、分散σ^2=1の正規母集団から無作為抽出された標本(x1,x2,x3)について、Σi=1 n(xi―標本平均値xバー)^2の期待値E(Σ(xi―標本平均値xバー)=???である。またE(Σ(xi-u)^2=???となる。 以上3点の問題がわかりません。噛み砕いて説明していただけると幸いです。

  • 多次元正規分布の分散共分散行列について

    p次元確率変数ベクトル X(i) が p次元正規分布 N(0,Σ) に従っているとき p次正方行列 A で X を一次変換した Y (Y=AX) が従う多次元正規分布の分散共分散行列はどうやって求めればよいでしょうか? 考え方だけでも良いのでおしえてください。 お願いします。

  • 分散の計算について

    お忙しいところ失礼します。数学か生物かどちらのカテゴリーに当てはまるかわからないのですが、こちらにさせていただきました。 レポートの中で、データの平均と分散を求めなくてはいけないのですが、レポートの書き方のプリントに載っている例題の計算がどうしても合いません。        分散:V=Σ(x-xの平均)の二乗/(n-1) (わかりにくくてすみません) x=244 xの平均=9.8 n=25 という式で、V=238.6/(25-1)=9.9と書いてあるのですが、「(x-xの平均)の二乗」の計算が、どうしても「238.6」になりません。 よろしかったら回答お願いいたします。 ちなみに、これはある生物の巣穴の分布様式を求める式で、xは巣穴の数、nは測定した区画の数です。

  • 統計の分散のイメージ

    統計で「分散」という概念がありますが、これは個々のデータの散らばり具合の大きさを表すと理解しています。ですが、何を基準に分散の値が大きいとか小さいといえるのでしょうか?たとえば分散が15と出た場合、散らばり具合が大きいか小さいかはどうやって判断すればよいのでしょうか?

  • 分散の証明中

    var(X+Y)=var(X)+var(Y)の証明の解答を見ていたときにXYが独立である時共分散は以下のようになると書かれていました・・・ E[XY-XE(Y)-YE(X)+E(X)E(Y)]=E(XY)-E(X)E(Y)=0 しかしなぜ左の式から真ん中の式に変換できたのか分かりません。どなたか教えてください。。

  • 多次元正規分布に関する質問

    多次元正規分布についてのシミュレーションをする課題を持っているのですが 少しわからないところがあります。 m次元正規分布の式はwikipediaにあるように http://ja.wikipedia.org/wiki/%E6%AD%A3%E8%A6%8F%E5%88%86%E5%B8%83 N(u,S)=exp(-(x-u)'invS(x-u)/2) / (2PI)^(m/2)sqrt(detS) です。ですが分散共分散行列Sを使わず分散をスカラーとしてつまり σで書きたいのです。 (なのでm次元のどの方向においても分散はσ^2でいいです。 そういう簡単な状況でのシミュレーションをしようとしています。) この場合、m次元正規分布のしきはどうなるのでしょうか。 よろしくお願いいたします。

  • 共分散の求め方。

    2社の株価の予想変化率に関する確率分布は以下の様に与えられています。 A社の予想株化上昇率をXという確率変数で表し、B社についてはYとする。 表:2社の株化の変化率に関する確率分布      |  A社の株化上昇率(%)      |  -10  0  10 ――――|―――――――――――――― B -20| 0.10  0.05  0.10 社   5| 0.10  0.20  0.05 の  30| 0.20  0.15  0.05 上 昇 率 このときに、XとYに関する共分散を求めたいのですが XとYが独立でない時、 Cov(X,Y)=E(XY)-E(X)E(Y) となるのは分かるのですが E(XY)の計算の仕方がわかりません。 ノートには、 E(XY)=E{Y・E(X|Y)} と書いているのですが これってどうやって計算するのですか? 教えてください。お願いします。 できればテストのある月曜までに ご回答よろしくお願いします。。 正確な解答はなくてもE{Y・E(X|Y)}の 計算方法だけでもけっこうです。

  • 分散の公式で・・

    各データと平均の差を2乗してデータ数で割る という方法と 各データと平均の差を2乗して(データ数-1)で割る という方法の2つがあるのですが、どちらが正しいのでしょうか? 普遍分散と分散と呼ばれているそうですが、何が何だかで・・ 下記に2つ式が載っています。どうかご享受願お願いいたします。 http://ja.wikipedia.org/wiki/%E6%A8%99%E6%BA%96%E5%81%8F%E5%B7%AE