統計量の行列表現と歪度の表現方法について

このQ&Aのポイント
  • 統計量の行列表現について述べました。データセットの分散を行列で表す方法を紹介しました。
  • さらに、データセットの歪度を行列で表現する方法について質問しました。
  • 平均が0の場合、歪度はデータの3乗の平均となりますが、それを行列で表現できるのか疑問を持っています。
回答を見る
  • ベストアンサー

統計量の行列表現について

データセットx_i (i=1,2,...n)の 分散 v を考えます(式が面倒になるので、平均は0とします)。 通常でしたら、データの2乗の平均でいいのですが(平均は0なので)、これはデータセットの各データが均等の確率で現れるという前提で求められる分散です。 一般には、 v=Σ p(i) x_i^2 となると思います(p(i)はデータx_iが現れる確率)。 次にこれを行列で表すことを考えます。 データセットのベクトルをX (列ベクトル)とすると、 v = X^{T} W X という行列の積になります。 ここでWは W=diag (p_1, p_2,...p_n) という対角行列で、まあ加重行列とでも呼びましょう。 さて、ここからが質問なのですが、この方式で歪度は表現できるのでしょうか? 平均が0なので、歪度はデータの3乗の平均です。加重を考えると、 歪度 = Σp(i)\times x_i^3 です。 これを X と Wで表現したいのですが、どうもうまくいきません。 何か知恵がございましたらよろしくご教示ください。

質問者が選んだベストアンサー

  • ベストアンサー
  • alice_44
  • ベストアンサー率44% (2109/4759)
回答No.1

2 乗和であることを反映して、W は添字が 2 個でした。 p_i は添字 1 個なのに、W に作り変えた訳です。 3 乗和のためにも、新たな係数を作ればいい。 A(i,j,k) = (i=j=kのとき)p_i, (それ以外のとき)0 と置いて、 ΣΣΣ[i,j,kのすべての組み合わせについて] A(i,j,k) x_i x_j x_k を計算すれば、目的の 3 乗和になります。 A は行列じゃなく、3 階テンソルになりますが。

関連するQ&A

  • 統計学について

    統計学の問題です。平均はできたのですが、分散ができなくて困っています。解答、解説をどうかよろしくお願いします。問題は以下です。 確率変数X、Yは独立で、それらの平均と分散はE(X)=μ1、E(Y)=μ2、V(X)=σ1、V(Y)=σ2であるとする。εはベルヌーイ分布Ber(p)に従う確率変数であり、X、Yとは独立であるとする。そのとき、確率変数Z=εX+(1-ε)Yの平均と分散を求めよ。 ちなみに、答えは、E(Z)=pμ1+(1-p)μ2、V(Z)=pσ1+(1-p)σ2+p(1-p)(μ1-μ2)^2 です。

  • 二つの確率ベクトルの共分散行列

    n次元確率ベクトルXについての分散共分散行列 Cov(Xi, Xj)の説明は多くの教科書にあり理解しているのですが,p次元確率ベクトルPとq次元確率ベクトルQについての共分散行列 Cov(Pi, Qj) が何の指標になっているのかがわかりません.行列の各成分は何を表しているのでしょうか.直感的・幾何学的なイメージがつかめないのですが...

  • 多次元正規分布の分散共分散行列について

    p次元確率変数ベクトル X(i) が p次元正規分布 N(0,Σ) に従っているとき p次正方行列 A で X を一次変換した Y (Y=AX) が従う多次元正規分布の分散共分散行列はどうやって求めればよいでしょうか? 考え方だけでも良いのでおしえてください。 お願いします。

  • 統計学を教えて

    次の問題に苦しんでいます。教えてくれると助かります。 確率変数X.Yは独立で、それらの平均と分散は、E(X)=μ1、E(Y)=μ2、V(X)=σ1^2、V(Y)=σ2^2 であるとする。εはベルヌーイ分布Ber(p)に従う確率変数であり、X.Yとは独立であるとする。そのとき、確率変数Z=εX+(1-ε)Yの平均と分散を求めよ。 出来れば、解説もしてもらえると助かります。

  • 統計学について

    統計学の問題です。自分でやってみたのですが、できなくて困っています。解答、解説をよろしくお願いします。問題は以下です。 2つの確率変数X,Yの平均は0であり、それらの分散と共分散はV(X)=9、V(Y)=16、Cov(X,Y)=8であるとする。X、Yを比率w,1-w(0<w<1)で案分して得られる確率変数Z=wX+(1-w)Yの分散を求め、分散を最小にする比率wを求めよ。 ちなみに、答は、w=16/18=8/9の時、最小値80/9を取るです。

  • 統計学

    統計学についての質問です。 平均u(ミュウ)、分散σ^2(シグマの2乗)の正規母集団から大きさ4の無作為標本の平均(標本平均)をX(Xバーのこと)とするとき、  確率P(|X(Xバー)-u|<σ)の値を求めよ。 まったく分からないので誰か助けてください・・・。

  • 共分散行列の固有値・固有ベクトルの行列

    以下のようなデータを用いて、共分散行列を生成するとします。 (各No.にはそれぞれx1~x5の5つのデータ) x1 x2 x3 x4 x5 No.1 [2 4 5 2 1] No.2 [3 10 8 7 9] No.3 [11 3 2 1 6] すると、共分散行列は3×3の正方行列になり、その固有値も3つ求まりますよね。 しかし、固有ベクトルに関してはデータがx1,x2,..,x5と5次元で考えているので、 ひとつの固有値に対して5つの成分を持つ固有ベクトルが求まりますよね。 よって、共分散行列の固有値行列は必ず正方行列になりますが、固有ベクトルの 行列は上の例の場合なら5×3行列(列は対応する固有値の数、行はベクトルの成分の数)となり、 必ずしも正方行列にはなりませんよね?そのあたりを教えて頂きたいと思います。 よろしくお願いします。

  • 統計ー分散;σの2乗ー計算

    X=1,2,3,4,5 に対して確率関数p(x)が各1/15、2/15、3/15、4/15、5/15 のとき分散:σの2乗を計算したら 平均は3/15=1/5だから σ^2=E(x^2)-(平均)^2 からσ^2=15-1/25=14.96 となりましたがあっているでしょうか。 分散が15だといわれてもイメージがわかないのですが。 (先に分散が直線にのる例なので、このような規則的な場合の分散は、計算する前に慣れていれば15くらいというのがでてきそうにおもうのですが。誰か納得いく説明をお願いいたします。

  • 共分散行列の求め方

    数個のデータから共分散行列を生成するプログラムを実装しようと 考えています。そこで、次のようなプログラムを書きましたが、 結果があっているかがわかりません。共分散行列の生成方法に 詳しい方がおられましたら、どうか教えて頂きたいと思います。 共分散行列生成に用いた式は Σ = E[(X-E[X])(X-E[X])^T]  です。 (Σ:共分散行列 X:データ E[X]:Xの平均 ^T:転置行列) double xave = 0.0; //式のE[x]にあたる部分 double work [ ]; //データを入れる一次元配列(式のXにあたる) double a[][]; //共分散行列を入れる配列 work[0] = 3; //5つのデータを格納 work[1] = -2; work[2] = 5; work[3] = -3; work[4] = 2; for(i = 0; i < N; i++){   //E[x]を求めるためにxaveに全要素合計を入れる xave += work[i]; } xave /= N;        //全要素合計をデータ数で割る for(i = 0; i < N; i++){   //要素Xから平均を引く(X-E[x]にあたる) work[i] -= xave; } for(i = 0; i < N; i++){ for(j = 0; j < N; j++){ a[i][j] = work[i]*work[j]/N;  //a[][]に値を格納 Nで割っているのは式の一番外側のEにあたる } } <実行結果> 0.0 | 0.0 | 0.0 | 0.0 | 0.0 0.0 | 4.0 | -6.0 | 8.0 | -8.0 0.0 | -6.0 | 9.0 | -12.0 | 12.0 0.0 | 8.0 | -12.0 | 16.0 | -16.0 0.0 | -8.0 | 12.0 | -16.0 | 16.0

  • 確率統計

    ◆ 確率分布とパラメータ:指数分布 λ>0 確率・確率密度関数P(X=x)またはPx(x):{Px(x)=λe^(-λx) (x>0) , Px(x)=0 (その他)} 特性関数 φx(jt):(1-jt/λ)^(-1) 平均値 E[X]:1/λ 分散 Var[X]:1/(λ^2) ◆ 確率分布とパラメータ:幾何分布 0<p<1 確率・確率密度関数P(X=x)またはPx(x):Px(X=x)=pq^x, x=1,2,・・・ q=1-p 特性関数 φx(jt):p/(1-qe^(jt)) 平均値 E[X]:q/p 分散 Var[X]:q/(p^2) ◆ 確率分布とパラメータ:負の2項分布 r=1,2,・・・, 0<p<1 確率・確率密度関数P(X=x)またはPx(x):Px(X=x)=【r+x-1,x】(p^r)(q^x) , x=0,1,2,・・・ q=1-p 特性関数 φx(jt):{p/1-qe^(jt)}^r 平均値 E[X]:rq/p 分散 Var[X]:rq/p^2 これらの確率分布について、(1)連続確率変数と離散確率変数のどちらか、(2)全体の確率P(-∞<X<∞)=1となることを計算せよ、(3)これらの確率変数について、平均E(X)と分散 V(x)が求められることを計算せよ。 ってところがわかりません。よろしくお願いします。