- ベストアンサー
主成分分析の固有値について
- みんなの回答 (1)
- 専門家の回答
質問者が選んだベストアンサー
なかなか回答が無いので私から, 私は応用統計学の学位があり,企業でSQCを普及する立場にある者です. 主成分分析は,主成分軸の分散(固有値)が大きい順にスペクトル分解し データを縮約して見る方法ですので, 「固有値の絶対値の大きい順に見る」というのは,意図としては正解です. 時々,このような発想(負値も含んで大きい順)をされる方がみえます. しかし,分散共分散行列を出発行列にしても,相関係数行列を出発行列にしても それらは,いずれも半正定値行列ですので,固有値は非負です. 従って,ご質問の回答ですが,「そのようなケースはありません」となります. (分散共分散行列が半正定値行列になるということは,ここの質問にあります. 基準化したデータの分散共分散行列が相関係数行列ですので, 分散共分散行列が半正定値なら,相関係数行列が半正定値であることは自明です) なお,主成分分析の軸上の分散は固有値に等しいと書きましたが, その分布はχ^2分布です. これは,関連知識として覚えておいて損はありません.
関連するQ&A
- 主成分分析について
主成分分析を行い、主成分ベクトルを求めるためには行列(共分散行列)の固有値問題を 解き、固有値・固有ベクトルを求めればよいですよね。そこで固有値行列(対角成分に固有値 λが並ぶ行列)の固有値の値から累積寄与率を求め適当な次元まで減らすということは わかっています。そこで質問です。 例えば、元々100次元あるとします。固有値問題を解けば、100個の固有値が求まりますよね。 その固有値ひとつひとつに100個の成分を持つ固有ベクトルが存在しますよね。 これを50次元に減らすとします。元々100個固有値を持つ行列から、50個分を用いることになり ますよね。ここで、次元が50になったので固有値と対応する固有ベクトルの成分の数も100から 50に減るのですか?減るとしたら、固有ベクトルの成分からどのように50個取り除けばよいかが わかりません。どうか教えていただきたいと思います。
- ベストアンサー
- 数学・算数
- 主成分分析の固有ベクトルの求め方
今、3×3行列の主成分分析をしているのですが、どうしても固有ベクトルがうまく求められません。2×2行列の固有ベクトルは公式が導かれているのですが、3×3行列はよく分かりません。 ゴリゴリに計算をするしかないのでしょうか?よろしくお願いします。
- 締切済み
- 数学・算数
- 主成分分析でのばらつき
主成分分析において、因子のばらつきが多いところを見つけるには出力結果の何を見ればよいのでしょうか? 例えば、月を変数として、ある商品の価格を全国の都道府県ごとに主成分分析すると、 結果として、固有値、寄与率、固有ベクトル(各月に対して)がでますよね?ここで、全国の都道府県間の価格のばらつきが多い月は何月か見るためには、主成分分析の結果のどこに着目して解釈すればよいのでしょうか? よろしくお願いします。
- ベストアンサー
- 経済学・経営学
- 主成分分析に関する質問です。
主成分分析に関する質問です。 平均が[0, 0],分散がσ^2*I2(I2は2*2のidentity matrix)のガウス分布に対おする共分散行列を考えます。 この共分散行列の主成分と固有値 第1主成分への投影によって再構成された値 投影によるエラーの値(真値と再構成された値の2乗誤差) を求めたいと思っていますが、とき方がわからず困っています。
- 締切済み
- 数学・算数
- 主成分分析の第2主成分について
主成分分析初心者です。基本的なところから独学で勉強しています。 2種類の変数についてグラフ上で散布図を作成したとき、各点から最も近い距離にある直線を第一主成分軸としたとき、この第一主成分が最も寄与率が高くなることは分かりました。しかしなぜ第一主成分軸と直角で交わる直線が第二主成分軸となるのでしょうか?かならず直角で交わる直線が第二主成分軸となり、寄与率が二番目となるのですか? 初心者ですので分かりにくいかと思いますが宜しくお願いします。
- 締切済み
- 数学・算数
- 主成分分析の途中。固有値の求め方で質問が。。
今、マンガでわかる統計学 因子分析編を読んでおり、 その中の主成分分析をやってます。 主成分分析を行っていく途中で、固有値を求めていたのですが、 計算途中で、 λ3乗 - 3λ2乗 + 2.7443λ - 0.78534 = 0 というところまで出ました。 これを、どうやってλについて求めればいいのでしょうか? 本では、数学的な詳しいところは省いてあり、 主成分分析の全体の流れの中で、ラグランジュの未定乗数法を使うとだけ書いてありました。 ここで、それを使うのでしょうか? 本には結果だけ書いてあり、 結果は、 固有値λは、 1.6 0.8 0.6 となるようです。 すみませんが、ここの求め方(どんな公式を使うかでもいいです) 丁寧に教えていただけませんでしょうか? よろしくお願いします。 一応、固有値を求めたい元の行列を書いておきます 1 0.19 0.36 0.19 1 0.30 0.36 0.30 1
- ベストアンサー
- 数学・算数
- 主成分分析の寄与率等に関する質問です。
主成分分析の寄与率等に関する質問です。 主成分分析をかけ、累計寄与率まで出したとして、 第4主成分の時点で累計寄与率90%の場合、全体情報の90%を含んでいるということになると思うのですが、 その第1~4主成分の式を使うことでもともとのデータの予測というものはできるのでしょうか? (1)できるか否か (2)できるのであれば方法 を教えてください。 勉強したてでよく分かっていない部分もありますが、よろしくおねがいいたします。
- 締切済み
- 数学・算数
- 主成分分析とは
主成分分析といわれる統計処理があります。これは確率・統計の勉強を進めていったら出てくるのだろうかと思うのですが、ずっと勉強していたら必ず出てくるということでも無さそうです。確率統計という学問はいろんなものに応用されていく(文理関係なく)ので基礎と応用というペアも幅広く、どのような勉強の仕方があるのだろうと思うわけですが。 名前から想像すると、ある種のデータの変動を説明する主要な要因を抽出し、その寄与を調べるという風に見えます。例えば、世界各地の気温データの時系列データを集めて、それに関係しそうなデータ(CO2排出量とか)を突き合わせてその因果関係の度合いを調べるというようなものです。そういうことなのでしょうか。分散共分散行列の固有値を調べ、その値の大小を調べるということのようですが。 少し話が飛びますが、Rという統計ソフトを使えば、それに応じた形式のデータをRに処理させれば、自然と値(寄与率とか)が出てくるというブラックボックス的な使い方もできるのかなと思いますが、どうでしょうか。 よろしくお願いします。
- 締切済み
- 数学・算数
- 主成分分析について
主成分分析について 現在、主成分分析の計算方法を勉強をしているのですが、主成分得点の求め方がわかりません。 例をあげて説明させていただくと、 x1 x2 x3 8 9 4 2 5 7 8 5 6 3 5 4 7 4 9 4 3 4 3 6 8 6 8 2 5 4 5 6 7 6 このようなデータを分析するとして、各変数の相関係数(X1X2 X2X3 X1X3)の値はわかりますし、計算方法もわかります。 またここから固有値もわかります。 しかしここからどうやって、主成分得点を求めればよいかわかりません。 どのように計算するのですか?よろしければご回答下さい。
- ベストアンサー
- 数学・算数