• ベストアンサー

主成分分析について

主成分分析について 現在、主成分分析の計算方法を勉強をしているのですが、主成分得点の求め方がわかりません。 例をあげて説明させていただくと、 x1 x2 x3 8 9 4 2 5 7 8  5  6 3  5  4 7  4  9 4  3  4 3  6  8 6  8  2 5  4  5 6  7  6 このようなデータを分析するとして、各変数の相関係数(X1X2 X2X3 X1X3)の値はわかりますし、計算方法もわかります。 またここから固有値もわかります。 しかしここからどうやって、主成分得点を求めればよいかわかりません。 どのように計算するのですか?よろしければご回答下さい。

質問者が選んだベストアンサー

  • ベストアンサー
回答No.1

主成分得点には、分散共分散行列主成分分析と相関行列主成分分析の2種類がありますが、相関行列主成分分析の主成分得点でよろしいでしょうか? まず、固有ベクトルを求めます。 仮に、以下のようになったとします。(A,B,C・・・は主成分の数値) ・・主成分1 主成分2 X1 A     D X2 B     E X3 C     F これより、相関行列主成分分析の関係式は、 Z1=A・X1+B・X2+C・X3 Z2=D・X1+E・X2+F・X3 この式に、X1,X2、X3の値を入れて計算します。 このZ1、Z2が主成分得点です。 ちなみに、分散共分散行列主成分分析の場合は、ここまで同じで、 Z1,Z2の平均を求めて、Z1およびZ2からその平均を引いたものになります。

lain_003
質問者

お礼

お返事ありがとうございます。 2種類の求め方があったのですね。おかげさまで色々と納得がつきました。 ありがとうございました。

関連するQ&A

  • 相関行列の主成分の求め方について

    今回レポートで再提出しなくちゃならない課題の中に 相関係数行列がありまして、 それが    1 0.4 0.3 R= 0.4 1 0      0.3 0 1   というもので、これから固有値と主成分寄与率を求めていかなければならないんです。 で、 固有値を求めるために最初のλはRa=λaでそれぞれ、 λ1=1.5 λ2=1 λ3=0.5と求める事が出来たのですが、この後の固有値を求めるための計算で詰まってしまいました。 式としてはλ3の時から求めだして    1 0.4 0.3   |X1|      |X1| R= 0.4 1 0  ×|X2| =0.5×|X2|    0.3 0 1    |X3|      |X3| より、 X1+0.4X2+0.3X3=0.5X1…(1) 0.4X1+X2   =0.5X2…(2) 0.3X1+X3   =0.5X3…(3) というところから変換していこうとしたのですが、どうにも答えとは違う固有値が出てしまい、 主成分を求めるところまで行き着けません。さらに、回答にルートが入ってきていて、どうやったらルートが出てくるのかとも悩んでいます。 どうか、固有値と主成分の求め方を教えてください。

  • 主成分分析

    今主成分分析を勉強しているのですが、 よく、書籍で出てくる、データセットというのは何を指しているのでしょうか? また、係数データを係数行列A(下にp×X)で示す。だとか、線形結合式で求めた値Z(下にn×k)=X(下にn×p)A(下にp×k)を主成分得点と呼ぶ などの説明がまったくもって理解不能です。 どなたか助けてくれませんでしょうか;;;;

  • 主成分分析と、共分散行列について

    現在、取得したデータから主成分分析を行うプログラムを実装しています。 扱うデータは、 [変数] x1 x2 x3 ・・・ xn [No. 1] 1 2 5 ・・・ 11 [No. 2] 3 5 10 ・・・ 8   ・   ・ [No. N] 4 6 35 ・・・ 9 のように次元となる変数x1~xnに対してそれぞれ値を取得し、x1~xnを一まとまりとした データ件数がNo.1~No. Nまでデータを取得するとします。 これらのデータを用いて共分散行列を生成し、固有値問題を解くことで主成分分析を行う のですが、ここで質問です。統計的に考えて、より精密に主成分分析を行うには、変数の 個数(n)に対して、データの個数(N)はどのくらい取るのが良いのでしょうか。因みに変数の数は 200程必要とします。

  • 3変数による主成分分析で求めた固有ベクトルについて

    3変数(x1,x2,x3)で主成分分析を行い、最大の固有値を用いて固有ベクトルを求めて第一主成分(z=l1x1+l2x2+l3x3)の直線を作成しようと考えています。固有ベクトルの算出のところで、l1が虚数解となってしまい、よく分からなくなってしまいました。(x1,x2,x3)空間上にzの直線を描きたいのですが、虚数を含むとどうなるのかイメージが湧きません。あるいはl1,l2,l3は実数のみで扱うのでしょうか?

  • 主成分分析について

    主成分分析を行い、主成分ベクトルを求めるためには行列(共分散行列)の固有値問題を 解き、固有値・固有ベクトルを求めればよいですよね。そこで固有値行列(対角成分に固有値 λが並ぶ行列)の固有値の値から累積寄与率を求め適当な次元まで減らすということは わかっています。そこで質問です。 例えば、元々100次元あるとします。固有値問題を解けば、100個の固有値が求まりますよね。 その固有値ひとつひとつに100個の成分を持つ固有ベクトルが存在しますよね。 これを50次元に減らすとします。元々100個固有値を持つ行列から、50個分を用いることになり ますよね。ここで、次元が50になったので固有値と対応する固有ベクトルの成分の数も100から 50に減るのですか?減るとしたら、固有ベクトルの成分からどのように50個取り除けばよいかが わかりません。どうか教えていただきたいと思います。

  • 主成分分析でのばらつき

    主成分分析において、因子のばらつきが多いところを見つけるには出力結果の何を見ればよいのでしょうか? 例えば、月を変数として、ある商品の価格を全国の都道府県ごとに主成分分析すると、 結果として、固有値、寄与率、固有ベクトル(各月に対して)がでますよね?ここで、全国の都道府県間の価格のばらつきが多い月は何月か見るためには、主成分分析の結果のどこに着目して解釈すればよいのでしょうか? よろしくお願いします。

  • 主成分分析

    こんにちは、統計学初心者の大学生です。 統計学の授業で「体力テスト(テスト項目8つ、15人)の総合成績順位をつけなさい」という課題が出され、行き詰っています・・・。 主成分分析をして、因子負荷量やら主成分得点やらは計算済みです。 第4主成分まで(累積寄与率79%)で分析する、という所まで進んだは良いのですが、そこから何をどうすればよいのか分かりません。 テストの総合成績順位をつけるには、総合力を示している主成分を見つければ良いのでしょうか?(でもそれなら第4主成分までを選択する必要はないですよね) どなたかアドバイスよろしくお願いします!

  • 主成分分析の固有値について

    主成分分析を行うとき、行列の固有値問題を解きますよね。 そこで、対角成分に固有値が降順に並ぶ行列において、 累積寄与率がある値になるまで固有値を上から順番に 足し合わせていくのはわかりました。そこで、質問です。 固有値を降順に並べるとは、負の固有値で大きな値も 含まれるように「固有値の絶対値」で降順なのですか? それとも、正の固有値のみで考えて降順なのですか? 初歩的な質問ですみませんが、どうか教えて頂きたいと 思います。

  • 主成分分析及びクラスタ分析について

    統計について今勉強している者です。 SPSSを用いて分析を実際に行っています。 主成分分析とクラスタ分析というよりSPSSの使用方法になってしまうのですが、 主成分分析を行って、得られた因子得点(回帰法)がデータに保存されます。 今回自分の場合は4つの主成分になりましたので fac1_1~fac1_4が得られています。 この得られた1~4をクラスタ分析にかけるというのは どのような結果を意味するのでしょうか? 実際にクラスタ分析を行うと鎖効果もなく 非常によい結果が得られたのですが これが本当にクラスタ分析となっているのかが分からなくて。 お分かりの方が見えましたら、ご解答いただけるとありがたいです。 お願いいたします。

  • 主成分分析の第2主成分について

    主成分分析初心者です。基本的なところから独学で勉強しています。 2種類の変数についてグラフ上で散布図を作成したとき、各点から最も近い距離にある直線を第一主成分軸としたとき、この第一主成分が最も寄与率が高くなることは分かりました。しかしなぜ第一主成分軸と直角で交わる直線が第二主成分軸となるのでしょうか?かならず直角で交わる直線が第二主成分軸となり、寄与率が二番目となるのですか? 初心者ですので分かりにくいかと思いますが宜しくお願いします。