• ベストアンサー

主成分得点から変数の予測

ある変数の共分散行列を用いて主成分分析を行いました。 各サンプルの主成分得点が得られました。 どのサンプルにも該当しない架空の主成分得点から基の変数を予測することはできますか。 例えば、第一主成分が0.1を示し他の主成分は全て0のときの基の変数値を予測するなどです。 可能か否かの概念的な説明に加えて、もしできるのならばR、SPSS、NTSYSなどの統計ソフトを用いた実践的方法も教えていただけるとありがたいです。 よろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
回答No.1

主成分分析は,推定(最小2乗推定など)を行っていません. 座標視点を変えて(最大分散方向を第1軸として,次にその軸に直交するように分散の大きな方向を第2軸として・・・)見ているだけです. よって,元データと主成分得点は1対1で対応しています. 逆の計算も可能です. 以上が概念的な説明です. 列挙してある統計ソフトを使ったことがないので, いい加減な回答をすべきではありませんが, 新しいサンプルが主成分軸のどこに布置されるかには興味があっても, 逆のことには興味がないので,逆算機能は通常は無いのではないでしょうか? (興味:統計的興味・・・だれかの興味ではなく,解析者一般の・・・)

pk67_2008
質問者

お礼

ありがとうございます。

関連するQ&A

  • 主成分分析と、共分散行列について

    現在、取得したデータから主成分分析を行うプログラムを実装しています。 扱うデータは、 [変数] x1 x2 x3 ・・・ xn [No. 1] 1 2 5 ・・・ 11 [No. 2] 3 5 10 ・・・ 8   ・   ・ [No. N] 4 6 35 ・・・ 9 のように次元となる変数x1~xnに対してそれぞれ値を取得し、x1~xnを一まとまりとした データ件数がNo.1~No. Nまでデータを取得するとします。 これらのデータを用いて共分散行列を生成し、固有値問題を解くことで主成分分析を行う のですが、ここで質問です。統計的に考えて、より精密に主成分分析を行うには、変数の 個数(n)に対して、データの個数(N)はどのくらい取るのが良いのでしょうか。因みに変数の数は 200程必要とします。

  • 主成分分析の変数の減らし方

    主成分分析の変数の減らし方についてです。 現在サンプル数200程度、変数30個→5個程度に絞ろうと思っています。 累計寄与率を出すところまではサイトも充実しており理解できたのですが、そこからの変数の減らし方が載っているサイトがほとんどなく分かりません。 数式だけですと理解が難しい面もあるので、できれば具体例を挙げてイメージしやすいもので教えていただけると有難く思います。 サンプル数、変数共にそんなに高いものでなくて結構です。 よろしくお願いいたします。

  • 主成分分析及びクラスタ分析について

    統計について今勉強している者です。 SPSSを用いて分析を実際に行っています。 主成分分析とクラスタ分析というよりSPSSの使用方法になってしまうのですが、 主成分分析を行って、得られた因子得点(回帰法)がデータに保存されます。 今回自分の場合は4つの主成分になりましたので fac1_1~fac1_4が得られています。 この得られた1~4をクラスタ分析にかけるというのは どのような結果を意味するのでしょうか? 実際にクラスタ分析を行うと鎖効果もなく 非常によい結果が得られたのですが これが本当にクラスタ分析となっているのかが分からなくて。 お分かりの方が見えましたら、ご解答いただけるとありがたいです。 お願いいたします。

  • 主成分分析に関する質問です。

    主成分分析に関する質問です。 平均が[0, 0],分散がσ^2*I2(I2は2*2のidentity matrix)のガウス分布に対おする共分散行列を考えます。 この共分散行列の主成分と固有値 第1主成分への投影によって再構成された値 投影によるエラーの値(真値と再構成された値の2乗誤差) を求めたいと思っていますが、とき方がわからず困っています。

  • 線形回帰分析:多重共線性と主成分回帰について

     最小二乗法による線形回帰モデルのあてはめについて,説明変数間に多重共線性がある場合,回帰係数の信頼性や予測精度が低下すると習いました.これを防止する方法として,元の説明変数行列の主成分を説明変数としてあてはめを行う主成分回帰(PCR)等があるようです.  しかし,説明変数行列の線形変換は,回帰モデルのあてはめ値(fitted values),残差,新たなデータに関する予測値に影響を与えません.主成分も線形変換の1つなので,元の説明変数と同数の主成分を説明変数に用いる場合,全く同じあてはめ値,残差,予測値が得られます. それでは,主成分回帰は何故,多重共線性による回帰係数の信頼性,予測精度の低下を防止する手段と言えるのでしょうか? (主成分回帰の狙いは,元の説明変数より少数の重要な主成分のみを説明変数に用いることにもあるようですが,これは,多重共線性の問題の防止とは関係ないと思います.) 勘違いしている点もあるかもしれないので,コメントを頂ければ嬉しいです。

  • 主成分分析

    こんにちは、統計学初心者の大学生です。 統計学の授業で「体力テスト(テスト項目8つ、15人)の総合成績順位をつけなさい」という課題が出され、行き詰っています・・・。 主成分分析をして、因子負荷量やら主成分得点やらは計算済みです。 第4主成分まで(累積寄与率79%)で分析する、という所まで進んだは良いのですが、そこから何をどうすればよいのか分かりません。 テストの総合成績順位をつけるには、総合力を示している主成分を見つければ良いのでしょうか?(でもそれなら第4主成分までを選択する必要はないですよね) どなたかアドバイスよろしくお願いします!

  • 主成分分析について

    主成分分析を行い、主成分ベクトルを求めるためには行列(共分散行列)の固有値問題を 解き、固有値・固有ベクトルを求めればよいですよね。そこで固有値行列(対角成分に固有値 λが並ぶ行列)の固有値の値から累積寄与率を求め適当な次元まで減らすということは わかっています。そこで質問です。 例えば、元々100次元あるとします。固有値問題を解けば、100個の固有値が求まりますよね。 その固有値ひとつひとつに100個の成分を持つ固有ベクトルが存在しますよね。 これを50次元に減らすとします。元々100個固有値を持つ行列から、50個分を用いることになり ますよね。ここで、次元が50になったので固有値と対応する固有ベクトルの成分の数も100から 50に減るのですか?減るとしたら、固有ベクトルの成分からどのように50個取り除けばよいかが わかりません。どうか教えていただきたいと思います。

  • 主成分分析について

    主成分分析について 現在、主成分分析の計算方法を勉強をしているのですが、主成分得点の求め方がわかりません。 例をあげて説明させていただくと、 x1 x2 x3 8 9 4 2 5 7 8  5  6 3  5  4 7  4  9 4  3  4 3  6  8 6  8  2 5  4  5 6  7  6 このようなデータを分析するとして、各変数の相関係数(X1X2 X2X3 X1X3)の値はわかりますし、計算方法もわかります。 またここから固有値もわかります。 しかしここからどうやって、主成分得点を求めればよいかわかりません。 どのように計算するのですか?よろしければご回答下さい。

  • 主成分分析における出発行列の違いは?

    タイトルの通りなのです。 あるデータについて主成分分析を行いたいのですが 出発行列によって得られる結果が異なると教わりました。 相関係数行列と分散共分散行列はどのように使い分けるのでしょうか。 どなたか教えてください。お願いします!

  • SPSSで主成分分析

    お世話になります。 SPSSを使用して主成分分析を行いたく、メニューの統計→データの分解→因子分析と説明されたのですが、データの分解という項目がありません。どうしてでしょうか? バージョンは8.0.1Jです。