• 締切済み

主成分分析及びクラスタ分析について

統計について今勉強している者です。 SPSSを用いて分析を実際に行っています。 主成分分析とクラスタ分析というよりSPSSの使用方法になってしまうのですが、 主成分分析を行って、得られた因子得点(回帰法)がデータに保存されます。 今回自分の場合は4つの主成分になりましたので fac1_1~fac1_4が得られています。 この得られた1~4をクラスタ分析にかけるというのは どのような結果を意味するのでしょうか? 実際にクラスタ分析を行うと鎖効果もなく 非常によい結果が得られたのですが これが本当にクラスタ分析となっているのかが分からなくて。 お分かりの方が見えましたら、ご解答いただけるとありがたいです。 お願いいたします。

みんなの回答

  • Yokoken
  • ベストアンサー率32% (27/84)
回答No.1

shuさん初めまして。 統計の専門家の方がおそらく回答してくださるかもしれませんが、 とりあえず、思ったことを。 あなたがされているのは、 データマイニングの分野等では割と標準的に使用されている手法ですよね。 通常のオリジナル空間では上手くクラスタに分離できない物を、 主成分に変換してやることによって、 クラスタに分離が出来ている、 超平面を構成することが出来ていると考えるといいのではないでしょうか? その手法がクラスタ分析か否かと言われると、 意味の取り方によると思います。 元々のデータにおいてはクラスターにきれいに分離させることが出来なかったけど、 主成分空間においては分離できたので、 そのクラスター内の要素は同一のもだと考えるかどうかということだと思います。 主成分に対する意味づけの問題にもなってくるとは思います。 あくまで主成分に写像した段階で、 データの持つ意味が少し変わってくると思いますので。 縮約したもの、ノイズを除去したものだと考えるなら、クラスター解析といえるでしょうし、 全く別の切り口(主成分に意味づけを行って)からクラスターに分離したと言えば、 オリジナルのデータをクラスター解析したとは言いにくいのではないでしょうか? 僕もまだまだ勉強中なので、 自信がなくて申し訳ありませんが、 良かったら参考にしてください。

関連するQ&A