- 締切済み
主成分分析及びクラスタ分析について
統計について今勉強している者です。 SPSSを用いて分析を実際に行っています。 主成分分析とクラスタ分析というよりSPSSの使用方法になってしまうのですが、 主成分分析を行って、得られた因子得点(回帰法)がデータに保存されます。 今回自分の場合は4つの主成分になりましたので fac1_1~fac1_4が得られています。 この得られた1~4をクラスタ分析にかけるというのは どのような結果を意味するのでしょうか? 実際にクラスタ分析を行うと鎖効果もなく 非常によい結果が得られたのですが これが本当にクラスタ分析となっているのかが分からなくて。 お分かりの方が見えましたら、ご解答いただけるとありがたいです。 お願いいたします。
- shu2112
- お礼率0% (0/1)
- その他(学問・教育)
- 回答数1
- ありがとう数0
- みんなの回答 (1)
- 専門家の回答
みんなの回答
- Yokoken
- ベストアンサー率32% (27/84)
shuさん初めまして。 統計の専門家の方がおそらく回答してくださるかもしれませんが、 とりあえず、思ったことを。 あなたがされているのは、 データマイニングの分野等では割と標準的に使用されている手法ですよね。 通常のオリジナル空間では上手くクラスタに分離できない物を、 主成分に変換してやることによって、 クラスタに分離が出来ている、 超平面を構成することが出来ていると考えるといいのではないでしょうか? その手法がクラスタ分析か否かと言われると、 意味の取り方によると思います。 元々のデータにおいてはクラスターにきれいに分離させることが出来なかったけど、 主成分空間においては分離できたので、 そのクラスター内の要素は同一のもだと考えるかどうかということだと思います。 主成分に対する意味づけの問題にもなってくるとは思います。 あくまで主成分に写像した段階で、 データの持つ意味が少し変わってくると思いますので。 縮約したもの、ノイズを除去したものだと考えるなら、クラスター解析といえるでしょうし、 全く別の切り口(主成分に意味づけを行って)からクラスターに分離したと言えば、 オリジナルのデータをクラスター解析したとは言いにくいのではないでしょうか? 僕もまだまだ勉強中なので、 自信がなくて申し訳ありませんが、 良かったら参考にしてください。
関連するQ&A
- 主成分分析の使い方について
主成分分析などの統計的手法を勉強中の学生(環境学分野)です。 ある論文で、下記の内容を目にしました。 私には、どうして、このデータによって、この目的が達せられるのかがどうしても理解できません。 どうかご教授のほどお願いいたします。 目的 農地が持つ29種類の機能を集約化すること。 方法 1.602人に対してアンケートを行い、29機能を「高くもつ」から「まったくもたない」の5段階評価尺度で評価してもらう。 2.アンケートの結果を中間順位法により順位統計量に変換する。 3.主成分分析を行う。 4.VARIMAX回転を行う。 5.第10因子までの因子負荷量の算出を行う。 6.因子負荷量によるクラスター分析を行う。 結果 29種類の機能は8種類に集約された。 人がその機能を「高くもつ」、「まったくもたない」と感じる“感じ方の傾向”と、“機能の性質”は別のことなので、機能の集約化にこのようなアンケート調査の結果を用いることはできないのではないかと、私には思えました。 けれど、結果として示されたクラスター分析のデンドログラムを確認してみると、植物保護機能、動物保護機能、土壌微生物保護機能などが「生物・生態系保全」のクラスターに含まれ、情操教育と精神安定化などが「保健休養」のクラスターに含まれるなど、機能の性質に関する一般的な感覚を反映したものになっていました。 主成分分析を駆使すれば、そういったことも可能なのでしょうか。 ご助言よろしくお願いします。
- ベストアンサー
- 数学・算数
- SPSSで主成分分析
お世話になります。 SPSSを使用して主成分分析を行いたく、メニューの統計→データの分解→因子分析と説明されたのですが、データの分解という項目がありません。どうしてでしょうか? バージョンは8.0.1Jです。
- ベストアンサー
- その他(ソフトウェア)
- 主成分分析も因子分析のように繰り返せるの?
研修課題で、商品イメージと商品魅力の関係を調べています。SD法で商品イメージを測り、主成分分析を行いました。 そこで、学生時代に因子分析では因子負荷量の絶対値が0.4未満の項目は削除して因子分析を繰り返すようになど習いました。【質問(1)】「主成分分析」でも同じように項目削除→繰り返しを行うものなのでしょうか? また、二重負荷項目の扱いはどうしたらよいのでしょう? 【質問(2)】項目削除して因子分析を繰り返す理由って何ですか? 因子の妥当性だか信頼性だかが上がるから、と習った記憶がありますが、“日常会話”で表現するとどういうことですか? 【質問(3)】この調査の目的は、魅力ある商品開発のために人気商品のイメージを探ることです。この動機だと、そもそも主成分分析と因子分析のどちらが適していたのでしょう・・・? この後、各主成分得点を説明変数、商品評価(良い―悪い)を目的変数にして重回帰分析を行います。 ちなみに、Excelで解析しています。 ドシロートなのにビジネス文書の中で統計プロセスを説明して行かなければならず、四苦八苦しています。親切な回答をどうかよろしくお願い申し上げます。
- 締切済み
- 数学・算数
- クラスタ分析 結果の安定性について
統計解析の初心者です。 2つの疑問と対処法に困っています。お分かりになる方ぜひ教えて いただければ幸いです。 <使用ソフトと分析方法> ・ソフト:SPSSの ・分析方法:大規模ファイルのクラスタ(非階層クラスタ/K-means法) ・変数:事前に行った因子分析結果の7因子の因子得点 <1> クラスタ数を5に指定し、その他をデフォルトの設定で行ったところ、 「反復の記録」のところで、「反復が最大回数実行されたため、反復を 終了しました」というメッセージが出ていました。 (反復回数「10」、収束基準「0」) この結果を最終結果として用いてはいけないものなのでしょうか? 実は既に一度この結果を提出してしまっているのですが…、 後から気づいて、試しに反復回数を変えて何度かやってみたところ、 あまりに結果(クラスタ別の因子得点平均点)が違うことに驚いて います。 既に結果を提示してしまっているため、できれば、最初に行った結果 でも誤りではない、という根拠が得られればと思っています。 <2> 上記のクラスタ分析の結果について、「安定性を検証して欲しい」 という要望を受けました。 クラスタ分析の「安定性」に該当する数値を出す方法とは、どのような 方法があるのでしょうか? 例えば、因子分析の場合の累積寄与率のように「○○%」という形で わかりやすくバシッと数値で出せるものなのでしょうか? SPSSで出せる方法を知りたいと思っています。 基本的な質問で恐縮ですが、よろしくお願いいたします。
- 締切済み
- マーケティング・企画
- コレスポンデンス分析と因子分析、主成分分析でのポジショニング
マーケティングを勉強しているものです。 現在、企業をブランドイメージでポジショニングをしたいのですが、因子分析、主成分分析、コレスポンデンス分析ではどれがもっとも適しているのでしょうか? SPSSの本や、マーケティングの多変量分析の本の事例では、ポジショニングでは主成分分析、コレスポンデンス分析がよく載っていますが、僕は因子分析がもっとも適しているのではないかと思っているのですが・・・。 ポジショニングをする際に、因子分析、主成分分析、コレスポンデンス分析をそれぞれ適用する長所・短所を添えていただきたいです。 お忙しいとは思いますが、どなたか詳しい方お願いします。
- 締切済み
- マーケティング・企画
- 数式がわからなくてもSPSSで分析できますか?
論文作成のために、調査でーたを分析します。SPSSを使おうと思っています。因子分析、主成分分析、クラスター分析をするつもりです。 文系で数学めちゃ苦手です。数式がいまいち理解できなくても、以上のような分析をSPSSでだすことができますか。先輩方教えてください。
- 締切済み
- 数学・算数
- 主成分分析の途中。固有値の求め方で質問が。。
今、マンガでわかる統計学 因子分析編を読んでおり、 その中の主成分分析をやってます。 主成分分析を行っていく途中で、固有値を求めていたのですが、 計算途中で、 λ3乗 - 3λ2乗 + 2.7443λ - 0.78534 = 0 というところまで出ました。 これを、どうやってλについて求めればいいのでしょうか? 本では、数学的な詳しいところは省いてあり、 主成分分析の全体の流れの中で、ラグランジュの未定乗数法を使うとだけ書いてありました。 ここで、それを使うのでしょうか? 本には結果だけ書いてあり、 結果は、 固有値λは、 1.6 0.8 0.6 となるようです。 すみませんが、ここの求め方(どんな公式を使うかでもいいです) 丁寧に教えていただけませんでしょうか? よろしくお願いします。 一応、固有値を求めたい元の行列を書いておきます 1 0.19 0.36 0.19 1 0.30 0.36 0.30 1
- ベストアンサー
- 数学・算数