• 締切済み

主成分分析で「総合力」を求めてみた。(因子負荷量の符号を勝手に反転しても良かですかw)

初質問です。 会社で作業員の能力をランキングすることになり、ネットで調べたら主成分分析を使って野球選手の「総合力」を求めている例などをよく見かけます。 主成分分析で必ずしも総合力が求まるわけではないという事も分かりました。 第1主成分のすべての”因子負荷量”が正のときなら「総合力」を表していると解釈しやすいのですが…。 例えば 英語と国語の2変量で正の相関のときなら→第1主成分でランキング。 英語と数学の2変量で負の相関のときなら→第2主成分でランキング。 では、英国数の3変量だとランキングは出来ないの?   第1主成分 英   0.62 国   0.55 数  -0.55 3Dグラフを作成し眺めてたら、数学の因子負荷量の符号を反転させれば欲しい軸になるのにな~と思い、同僚に感想を求めると 「それは主成分分析じゃなくなるのでは?」 と言われました。 そこで皆さんにこの方法が数学的に(?)間違っているのか教えていただきたいと思い筆を…(ry

みんなの回答

  • backs
  • ベストアンサー率50% (410/818)
回答No.2

符号を逆転させて、軸(主成分)の解釈をするのは分析者の自由です。 主成分分析において軸を回転させることも可能です(分析者の考えがあって、特別な場合以外はまずしませんが)。 > 英・数の2変量で負相関 → 第2主成分が"総合力"を表す > 第1主成分軸があり、負相関だったので第1主成分軸と直交方向が総合力のはず… なぜそのような解釈ができるのか、私には分かりませんが。。。 > ・・・のように英語に対して軸を反転(?)させるようにした!? よく意味が分かりません。 そもそも最初の結果について、符合を逆転させる必要も因子軸を回転させる必要もないでしょう。    Z1 = 0.62*Eng + 0.55*Jap - 0.55*Math という結果から、合成変量(主成分)は言語能力を表している変量だと解釈できるからです。符号を逆転させれば、    Z1' = - 0.62*Eng - 0.55*Jap + 0.55*Math となり、これは逆に数処理能力とでも解釈できるでしょう。質問者さんのいうように、仮に全ての符号がプラスあるいはマイナスならば総合力と解釈することもできなくはありませんが、少なくとも今回のデータセットからはそのような解釈はできないということでしょう。

  • backs
  • ベストアンサー率50% (410/818)
回答No.1

一応、主成分分析においては「因子負荷量」とはいわず「主成分負荷量」といいますね。主成分分析と因子分析は全く別のモデルなので、、、 それで、符号のことについてですが符号を逆転させても問題ありません。だから{-0.62, -0.55, 0.55}と解釈しても良いのです。使用するソフトウェア(つまり採用しているアルゴリズムが異なるということですが)によって符号が変わってくるものです。 ただし、(念のため言っておきますが)当たり前ですが任意の変数についてのみ符号を変えて解釈するのは間違いですよ。例えば、{-0.62, 0.55, -0.55}などと解釈するのは間違いということです。

QtaroKujo
質問者

お礼

お答えをいただけると嬉しいです。 ありがとう御座います。 ただ、私が思っているのは、   英・数の2変量で負相関 → 第2主成分が"総合力"を表す というのは、たまたま(?)2変量しかなかったから必然的に第1主成分軸と直交方向に 採られる第2主成分の方向が"総合力"と捉えられたものと考えています。 まず第1主成分軸があり、負相関だったので第1主成分軸と直交方向が総合力のはず…  …あっ第2主成分軸でイイじゃん!  って発想なのかなと。   第1主成分 第2主成分 英   0.707   0.707 数  -0.707   0.707 この第2主成分を採用したのではなく、   ABS(第1主成分)  英   0.707 数   0.707 のように英語に対して軸を反転(?)させるようにした!?(結果的には同じ数値。) つまり、"総合力"などというものを考えるならば、データの分布を最もよく表す第1主成分 から発想すべきなんじゃないかと思ったわけで…。 主成分分析にも"回転"があるとのことで、回転については知らないのですが、 上記のような事は"回転"とは違う概念なんですよね!?

関連するQ&A

  • 主成分分析も因子分析のように繰り返せるの?

     研修課題で、商品イメージと商品魅力の関係を調べています。SD法で商品イメージを測り、主成分分析を行いました。  そこで、学生時代に因子分析では因子負荷量の絶対値が0.4未満の項目は削除して因子分析を繰り返すようになど習いました。【質問(1)】「主成分分析」でも同じように項目削除→繰り返しを行うものなのでしょうか? また、二重負荷項目の扱いはどうしたらよいのでしょう? 【質問(2)】項目削除して因子分析を繰り返す理由って何ですか? 因子の妥当性だか信頼性だかが上がるから、と習った記憶がありますが、“日常会話”で表現するとどういうことですか? 【質問(3)】この調査の目的は、魅力ある商品開発のために人気商品のイメージを探ることです。この動機だと、そもそも主成分分析と因子分析のどちらが適していたのでしょう・・・?  この後、各主成分得点を説明変数、商品評価(良い―悪い)を目的変数にして重回帰分析を行います。  ちなみに、Excelで解析しています。  ドシロートなのにビジネス文書の中で統計プロセスを説明して行かなければならず、四苦八苦しています。親切な回答をどうかよろしくお願い申し上げます。

  • 主成分分析

    こんにちは、統計学初心者の大学生です。 統計学の授業で「体力テスト(テスト項目8つ、15人)の総合成績順位をつけなさい」という課題が出され、行き詰っています・・・。 主成分分析をして、因子負荷量やら主成分得点やらは計算済みです。 第4主成分まで(累積寄与率79%)で分析する、という所まで進んだは良いのですが、そこから何をどうすればよいのか分かりません。 テストの総合成績順位をつけるには、総合力を示している主成分を見つければ良いのでしょうか?(でもそれなら第4主成分までを選択する必要はないですよね) どなたかアドバイスよろしくお願いします!

  • 多変量解析の主成分分析と因子分析の違いについて教えてください.

    多変量解析の主成分分析と因子分析の違いについて教えてください.どちらもほとんど同じ気がするのですがどのようにちがうのでしょうか?よろしくお願いいたします.

  • コレスポンデンス分析と因子分析、主成分分析でのポジショニング

    マーケティングを勉強しているものです。 現在、企業をブランドイメージでポジショニングをしたいのですが、因子分析、主成分分析、コレスポンデンス分析ではどれがもっとも適しているのでしょうか? SPSSの本や、マーケティングの多変量分析の本の事例では、ポジショニングでは主成分分析、コレスポンデンス分析がよく載っていますが、僕は因子分析がもっとも適しているのではないかと思っているのですが・・・。 ポジショニングをする際に、因子分析、主成分分析、コレスポンデンス分析をそれぞれ適用する長所・短所を添えていただきたいです。 お忙しいとは思いますが、どなたか詳しい方お願いします。

  • 因子分析の因子負荷量に関して

    本に載っている因子分析の例題をSPSSで解いたところ、ある因子の因子負荷量の符号がテキストの回答例と全く逆になりました。 いくつかの教科書の例題を試したところ、同様に符号が逆転することがありました。 符号が逆であれば、その軸の解釈をまったく逆にしてしまえば済むので特に問題ではないのではと勝手に思っていますが、何だかひっかかってモヤモヤします。 数学的には、どういったことが原因で因子負荷量の符号が逆転するのですか? 気が向いた方、数学がダメダメな私にご教授ください。 よろしくお願いします。

  • 統計学 主成分分析と因子分析

    主成分分析と因子分析の違いを教えてください。

  • 統計の主成分分析と因子分析って

    主成分分析と因子分析の違いというのは、簡単に言うとどのような点なのでしょうか?? また、それぞれを簡単に言うとどのようなものなのでしょうか?? どうも上手くまとまりません。宜しくお願いします。

  • 相関行列による主成分分析

    変量がp個の場合の主成分分析で、相関行列(の二乗和)に着目した時の話です。 この時の、第二主成分を求める手順、式変形、式変形が成り立つ理由がいまいち理解できません。 主成分分析、あるいは多変量解析の教科書は複数冊に目を通しているのですが、理解力が足りないようで…。 うまく説明できる方、宜しくお願いします。

  • 因子分析で(有効な?)因子負荷量が重なる時

    いつもお世話になっております。 因子分析をしている際に、因子負荷量で因子グループを分けていく作業中、「.400」を目安に区切っていくと理解しておりますが、添付の画像のように両方とも「.400」を上回っている場合は、どのように解釈すればよろしいのでしょうか? そもそも因子負荷量が「.400」以上に両方なるのがおかしいなど、アドバイスを頂けたら幸いです。 たびたび見かけることが有るので、解釈をどうすればよいか困っております。 今後ともよろしくお願いいたします。

  • 主成分分析の使い方について

    主成分分析などの統計的手法を勉強中の学生(環境学分野)です。 ある論文で、下記の内容を目にしました。 私には、どうして、このデータによって、この目的が達せられるのかがどうしても理解できません。 どうかご教授のほどお願いいたします。 目的 農地が持つ29種類の機能を集約化すること。 方法 1.602人に対してアンケートを行い、29機能を「高くもつ」から「まったくもたない」の5段階評価尺度で評価してもらう。 2.アンケートの結果を中間順位法により順位統計量に変換する。 3.主成分分析を行う。 4.VARIMAX回転を行う。 5.第10因子までの因子負荷量の算出を行う。 6.因子負荷量によるクラスター分析を行う。 結果 29種類の機能は8種類に集約された。 人がその機能を「高くもつ」、「まったくもたない」と感じる“感じ方の傾向”と、“機能の性質”は別のことなので、機能の集約化にこのようなアンケート調査の結果を用いることはできないのではないかと、私には思えました。 けれど、結果として示されたクラスター分析のデンドログラムを確認してみると、植物保護機能、動物保護機能、土壌微生物保護機能などが「生物・生態系保全」のクラスターに含まれ、情操教育と精神安定化などが「保健休養」のクラスターに含まれるなど、機能の性質に関する一般的な感覚を反映したものになっていました。 主成分分析を駆使すれば、そういったことも可能なのでしょうか。 ご助言よろしくお願いします。