• ベストアンサー

因子分析においてのKMOの重要性

因子分析について勉強をしているのですが、 このKMOが壁になっています。 文献によって記載されているものもあれば、全く触れられていないものもあり どれだけの必要性・重要性があるのかわからず困っています。 参考書などを例にして因子分析をしているのですが その中にもKMOが0.5未満のものがあり そのような(あまり相応しくないと思われる)データを 普通に例題にあげるくらいならば、それほど重要ではないのでしょうか? 以上のことについて早急に調べなくてはならないので 皆様のお力をお借りしたいのです。 よろしくお願いします。

  • macco
  • お礼率33% (2/6)

質問者が選んだベストアンサー

  • ベストアンサー
  • peru-peru
  • ベストアンサー率48% (26/54)
回答No.2

“Kaiser - Meyer - Olkin のサンプリング適切性基準”について  観察された相関係数と偏相関係数の比のことを、サンプリング適切性基準(と訳す場合もあるそうです)と言うそうです。因子分析を用いることの適切性(妥当性)をあらわす指標の一つです。  ご存知と思いますが、一応念のため。相関係数とは、測定された2つの変数の直線的な関連性の程度を数値によってあらわしたものです。代表的なものにピアソンの積率相関係数なんかがあります。しかし、2変数間の相関を求める場合、他の変数の影響力によって、その相関係数が本来の値と異なってしまう場合があります(擬似相関)。そこで、偏相関とは、他の変数の影響力を除いて、もしくは一定にした上で、2変数間の相関を求めようとするものであり、偏相関の程度を数値であらわしたものが偏相関係数です。詳しくは専門書をご覧になってください。  KMOの話に戻ります。以下に計算式を載せておきます。    KMO=(相関係数の二乗和)/(相関係数の二乗和-偏相関係数の二乗和)  式からなんとなく想像できると思いますが、全ての変数間の偏相関係数の二乗和が相関係数の二乗和に比べて小さければ小さいほどKMOの値は1に近くなります。要するに、偏相関係数を用いることによって相関係数から取り除いた他の変数の影響力が大きければ大きいほど、KMOの値は1に近くなるということです。  反対に、偏相関係数の二乗和が相関係数の二乗和に近づけば近づくほどKMOの値は0に近くなります。要するに、偏相関係数を用いることによって相関係数から取り除いた他の変数の影響力が小さければ小さいほど、KMOの値は0に近くなるということです。  KMOの値が小さいということは、2変数間の相関関係を他の変数によって説明することができにくいということを意味します。そのため、各変数に共通して影響を与える要因を探ろうとする因子分析を適用することは不適切だということを示します。  ちなみに、Kaiserは以下のような判定基準を提案しているそうです。    サンプリング適切性基準 KMO 判定    0.9 以上 marvelous 素晴らしい    0.8 以上 meritorious 価値がある    0.7 以上 middling まずまず    0.6 以上 mediocre 並み    0.5 以上 miserable 惨め    0.5 未満 unacceptable ふさわしくない  これからは経験的に。maccoさんがおっしゃる通り、文献でもKMOを記載しているものはあまり見かけないように思います。おそらく心理学では、因子負荷量の絶対値が0.4以上という経験的な判断基準と、信頼性係数(クロンバックのアルファ係数など)によって採用する項目を決定している習慣があるのだと思います。良いか悪いかは別にして。  参考になると思いますので。群馬大学の青木先生・香川大学の堀先生などが統計関係のホームページを開いていらっしゃいます。参考URLに青木先生のページのアドレスを載せておきますので、リンクをたどってみて下さい。

参考URL:
http://aoki2.si.gunma-u.ac.jp/
macco
質問者

お礼

詳しい説明をありがとうございます。 心理についての勉強を始めたばかりで何を見てもちんぷんかぷんで困っていました。 このような公開ページ上でもperu-peruさんのような方に細かく説明してもらえることをたいへん有難く思います。 まだまだ壁はあると思いますが、もう少し頑張ってみます。 ありがとうございました。

その他の回答 (1)

  • peru-peru
  • ベストアンサー率48% (26/54)
回答No.1

KMOって、何ですか?できれば、日本語で書いていただけると回答できるかもしれません。

macco
質問者

補足

KMOとは・・・ Kaiser-Meyer-Olkinの標本妥当性の測度、というものです。 この測度が1に近いほど変数の因子分析がうまくいくとされているそうです。 (0.5以下だと怪しい) SPSSで因子分析をするときは KMOとBartlettの検定がセットになっているんです。 どちらに関しても詳しい説明がある参考書を見つけれず、簡単な説明しかできません。 申し訳ありません・・・・

関連するQ&A

  • 因子分析について

    尺度作成等を行うときに、構成概念妥当性を検証するために因子分析を行っている文献を目にすることが多いのですが、厳密に言えば、因子分析は間隔尺度以上で使用ができるのだと思います。 5件法、7件法によるアンケートについて因子分析を行っている文献もみます。とある、文献にも1~5点に対応させるような評定法は間隔尺度とみなしても良いと書かれていました。なぜ、みなしても良いのか理解できません。それは果たして、正規分布を仮定できるのか?数量的関係性は保てているのか? どなたか詳しい方、ご回答お願いします。

  • 因子分析のあとはどうすれば?

    教育心理学の授業を受講していますが、因子分析についていまいち深い理解が得られません。 質問紙から得られたデータをもとに因子分析をし、テーマに沿った必要な2因子を抽出できました。 しかしその後、その2因子を比較するなどどういった分析方法をとっていいかがわかりません。 イメージとしては、その2因子には関係があるのか、性差、年齢差はみられるのかなどを検証して結果を出したいと思っています。 どなたかご存知の方、ご回答よろしくお願いします。

  • 因子分析について

    因子分析を使って,大学生を対象とした飲食店のイメージ評価分析を行いたいと思っておりますが,以下の場合,どのように解析をすすめていってよいのかわからずにおります.どなたかご教示いただけませんでしょうか.なおソフトはSPSSを使用してます. 調査目的:大学生の飲食店のイメージ評価(評価因子の抽出) 調査対象:大学生200人 対象飲食店:20店(マクドナルド,ケンタッキーほか) 設定尺度数:18(おいしい-おいしくない,お手頃-高価等) 具体的な問題点は,以上の場合のSPSSのデータ入力の仕方です. この場合,大学生200人の一人一人に,対象飲食店20店×設定尺度数18=360の設問を応えてもらわなくてはならないのでしょうか? となれば,回答者に膨大な負担をかけてしまうことになり,実施は不可能かと思います. 因子分析のテキストなどを読んでいると,よく国語,数学,理科,社会の4科目の点数を評価尺度として,学生50名程度を対象にした因子分析の例がよくでてきますが,こうした例では上記のような調査分析の際の参考にはなりません. 宜しくお願いします.

  • 因子分析の因子負荷量に関して

    本に載っている因子分析の例題をSPSSで解いたところ、ある因子の因子負荷量の符号がテキストの回答例と全く逆になりました。 いくつかの教科書の例題を試したところ、同様に符号が逆転することがありました。 符号が逆であれば、その軸の解釈をまったく逆にしてしまえば済むので特に問題ではないのではと勝手に思っていますが、何だかひっかかってモヤモヤします。 数学的には、どういったことが原因で因子負荷量の符号が逆転するのですか? 気が向いた方、数学がダメダメな私にご教授ください。 よろしくお願いします。

  • い因子分析について

    こんにちは。 現在、因子分析について勉強しており、分からない所があるので質問させて頂きます。 アンケート等結果を因子分析した後、固有値の見方がいまいち理解が出来ません。バリマックス回転をした際に、固有値が1以上で数値が高いものが説明力があるとされていますが、 固有値を見る際は、回転前と後のどちらを見て判断するのがよろしいのでしょうか?また、回転後に注目するのであれば、回転前の数値はあまり注視しなくてよろしいのでしょうか? ご回答お願いします。

  • 因子分析の前に確認すべきこと

    いつもお世話になっております。 因子分析をする際に、正規分布かどうかを調査する必要はどこまで必要なのでしょうか? 確かに因子抽出方法を選定する際に必要そうな雰囲気は感じておりますが、たとえば「SPSSとAmosによる心理・調査データ解析(東京図書)」などでは、天井効果とフロア効果を調べたうえで、因子分析に入って行きました。 正規分布していないとデータ分析には不向きなアンケート結果なのでしょうか? アドバイス頂けたら幸いです。

  • 数量化三類と因子分析

    統計初心者です。 spssを使っています。 「やった事がない」ー「日常的にやっている」までの5件法で60項目のアンケートを取り、最尤法で因子分析を行おうとした所、 『その前に数量化三類を行う必要がある』と指摘されました。 数量化三類がSPSSでは「コレスポンデンス分析に」にあたるものだという事まで分かりましたが、それから先がさっぱり分からないでおります。 「1.やっている 5.日常的にやっている」のような1~5の順序尺度を、数量データに変換してくれるものだと思っていたのですが、「次元1」「次元2」など縦軸と横軸が出てきて、戸惑っています。 座標を表しているとの事なのですが、それを因子分析でどう使えばいいのか見当がつきません。 カテゴリカル主成分分析というやり方ですと、数量化された値は1つだけ(次元など出てこない)出てきたので、まだ分かりやすかったのですが… 『「0・1」のダミー変数を作って多重応答分析でも可』とも聞いたのですが、5件法のものを0・1に変換してその後どうするのかも不明です。 数量化3類の手順とそれをどのように因子分析に使うのか、具体的に教えて頂ける方、どうかお願い致します。

  • SPSSで分析できない(因子分析)

     98項目の予備調査を因子分析にかけて尺度作成を試んでいるのですが, 「共分散行列(a) a この行列は正値行列ではありません。」 「説明された分散の合計(a) a 抽出することができません。この抽出はスキップされます。」 という出力画面が出てすすめません.『データの分解』→『因子分析』→変数枠の中へ項目を入れ,『因子抽出』→主因子法で,『回転』は主因子法なのでバリマックスにしました.(下位概念間に相関があったり,最尤法であればプロマックス?でしょうか)これで,以上の↑ような画面が出力されてしまいます.誠に情けないのですが,ご指導宜しくお願いします.

  • 「統計学」因子分析に代わる方法はないですか?

    妥当な統計解析方法が見つからず困っています。 下記のような「はい」「いいえ」で答える質問紙を用いて、第三者が客観的に評価を行ったとします。 例)今日の患者さんの症状で当てはまるものに「はい」をつけてください 質問1 100m歩くと息切れがする    質問2 階段を昇ると胸痛が出現する    質問3 起床時の問診でドキドキ感を訴えた など50問  この結果、似たような項目に「はい」がついた人を分析し、 その結果、心臓由来の原因症状を因子に分類(痛みの因子・息切れの因子・・など)する方法を探しています。 通常ですと、5~7件法の質問に対し因子分析法を用い、 因子負荷によってそのまとまりを探すのが一般的ですが、 今回のデータはアンケートではなく、 第3者が症状を質問し「はい」=1「いいえ」=0と変数化した2件法なので、 因子分析には向かないのではないかと考えたためです。 患者さんご自身に答えていただく方法は今回とれないのです。 どなたかよい解決方法を知っていましたら、ご教示ください。 宜しくお願いします。

  • 分析方法はあってるのでしょうか?

     データ分析をしているのですが、「Pearsonの相関マトリックスを求め、直接バリマックス法による因子分析を行った。また、因子2と因子5を組み合わせて右へ25度回転した」と記述のある先行研究に記載されているデータを使って、SPSSで因子分析すると、「この行列は正値行列ではありません」となり、因子分析ができませんでした。ただ、このデータで主成分分析をして、バリマックス回転をかけると、似たような値はえることができました。しかし、因子2と因子5を「組み合わせる」という記述の意味がわからず、困っております。  また、別の先行研究では、「偏差積相関を求め、主成分分析からバリマックス回転によって因子分析を行った」とありますが、そもそも主成分分析から因子分析へと移行することはできないのではないかと思います。  統計処理に疎く、この先行研究ではいったい何が行われているのか、想像がつかず閉口しております。  どなたか、お分かりになる方がいらっしゃいましたら、お教えください。  よろしくお願いいたします。