• 締切済み

主成分分析の対象データについて

初めて質問いたします. 現在大学の卒論で主成分分析について学んでいる者です. 主成分分析のアルゴリズム等は把握したのですが、 主成分対象となるデータについての知識がありません。 主成分の参考書等を読んでも取り扱うデータは具体例を挙げているばかりで 統計学的にどんなデータという記述をしている本はほとんどありませんした。 私が調べたりないせいもあるかと思いますが。。。 過去の質問も見たのですが 私が知りたい部分は詳しく書いてありませんでした。 統計学的にデータ間に相関関係があるという感じで書こうと思っています。 どなたか教えてください。

みんなの回答

  • hukuponlog
  • ベストアンサー率52% (791/1499)
回答No.5

>対象となるものを統計学の観点からもっと詳しく ということであれば、おそらく主成分分析(以下PCA)の前処理をきちんとしろ、ということではないでしょうか? 以下の記述はありますか? ・各項目の基本統計量の記述。PCAは平均位置の情報を取り除いた分析ですから、平均値や標準偏差を個別に記載しておく必要があります。 ・外れ値の処理については、適切な処理と記載がされていますか? ・2変量の関係についての記述。データが質的なものか、量的なものかは分かりませんが、散布図・モザイク図等を利用して、2変量の関係を示す必要があります。例えば、データの数が4種類であれば、4×3で12通りの解析が必要でしょう。 次にPCA実行後の、後処理というか解釈手法はどうでしょうか? 固有値、累積寄与率は当然記述してあるでしょうが、因子負荷量、パリマックス回転等は実行していますか。第一固有値だけが大きくなってしまった場合には、行方向の標準化という手法も必要かもしれません。

  • hossyou
  • ベストアンサー率48% (83/171)
回答No.4

「対象となるものを統計学の観点からもっと詳しく書いてくるように 指摘されました.」 教授の真意は測りかねますが・・・ 前にも書きましが 「主成分分析は情報を集約する手法」です。 n次元の多変量データがある場合、nが1、2次元までなら直感的に理解できるのが、3次元だと怪しくなり4、5、6・・・と次元が高くなると人間には理解することが極端に難しくなる。 したがって、主成分分析によって2次元とか3次元の情報に集約することによって、人間にとってわかりやすい情報に加工しなおすということが主成分分析の目的です。 主成分分析をかけるべきデータという意味なら、 一見しただけではどのような統計的な意味があるのか見出せない多変量データ(に関して統計的な意味を見出す為に主成分分析を用いることにした)でしょうか。

  • backs
  • ベストアンサー率50% (410/818)
回答No.3

> 相関関係のある多変量のデータ というのは具体的にどのようなデータなのか分からないということでしょう。私自身、相関関係のある多変量データとはどういうもののことをいうのか理解できません。

  • backs
  • ベストアンサー率50% (410/818)
回答No.2

> 主成分の参考書等を読んでも取り扱うデータは具体例を挙げているばかりで統計学的にどんなデータという記述をしている本はほとんどありませんした。 この意味がよく分かりませんが?具体的な例があげられているのであれば、より都合が良いのではないのですか? 主成分分析は質的データでも量的データでもできますよ。

pespespes
質問者

補足

回答ありがとうございました. 私自信、主成分分析をかける対象は決まっているのですが 主成分分析のまとめを書く際に 「相関関係のある多変量のデータに対して解析を行う」 と書いたところ もっと論理的な書き方をするようにと指摘を受けました。 下の方の補足に今置かれている状況を書いたので そちらも見て私の問題をわかって頂ければと思います。

  • hossyou
  • ベストアンサー率48% (83/171)
回答No.1

たぶん、質問者様は主成分分析をよく理解されていないのではと察します。 主成分分析は情報を集約する手法ですから分析するデータはもちろん何らかの相関があるものを対象とします。 WEBでいろいろ探してみましたが↓なんかどうでしょうか? http://www.udit.co.jp/kassei/shyuseibun.htm もう少し何を知りたいのか具体的に書いていただけたら、もっと回答が得られるかと思います。

pespespes
質問者

補足

回答ありがとうございます。 うまい質問の仕方ができなくて申し訳ありませんでした。 今までの経緯をお話しします。 まず主成分分析の勉強をしレポートにまとめました. 次に実際に実験からとったあるデータに対して主成分分析をしました. 1では具体例ではなく主成分分析の本質をまとめ 対象となるものは 「相関関係のある多変量のデータに対して主成分分析を行う」 と書いたところ教授から 対象となるものを統計学の観点からもっと詳しく書いてくるように 指摘されました. といった経緯です。 つまり教授が納得できるように どううまく書いていいかに困っています。 再度回答のほうお願いします.

関連するQ&A

  • Rによる主成分分析

    統計解析用ソフトRを用いて主成分分析を行いたいと考えております。 しかし中々うまくいきません。 そこで、詳しい方がいたっしゃいましたら、主成分分析、主成分負荷量、バイプロットまでのプログラムを教えていただけないでしょうか。 解析対象のデータは以下の様なものです。データ数が21個、変数が13個です。   F G H ・・・  R 1  6 6  5 ・・・  2 2  5 6  1 ・・・  6 3  6 4  6 ・・・  5 : : :  : ・・・  : 21 3 6  4 ・・・  6 よろしくお願いいたします。

  • 主成分分析について

    主成分分析について 現在、主成分分析の計算方法を勉強をしているのですが、主成分得点の求め方がわかりません。 例をあげて説明させていただくと、 x1 x2 x3 8 9 4 2 5 7 8  5  6 3  5  4 7  4  9 4  3  4 3  6  8 6  8  2 5  4  5 6  7  6 このようなデータを分析するとして、各変数の相関係数(X1X2 X2X3 X1X3)の値はわかりますし、計算方法もわかります。 またここから固有値もわかります。 しかしここからどうやって、主成分得点を求めればよいかわかりません。 どのように計算するのですか?よろしければご回答下さい。

  • 主成分分析について

    街頭アンケートを行い統計学的に分析しようと思い、主成分分析を利用しようと考えています。しかし、少々難しいく、困っています。「主成分の決め方」みたいなコツを教えてくれると幸いです。

  • 主成分分析について

    こんにちわ。だいぶ困っていることがあるので、皆さんにお尋ねします。 私は卒論でアンケートをとったのですが、その内容がこんな感じです。 「あなたが当てはまるものをいくつでもいいので○をつけてください」 このような感じです。 そこで分析するにあたり、知人から、これを主成分分析でやってみればといわれました。 複数回答にした場合、主成分分析ってできるのでしょうか?? 普通なら5段階になっていてその平均で出したりするのではないでしょうか? でも、できたらこのアンケート項目で主成分分析をしたいのですが、もしやり方があるならおしえてください☆

  • 主成分分析及びクラスタ分析について

    統計について今勉強している者です。 SPSSを用いて分析を実際に行っています。 主成分分析とクラスタ分析というよりSPSSの使用方法になってしまうのですが、 主成分分析を行って、得られた因子得点(回帰法)がデータに保存されます。 今回自分の場合は4つの主成分になりましたので fac1_1~fac1_4が得られています。 この得られた1~4をクラスタ分析にかけるというのは どのような結果を意味するのでしょうか? 実際にクラスタ分析を行うと鎖効果もなく 非常によい結果が得られたのですが これが本当にクラスタ分析となっているのかが分からなくて。 お分かりの方が見えましたら、ご解答いただけるとありがたいです。 お願いいたします。

  • 統計、主成分分析について

     すいません。  勉強中の身なのですが、まだあまり理解度は低いと思われます。  統計学の主成分分析なのですが、  分析内容は  「グループ毎のデータを用意し、そのデータからグループ毎の違いを導き出すことができるか。つまりデータ→グループ分けをして元のグループのようになるか。」  で正しいでしょうか?    例えば、プロ野球選手を  身長、体重、握力、50m走タイム、遠投  などのデータを入れ、  を統計ソフトにかけ、  球団別にうまく分かれるか。  というのは主成分分析ですよね…?  また、上のような主成分分析を試行するのに  考えられる例はどのようなものがあるでしょうか?  データもあれば嬉しいのですが…。

  • 主成分分析

    こんにちは、統計学初心者の大学生です。 統計学の授業で「体力テスト(テスト項目8つ、15人)の総合成績順位をつけなさい」という課題が出され、行き詰っています・・・。 主成分分析をして、因子負荷量やら主成分得点やらは計算済みです。 第4主成分まで(累積寄与率79%)で分析する、という所まで進んだは良いのですが、そこから何をどうすればよいのか分かりません。 テストの総合成績順位をつけるには、総合力を示している主成分を見つければ良いのでしょうか?(でもそれなら第4主成分までを選択する必要はないですよね) どなたかアドバイスよろしくお願いします!

  • 主成分分析について

    主成分分析であるデータを解析したいのですが、主成分分析の手順や意味を詳しく記してあるページなど、ないでしょうか? 調べてみたんですが、実際にデータをどう計算して主成分をだすのかよくわかりません。 よろしくお願いします。

  • SPSSで主成分分析

    お世話になります。 SPSSを使用して主成分分析を行いたく、メニューの統計→データの分解→因子分析と説明されたのですが、データの分解という項目がありません。どうしてでしょうか? バージョンは8.0.1Jです。

  • 分析方法はあってるのでしょうか?

     データ分析をしているのですが、「Pearsonの相関マトリックスを求め、直接バリマックス法による因子分析を行った。また、因子2と因子5を組み合わせて右へ25度回転した」と記述のある先行研究に記載されているデータを使って、SPSSで因子分析すると、「この行列は正値行列ではありません」となり、因子分析ができませんでした。ただ、このデータで主成分分析をして、バリマックス回転をかけると、似たような値はえることができました。しかし、因子2と因子5を「組み合わせる」という記述の意味がわからず、困っております。  また、別の先行研究では、「偏差積相関を求め、主成分分析からバリマックス回転によって因子分析を行った」とありますが、そもそも主成分分析から因子分析へと移行することはできないのではないかと思います。  統計処理に疎く、この先行研究ではいったい何が行われているのか、想像がつかず閉口しております。  どなたか、お分かりになる方がいらっしゃいましたら、お教えください。  よろしくお願いいたします。