統計学 主成分分析についての問題
問題 中学生23名の国語、社会、数学、理科、英語のテストの成績データに対し、R上で主成分分析を実行せよ。
以下は、この問題についてR上で実行した結果と、※は自分が補足したものです。これについて、間違ったことを言っていないか見てほしいです。
> record<-read.table("clipboard",header=TRUE) ※Excel上で範囲指定したデータを読み込む
> attach(record)
> cor(record) ※相関係数行列
J So M Sc E
J 1.0000000 0.6584507 0.7018091 0.5575613 0.5875562
So 0.6584507 1.0000000 0.7299969 0.5186419 0.6316762
M 0.7018091 0.7299969 1.0000000 0.5841553 0.6861519
Sc 0.5575613 0.5186419 0.5841553 1.0000000 0.1581694
E 0.5875562 0.6316762 0.6861519 0.1581694 1.0000000
> record.pc<-princomp(record,cor=TRUE) ※主成分分析を実行
> summary(record.pc,loadings=TRUE) ※要約を表示
Importance of components:
Comp.1 Comp.2 Comp.3 Comp.4 Comp.5
Standard deviation 1.8333663 0.9205594 0.58438974 0.53087490 0.40987649 ※標準偏差
Proportion of Variance 0.6722464 0.1694859 0.06830227 0.05636563 0.03359975 ※分散に対する寄与率
Cumulative Proportion 0.6722464 0.8417323 0.91003462 0.96640025 1.00000000 ※分散に対する累積寄与率
Loadings: ※負荷量(第1列の符号は逆)
Comp.1 Comp.2 Comp.3 Comp.4 Comp.5
J -0.470 0.801 -0.340 -0.136
So -0.476 -0.570 -0.663
M -0.498 -0.157 0.567 -0.637
Sc -0.366 0.764 0.222 0.473
E -0.413 -0.640 0.271 0.589
> record.pc$scores ※主成分得点(第1列の符号は逆)
Comp.1 Comp.2 Comp.3 Comp.4 Comp.5
[1,] 3.1167052 1.91873064 -0.83871400 1.089546316 0.47080630
[2,] -0.3534373 -0.36465137 0.23637014 0.088886431 0.40176404
[3,] -1.7374327 -0.31502988 -0.42142122 -0.213519704 0.66313826
[4,] 2.0482136 0.99571932 -0.26626371 -0.287905717 -0.32609384
[5,] -2.4780046 0.42476272 -0.53886137 0.348065492 0.01178841
[6,] 0.4515589 0.78978191 -0.82410613 -0.946674170 -0.33084616
[7,] -1.0796202 -0.18729851 0.05172686 -1.018006746 -0.08089715
[8,] -0.3208936 0.78043016 -0.85188050 -0.349434241 0.20300614
[9,] -0.7660659 -0.15184379 -0.13591157 0.179059603 -0.02711284
[10,] 0.7875685 -0.34815048 -0.71438854 0.020244171 -0.41908193
[11,] -0.8227255 -0.69943703 0.04600328 1.066671131 -0.73574783
[12,] -2.6179360 0.09915406 0.15203799 0.084791799 0.34009352
[13,] -2.0921834 0.20396311 0.31792460 0.724050456 -0.15618464
[14,] 0.8832722 0.79732795 0.75292693 -0.642132324 -0.88772451
[15,] -1.7474404 0.40030282 0.48873306 -0.310296489 0.42990499
[16,] -0.9025150 0.24674778 0.08371780 -0.330878802 -0.14212137
[17,] 3.2791963 -2.42799101 -0.17750833 0.003625541 0.42275792
[18,] -0.4456651 -0.02314190 -0.20421328 0.150554774 0.01283695
[19,] -1.5094569 -0.62043376 0.50088051 0.003922563 0.36332666
[20,] 2.1015986 -1.96268128 -0.41425625 -0.362927436 -0.06299122
[21,] -0.3412713 -0.80030873 0.26676025 0.693274422 -0.68223217
[22,] 0.4319628 0.46624772 1.32628608 -0.113553395 0.21566919
[23,] 4.1145719 0.77779954 1.16415742 0.122636322 0.31594128
・・回答よろしくお願いします。
お礼
ご回答ありがとうございます。 基本に立ち返ると、確かにおっしゃるとおりだと思います。 機器による、多少のRTの差があることも想定しておりましたので、分析メソッドをそっくりそのまま行った時でも判断できるかどうか不安でした。早速、6種の成分を探してみます。