統計学 線形重回帰分析についての問題
問題 高校生22名の物理の学力yと、物理の興味x_1、数学の学力x_2、知能偏差値x_3との関係を調べたデータ(100点満点で点数化)(22record.xls)に関して、yのx_1,x_2,x_3に対する線形重回帰分析を行え。
以下は、この問題について、R上で実行した結果と、※は自分が補足した部分です。これについて、間違ったことを言っていないか見てほしいです。
よろしくお願いします。
> record<- read.table("clipboard",header=TRUE) ※Excel上で範囲指定したデータを読み込む
> record
y x_1 x_2 x_3
1 43 35 50 55
2 62 44 50 70
3 15 20 10 32
4 23 32 15 45
5 84 70 88 80
6 90 76 90 92
7 67 58 82 54
8 45 37 52 45
9 75 85 92 60
10 13 10 15 25
11 56 52 58 73
12 86 62 83 89
13 24 30 24 60
14 18 22 20 32
15 52 60 46 42
16 80 50 72 86
17 70 92 63 76
18 32 38 25 17
19 37 45 30 25
20 50 46 55 73
21 60 63 59 73
22 72 43 70 72
> lm1<- lm(y~.,data=record)
※yを目的関数、他のすべての変数を説明変数として線形重回帰分析を実行
> summary(lm1) ※実行結果の要約
Call:
lm(formula = y ~ ., data = record)
Residuals: ※残差の5数要約
Min 1Q Median 3Q Max
-8.871 -4.041 -0.737 5.087 8.921
Coefficients: ※係数の最小二乗推定値と対応t値など
Estimate Std. Error t value Pr(>|t|)
(Intercept) -1.95005 3.95936 -0.493 0.6283 ※β_0
x_1 0.17629 0.10686 1.650 0.1163 ※β_1
x_2 0.61691 0.10483 5.885 1.43e-05 *** ※β_2
x_3 0.23466 0.09315 2.519 0.0214 * ※β_3
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 5.976 on 18 degrees of freedom
Multiple R-squared: 0.9485, Adjusted R-squared: 0.94 ※寄与率、自由度調整済み寄与率
F-statistic: 110.6 on 3 and 18 DF, p-value: 8.711e-12 ※回帰式に関する分散分析
> slm<- step(lm1) ※変数選択実行
Start: AIC=82.25 ※AIC(Akaike's Information Criterion);赤池情報量規準
y ~ x_1 + x_2 + x_3
Df Sum of Sq RSS AIC
<none> 642.83 82.25
- x_1 1 97.21 740.04 83.34 ※AIC最小
- x_3 1 226.66 869.49 86.89
- x_2 1 1236.70 1879.53 103.85
上記では、AIC法による変数選択を行っている。この方法では、AICの値が小さいほど良いモデルとされる。
独立正規誤差を仮定する場合:
AIC=2p+n/2+n/2log(2πσ^2) (p:説明変数の数、n:標本数、σ:誤差分散の不偏推定量)
・・回答よろしくお願いします。