統計学 重回帰分析についての問題

このQ&Aのポイント
  • 統計学の重回帰分析について質問があります。Rを使用して実行し、結果を確認したいと思います。
  • 質問者はExcel上でデータを読み込んでいます。指定されたデータを使用して重回帰分析を行い、結果を要約しています。
  • 重回帰分析によって得られた回帰式が有意であることを示す検定結果があり、結論として回帰式が信頼できるという結論に至っています。
回答を見る
  • ベストアンサー

統計学 重回帰分析についての問題

問題 目的関数をy、説明変数を他の二つとして重回帰分析を行え。 この問題をRで実行し、※は自分がつけた補足です。 以下は間違ったことを言っていないか見てほしいです。 よろしくお願いします。 > condo<- read.table("clipboard",header=TRUE) ※Excel上で範囲指定したデータを読み込む > condo x1 x2 y 1 12 4 22 2 12 3 24 3 11 3 21 4 7 1 19 5 8 3 19 6 9 2 22 7 14 5 24 8 11 4 23 > attach(condo) > lm1<- lm(y~.,data =condo)  ※yを目的変数、他のすべての変数を説明変数として線形重回帰分析を実行 > summary(lm1) ※実行結果の要約 Call: lm(formula = y ~ ., data = condo) Residuals: ※残差の8数要約 1 2 3 4 5 6 7 8 -0.7477 0.6682 -1.3259 -0.4708 -0.3084 1.1016 -0.1752 1.2582 Coefficients: ※係数の最小二乗推定値と対応t値など Estimate Std. Error t value Pr(>|t|) (Intercept) 13.0140 2.1917 5.938 0.00193 ** ※β_0 x1 1.0058 0.3465 2.903 0.03369 * ※β_1 x2 -0.5841 0.6478 -0.902 0.40854 ※β_2 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 1.087 on 5 degrees of freedom Multiple R-squared: 0.7852, Adjusted R-squared: 0.6992 ※寄与率、自由度調整済み寄与率 F-statistic: 9.137 on 2 and 5 DF, p-value: 0.02139 最後の行は、母集団において、得られた回帰式 y= β_0+ β_1 x_1+ β_2 x_2+ ε_i が全くあてにならないという仮説(H0: β_1= β_2= 0 )を分散分析で検証している。検定統計量 F=S_R・(n-p-1)/ S_e・p ( n:標本数、p:説明変数の数、S_R:回帰による平方和、S_e:残差平方和 ) が自由度(p,n-p-1)のF分布に従うことを用いている。上記では、p値が0.02139と極めて小さいので、有意水準0.05で仮説H0は棄却され、母集団においてもこの式はあてになるという結論に至る。 ・・回答よろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • backs
  • ベストアンサー率50% (410/818)
回答No.1

流石に類似した3つの回答をするのは骨が折れますが(^_^;) あなたの質問は全てRの解説本を読めば解決する問題でしょう。あるいはweb上の情報を検索することでも解決するでしょう。 それから、全ての結果を掲載する必要は全くなくて、必要な部分だけを載せるようにしましょう。例えばオブジェクトの中身(データフレームのような)を全て載せる必要性は低いでしょう。

gsb57529
質問者

お礼

3件も回答本当にありがとうございました。 助かりました。

関連するQ&A

  • 統計学 線形重回帰分析についての問題

    問題 高校生22名の物理の学力yと、物理の興味x_1、数学の学力x_2、知能偏差値x_3との関係を調べたデータ(100点満点で点数化)(22record.xls)に関して、yのx_1,x_2,x_3に対する線形重回帰分析を行え。 以下は、この問題について、R上で実行した結果と、※は自分が補足した部分です。これについて、間違ったことを言っていないか見てほしいです。 よろしくお願いします。 > record<- read.table("clipboard",header=TRUE) ※Excel上で範囲指定したデータを読み込む > record y x_1 x_2 x_3 1 43 35 50 55 2 62 44 50 70 3 15 20 10 32 4 23 32 15 45 5 84 70 88 80 6 90 76 90 92 7 67 58 82 54 8 45 37 52 45 9 75 85 92 60 10 13 10 15 25 11 56 52 58 73 12 86 62 83 89 13 24 30 24 60 14 18 22 20 32 15 52 60 46 42 16 80 50 72 86 17 70 92 63 76 18 32 38 25 17 19 37 45 30 25 20 50 46 55 73 21 60 63 59 73 22 72 43 70 72 > lm1<- lm(y~.,data=record)  ※yを目的関数、他のすべての変数を説明変数として線形重回帰分析を実行 > summary(lm1) ※実行結果の要約 Call: lm(formula = y ~ ., data = record) Residuals: ※残差の5数要約 Min 1Q Median 3Q Max -8.871 -4.041 -0.737 5.087 8.921 Coefficients: ※係数の最小二乗推定値と対応t値など Estimate Std. Error t value Pr(>|t|)   (Intercept) -1.95005 3.95936 -0.493 0.6283  ※β_0 x_1 0.17629 0.10686 1.650 0.1163  ※β_1 x_2 0.61691 0.10483 5.885 1.43e-05 *** ※β_2 x_3 0.23466 0.09315 2.519 0.0214 *  ※β_3 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 5.976 on 18 degrees of freedom Multiple R-squared: 0.9485, Adjusted R-squared: 0.94 ※寄与率、自由度調整済み寄与率 F-statistic: 110.6 on 3 and 18 DF, p-value: 8.711e-12 ※回帰式に関する分散分析 > slm<- step(lm1) ※変数選択実行 Start: AIC=82.25 ※AIC(Akaike's Information Criterion);赤池情報量規準 y ~ x_1 + x_2 + x_3 Df Sum of Sq RSS AIC <none> 642.83 82.25 - x_1 1 97.21 740.04 83.34 ※AIC最小 - x_3 1 226.66 869.49 86.89 - x_2 1 1236.70 1879.53 103.85 上記では、AIC法による変数選択を行っている。この方法では、AICの値が小さいほど良いモデルとされる。 独立正規誤差を仮定する場合: AIC=2p+n/2+n/2log(2πσ^2) (p:説明変数の数、n:標本数、σ:誤差分散の不偏推定量) ・・回答よろしくお願いします。

  • 統計ソフトRの回帰分析について

    フリー統計ソフトRの回帰分析に関する質問です。 統計の研究でRというソフトを最近使い始めたのですが、なかなかうまくいきません。 特に、説明変数に期間を考慮した回帰分析のやり方です。 具体的には 二つの変数XとYがあって t期におけるYの値を過去6期間(k=1,2,3,...,6)のXの値で回帰させたいのですが (式)      6 Yt=A+ΣBkXt-k     k=1 どのような式をlm()に入れれば分析できるでしょうか? 

  • 単回帰分析と重回帰分析の結果の違い

    論文を読んでいて疑問に思うことがありました.よろしくお願いします. 私は,回帰分析とは変数Yを、p個の変数X1,X2 ,… Xpにより説明したり予測するための統計的手法であり,p=1のときは単回帰分析,p>1のときは重回帰分析と呼ぶ,と解釈しています. 今,ある施設のサービス改善についての調査論文を読んでおります.そこではアンケート調査でその施設のサービスの総合評価Yと,8個の各サービス毎の評価(x1~x8)を調べ,総合評価Yを従属変数, x1~x8を説明変数として重回帰分析にかけます.そして出た相関係数から施設の総合評価に対する各サービスの重要度を求め,改善につなげようとしています. 結果,重要度は x1>x2>x6>x3>x7>x8>x4>x5 という結果になりました.ここまではわかるんです. ですが次に総合評価Yを従属変数,x1を説明変数として単回帰分析,また総合評価Yを従属変数,x2を説明変数として単回帰分析,また総合評価Yを従属変数,x3を説明変数として単回帰分析・・・というようにこの操作をx8まで続け,出た相関係数を比較しています.結果は x1>x2>x4>x8>x3>x5>x7=x6 となっており,重回帰分析の結果と照らしあわせると最初のx1とx2は合致しているものの,あとはバラバラです.x6にいたっては最後にきています.なぜでしょうか.論文は「どのサービスも総合満足度に重要な影響を与えており,特にx1,x2,x3,x4を改善するのがよい」 と締めくくっています. 質問は3点です. (1)なぜ重回帰分析の結果と単回帰分析の結果が異なるのか (2)どのサービスも総合満足度に重要な影響があるとして,それは重回帰分析の結果だけで言えるのではないか(重回帰でも相関係数は出ているし,単回帰分析をする意味はあるのか) 稚文ですみません. 当方あまりオツムがよろしくないのでできるだけわかりやすくよろしくお願いします.

  • 重回帰分析について

    現在海外の大学で、今学期社会調査のコースをとっています。 先日、重回帰分析を学んだのですが、頭がついていかず、まったくわかりませんでした。どなたか、わかりやすく説明していただけないでしょうか? 日本語のサイトをさらってみたのですが、まだよくわかりません。 重回帰分析は、複数の従属変数dependent variablesと独立変数dependent variableの相関を調べるためにあるのだと解釈しています。 例にだされた、モデルが以下のようなものとなっています。 二酸化炭素の排出量に関するもでるです。               モデル1  モデル2  モデル3 定数            -0,019 -0,244 -0.790 電気消費   2.315*** 2.296*** 2.293*** 都市よりかどうか        0.004 0.007 人口の伸び 0.349 R-squared 0.908 0.910 0.911 *Siginificant at p< .05 **Siginificant at p< .01 ***Siginificant at p< .001 この表の場合、二酸化炭素消費が従属変数になり、電気消費・都市よりかどうか・人口成長率が従属変数になるのだと思います。 相関度が強いのは、モデル1、2、3いずれも電気消費となっているのだと思います。 R-squaredを調べてみたところ、決定係数/寄与率と説明してありましたが、よくわかりません。また、モデル1、2、3とありますが、どのようにモデルは決定されるのでしょうか? 英語を翻訳して記しているので、多少ニュアンスの間違い等あると思います。また、グラフがずれて表示されよみにくくなっているかもしれません。すみません。 よろしくお願いします。

  • 重回帰分析?

    二つの変数があり、各々従属変数に対して単回帰分析を行うと決定係数が0.5と0.4ぐらいの感じになります。この二つの変数をくっつけてもう少し精度を上げたいのですが、一方は線形なんですが、もう片方が非線形(指数関数)なのです。 たしか、重回帰分析は線形どうしでしかくっつけることができなかったような気がするのですが、どのようにしたらできるでしょうか? 混合モデルとかを使ったらよいのでしょうか??? 理論的に考えると Y=aX1 + bexp(cX2) かY=aX1 + bX1exp(cX2)と思うのです Yが従属変数X1,X2が変数、a,b,cがそれぞれ係数です。 使用できるソフトはSPSS,SAS,mintab,S-plus,R,excelです。Rでのが使い慣れているのでRでできるとよいのですが、できるならどのソフトでもかまいません。

  • 回帰分析における回帰係数(α)の意味

    回帰分析における回帰係数(α)の意味 線形回帰式Y=α+βXにおける 定数項αの意味について、2点質問いたします。 (1)定数項αが0以外の数値をとるということは、 被説明変数Yの数値に対して、αは何か影響を 与えていることを表すものでしょうか? (2)αについて仮説検定を行うために、帰無仮説・ 対立仮説をそれぞれ立てたとき、各仮説の意味は 以下の通りになるでしょうか? ・帰無仮説(α=0)→Yの数値に対して影響を与えている変数が他に存在する ・対立仮説(α>0)→Yの数値に対して影響を与えている変数が他に存在しない 当方、数学及び統計学については初学者です。 分かりやすくご教示いただける方からのご回答を お待ちしております。 以上、よろしくお願い申し上げます。

  • 重回帰分析と分散分析

    R≒0のとき、p値が有意であることは何を意味していますか 分散分析の帰無仮説は全ての係数が0であるですが、 Rがゼロに近いとき、p値が有意になることはありますか 持っているデータで回帰分析を行ったところ R=0.11xx、R2=0.012xx、P<0.001xx となりました。これは、相関がないことを示しているのでしょうか。 それとも弱いながらも相関があることを示しているのでしょうか。 よろしくお願いします。

  • 統計ソフトRの重回帰分析について。

    自身の前後で地価の説明変数の影響がどう変化したかなという興味の元統計を勉強し始めました、最近。それでRにてlm()で重回帰分析してsummary()をしようとしています。 その途中でけっつまづいたので助けてください! aが被説明変数でb1,b2が説明変数として > a <- c(148, 160, 159, 153, 151, 140, 158, 137, 149, 160) > b1 <- c(41, 49, 45, 43, 42, 29, 49, 31, 47, 47) > b2 <- c(41, 159, 153, 151, 140, 31, 47, 47, 47, 47) > y<-data.frame(a,b1,b2) >y.lm<-lm(a~.,data=y) と打つと 以下にエラー lm.fit(x, y, offset = offset, singular.ok = singular.ok, ...) : 因子保管モードを変更するのは不正です 追加情報: 警告メッセージ: In model.response(mf, "numeric") : 因子応答を持つ type="numeric" の使用は無視されるでしょう とかえされるんですがなにがいけないんですかね ? 助けてください! それ以外にもRで壁にあたった時自分で対処できるようになれそうなサイトorぐぐり方も指南していただけると今後が幸いです。

  • エクセルでの重回帰分析が上手くいきません

    エクセルにて重回帰分析を行っています。下記の状況になりますが何が原因か、また、対策はどうすべきかご教授ください。 <元データ> ・説明変数16個 <エクセルの統計データ機能を使用した結果> 回帰統計 重相関 R 1 重決定 R2 1 補正 R2 65535 標準誤差 0 観測数 3 分散分析表   自由度 変動     分散    観測された分散比 有意 F 回帰 16  1.646666667 0.823333333 #NUM!     #NUM! 残差  0    0     65535 合計  16 1.646666667 t値 65535 P値 #NUM! 以上です。 どうぞよろしくお願い致します。

  • 重回帰分析をして仮説検定を行いたいのですが

    自分が感心のある現象を被説明変数(Y)とし、それに影響を与えるいくつかの説明変数(X)を考えて時系列データを集め、重回帰分析を使って仮説検定を行う という課題なのですが どのような時系列データを用いて、何をYとしXとして分析すればよいのでしょうか。 また、時系列データを探っても企業の財務データでは過去10年ほどのものしかでてきません。 何についてのデータでもいいので過去20年ほどのデータで分析しなければならないのですが・・・。 どなたかご教授ください。おねがいします