• 締切済み

2つの重回帰分析結果の標準偏回帰係数の有意差

2つのデータ集合(目的変数Y、説明変数X1,X2)について重回帰分析をそれぞれ行い、2つの回帰式を得ます。その結果求められたX1の標準偏回帰係数が、2つの回帰式間で変化したこと調べるには、検定が必要でしょうか?また、必要な場合、どのような検定を行えばよいでしょうか? 色々調べてみたのですが、わからず困っています。教えていただけると本当に助かります。どうぞよろしくお願い申し上げます。

みんなの回答

回答No.3

データ1 データ2 として 値が1,2 しか持たない、ダミー変数を作って 3変数の独立変数で、重回帰を行うべきだと思うけど。 このダミー変数の傾きがあれば、変化があるってことです。

  • alice_44
  • ベストアンサー率44% (2109/4759)
回答No.2

データ集合2の重回帰のt検定を行うときに、 予測式をデータ集合1の回帰式にすり替えて 行えば、いいんじゃない?

mon-monkey
質問者

お礼

ご回答ありがとうございます。大変お手数ですが、もう少し詳しく教えていただけないでしょうか?t検定の際には 推定係数/推定係数の標準誤差で求められるt値を利用しますが、これをどのように変えればよいということでしょうか?

  • Willyt
  • ベストアンサー率25% (2858/11131)
回答No.1

 二つのデータ集合について重回帰分析を行なったということですが、二つの結果に違いが出るのは極く自然な結果です。この場合に行なわなければならないのはそれぞれの結果についての検定をまず行なうことが必要です。これには多くの場合χ二乗検定を行われます。これに合格しないデータは棄却しなければならないのです。なぜなら目的関数と説明変数の間に有意な関係が見られなかったことになるからです。重回帰分析を行なった場合、作った係数行列の行列式がゼロにならない限り、結果はかならず得られますが、それを無条件に用いてしまっているケースが実に多く、これは重大な誤りを生む結果になります。  重回帰計算を行なった結果は必ず検定を行ない、合格した結果だけを用いるようにすることが大切です。χ二乗検定については殆どの重回帰分析の書物に載っている筈ですが、下記が参考になる筈です。

参考URL:
http://www.geisya.or.jp/~mwm48961/statistics/kai2.htm
mon-monkey
質問者

お礼

ご回答ありがとうございます。リンク先を読ませていただきましたが、まだ仰ることが理解できていません。 重回帰分析の検定については、エクセルのデータ分析で求められるt値の検定、すなわち「説明変数の効果が0である」という帰無仮説については行いましたが、これでは不十分でしょうか? また、ここにかかれているχ二乗検定を行ったとしても、2つの異なる回帰式の係数の大きさの比較にはなっていないかと思いますが、それでも大丈夫でしょうか?

mon-monkey
質問者

補足

お礼に書かせていただいたことの補足ですが、決定係数についても求め、高い値をとっておりました。

関連するQ&A

  • 重回帰分析のやり方について教えて下さい。ど素人的な質問で恐縮なのですが

    重回帰分析のやり方について教えて下さい。ど素人的な質問で恐縮なのですが、重回帰分析は、目的変数(Y)を、説明変数 X1, X2, X3, X4.....X20などに影響されるか否かを検討しますよね。ここで、私がしようとしている統計学的処理と類似した研究の論文などを読んだりとかしていると、YとX1, YとX2, YとX3, YとX4.....YとX20の単回帰分析を各々行い、ここで有意な相関があったものを取り上げて(例えば、X1, X4, X7, X12, X18, X20の6個など)、この6個について、重回帰分析を施行して、ここで、X4, X18は有意でないといった結果が出たなら、Y=aX1+bX7+cX12+dX20という重回帰式を作成し、標準偏回帰係数を算出し、どの説明係数が最も目的変数に影響を与えているのか解析しているのですが、これが正しい方法(進め方)なのでしょうか? いきなり、YとX1~X20を重回帰分析したのは、どうでしょうか?これはダメなのでしょうか?単回帰分析では相関が有意にでない(他の説明変数の影響のために)けれども、重回帰分析では有意な結果となるような説明変数が無視されるような結果になるように思うのですが、どうでしょうか? 非常に低レベルな話しで申し訳ないのですが、お教え下さい。

  • SPSSと標準偏回帰係数

    SPSSの重回帰分析で悩んでいます。解る方がいたら教えてください。データから、従属変数を決定し、独立変数も決定しましたが、標準偏回帰係数の求め方が解りません。違った表現なのかもしれませんが、知識が明るくないので解りません。また、その操作法も教えていただければありがたいです。お願いします。

  • エクセルで標準化偏回帰係数を求めたい

    いつもお世話になっております。 有る事象を説明するために大昔聞いたことが有る重回帰分析による複数の要因の影響の大小比較(項目の寄与率の数値化)をやってみようとNETで調べまくり、エクセルのアドインのインストールから初めて、どうやら私は「標準偏回帰係数を求めたい」というところまで分かったのですがエクセルの回帰分析の結果では当該項目が表示されていません。 言葉の定義をアレコレ調べたところ、エクセルでは何故かこの項目は算出されない、とのショックな事態。 但し、下記の式で計算できるとのことなのですが、この式の項目がエクセルの回帰分析結果のどの項目に該当するか分からず調べてみても同じページの堂々巡り状態。 標準偏回帰係数=偏回帰係数×説明変数の標準偏差÷目的変数の標準偏差 どなたか各項目が、エクセルの回帰分析結果に表示されているどの項目に該当するのか教えていただたく。 調べれば調べるほど意味不明となりつつあり、 >標準偏回帰係数は重回帰式における各変数の重要性を表す指標であり、標準化偏回帰係数どうしの大小を比較できます。 という表記が有るのですが、標準偏回帰係数と標準化偏回帰係数は意味が違うのでしょうか? このレベルですのでご了承の上よろしくお願い致します。 またもっと簡単に求める方法があればぜひお願いします。 <エクセルの分析結果で表示される項目> <回帰統計> 重相関  重決定 R2 補正 R2 標準誤差 3  観測数 <分散分析表>     自由度 変動 分散 観測された分散比 有意 F 回帰 3 残差 43 合計 46 係数  標準誤差 t P-値 下限 95% 上限 95% 下限 95.0% 上限 95.0%

  • 単回帰分析と重回帰分析の結果の違い

    論文を読んでいて疑問に思うことがありました.よろしくお願いします. 私は,回帰分析とは変数Yを、p個の変数X1,X2 ,… Xpにより説明したり予測するための統計的手法であり,p=1のときは単回帰分析,p>1のときは重回帰分析と呼ぶ,と解釈しています. 今,ある施設のサービス改善についての調査論文を読んでおります.そこではアンケート調査でその施設のサービスの総合評価Yと,8個の各サービス毎の評価(x1~x8)を調べ,総合評価Yを従属変数, x1~x8を説明変数として重回帰分析にかけます.そして出た相関係数から施設の総合評価に対する各サービスの重要度を求め,改善につなげようとしています. 結果,重要度は x1>x2>x6>x3>x7>x8>x4>x5 という結果になりました.ここまではわかるんです. ですが次に総合評価Yを従属変数,x1を説明変数として単回帰分析,また総合評価Yを従属変数,x2を説明変数として単回帰分析,また総合評価Yを従属変数,x3を説明変数として単回帰分析・・・というようにこの操作をx8まで続け,出た相関係数を比較しています.結果は x1>x2>x4>x8>x3>x5>x7=x6 となっており,重回帰分析の結果と照らしあわせると最初のx1とx2は合致しているものの,あとはバラバラです.x6にいたっては最後にきています.なぜでしょうか.論文は「どのサービスも総合満足度に重要な影響を与えており,特にx1,x2,x3,x4を改善するのがよい」 と締めくくっています. 質問は3点です. (1)なぜ重回帰分析の結果と単回帰分析の結果が異なるのか (2)どのサービスも総合満足度に重要な影響があるとして,それは重回帰分析の結果だけで言えるのではないか(重回帰でも相関係数は出ているし,単回帰分析をする意味はあるのか) 稚文ですみません. 当方あまりオツムがよろしくないのでできるだけわかりやすくよろしくお願いします.

  • 重回帰分析の偏回帰係数についての質問です。

    重回帰分析の偏回帰係数についての質問です。 分析で重回帰分析をやっていたのですが、 偏回帰係数がどのくらいの値をとったらそれが有意な偏回帰係数であるかがわかりません。 どなたか教えてください。

  • 重回帰分析の変数についての疑問

    重回帰分析を行いたいのですが、説明変数(独立変数)に性別などの2択の変数があります。 目的変数(従属変数)は、完全な数量データなのですが、、、、 説明変数も数量データでなければならないのですよね??? しかし、過去の論文などを参考に見ていたら独立変数に性別があり、男=1、女=0とか書いてあるのです。。。 それでいいの? 多変量解析の初心者なので、変な質問かもしれません。 目的変数=(標準偏回帰係数)*説明変数1+(標準偏回帰係数)*説明変数2+・・・+定数 の回帰方程式ですよね。 あと、それぞれの標準偏回帰係数の横にt値や有意確率が算出されますが、これは何? あと、論文の表記のやり方として何をどう記せばいいのですか? 独立変数 標準偏回帰係数をそれぞれ縦に記して、RやR^2を最後の行に記せばいいの? tや有意確率も記すの?というか、これは何? 色々とわからないのですが、どれか一つでも答えをお願いします。 教えてください。

  • 標準偏回帰係数について

    標準偏回帰係数のデータから、被説明変数を予測したいのですが、 切片がわかりません。 切片がわからない中で、被説明変数をどのようにすれば求められるでしょうか。

  • 重回帰分析の定数は、どっちの係数の式に当てはまる?

    そういえば、重回帰分析の結果で非標準化回帰係数と標準化回帰係数とがありますね。 標準化の方は、単位関係なく係数の重みを比べることができると解釈しています。 ですが、予測値Yを計算するときは、非標準化回帰係数の方で出すのが一般的なのですよね? 実は、結果の出力に標準化回帰係数のところには(定数)の値が表示されないのです。 定数は、非標準化係数の欄には表示されているのですが。。。 例えば、↓ http://www.u-gakugei.ac.jp/~kishilab/spss-mra.htm この場合、論文の表記には非標準化回帰係数の方を記したほうがいいのでしょうか? そうでないと、(標準化の方を記したら)定数を書いたら予測値Yの式が違うことになりますよね? あと、論文にはY=(非標準化係数1)*X1+(非標準化係数2)*X2+・・・+(定数)という数式も記入するのですか?

  • 授業で平均・分散・重回帰係数・寄与率・相関係数・検定(F0)・標準回帰

    授業で平均・分散・重回帰係数・寄与率・相関係数・検定(F0)・標準回帰係数(Y=で定数項がない式)を学びました。 あるデータ(説明変量(x1~x3)と目的変量(Y))を渡されて、来週にレポート(結果と検討など)として提出しなければなりません。 先生は「標準化したものだけでやっていい」とおっしゃったのですが、そもそも標準化とは説明変量の度合いをみるだけではないのでしょうか?? 一応回帰係数を求め、寄与率、相関係数、検定を行いましたが、危険率10%で「式は役立たない」という結果に、 はじめに標準化し、寄与率、相関係数、検定をするも、危険率10%で「式は役立たない」 という結果にいたりました。 検定で「式は役立たない」というのはいったいどういう意味なのでしょうか。教えてください。

  • 重回帰分析の結果の解釈について

    修士論文執筆(看護系大学院)のためSPSSで重回帰分析を行いましたが、結果の解釈につまずいています。 標準偏回帰係数にマイナスがついた場合、「負の影響」と解釈すると思うのですが、ダミー変数を用いた場合にはどにように解釈すればよいのでしょうか。 ちなみに、従属変数は対処行動尺度の5つある下位項目の中の一つ「私的支援追求」で、独立変数は続柄(1=親、0=配偶者)です。独立変数は続柄を含め7つあります。対象数は約100です。 標準偏回帰係数は-.256で、その他に有意だったのは家族機能の.449でした。 Rは.551、R2乗は.304、VIFは全て2以下で多重共線性はないと判断しましたが、t検定では尺度全体、下位項目とも親の方が対処行動は全て高くでていました。 この結果を私は配偶者である方が私的支援追求の得点が高い(できている)というように解釈しました。しかし、t検定の結果とは符号が異なります。 私の解釈が違うのか、解釈があっているとしたらt検定の結果と逆になっていることをどのように説明するのかここまでの情報でなにかご指摘いただけましたらお願いいたします。