• 締切済み

重回帰分析について

重回帰分析を用いて、性別を調整した解析を行いたいのですが・・・ 結果の見方がわかりません。 男を1、女を0というダミー変数にし、解析を行っています。 それによって、得られた標準化偏回帰係数が-(-)を示しているときは、男性の方が負の影響を与えているのか・・・それとも女性に負の影響を与えているのかわかりません。 また、調整するためのダミー変数ならば、得られた数値は無視して他の独立変数の値を見ればよいのか・・・どのように解釈したらよいのかわかりません。 統計に詳しいかたがいましたら、お願いします。

  • s322
  • お礼率28% (2/7)

みんなの回答

  • backs
  • ベストアンサー率50% (410/818)
回答No.1

質問者さんがやったのは共分散分析と呼ばれるものですね。共分散分析は連続型とカテゴリカル型が混在しているので、解釈は難しくなります。 まず連続型とカテゴリカル型の交互作用はどうだったのか? もし交互作用項が有意ならば、性別のどちらかの水準(男か女か)に傾きが依存する。例えば、男性の方が明らかに増加量が多い。 もしも交互作用項が有意でなかったらどうだろうか? 性別の変数が有意であれば、男性と女性で増加量は一定だが、いわゆる群間差が認められるといえる。有意でなければ、そもそも男性も女性も関係ないということになる。 もちろん、これは連続型とカテゴリカル型の変数がそれぞれ1つずつある場合ですから、Y = X1 + X2 + X3 + Sexのようなモデル(質問者さんが扱ったようなモデル)なら、さらに解釈は難しくなります。

参考URL:
http://homepage2.nifty.com/nandemoarchive/GLM/6_ANCOVA.htm
s322
質問者

お礼

丁寧なご説明ありがとうございます!

関連するQ&A

  • エクセルでの重回帰分析

    エクセルで重回帰分析を行なっています。 目的変数1種類、説明変数が1種類ないし2種類で、分析を行なっているのですが、 自由度調整済み決定係数が負の値となっています。 (ちなみに、Rが0.123。R^2が0.015.nが56です。定数項は0ではありません) 「自由度調整済み決定係数が負」が示す意味は何なのでしょうか? 統計についての知識が乏しく、初歩的な質問で申し訳ないのですが、 よろしくお願いいたします。

  • 重回帰分析について

    重回帰分析についての質問です *学生本人、その父親・母親の身長および性別 身長  性別(X) 父の身長(X2) 母の身長(X3) 176 1     174      166 173 1     169      160  ・  ・      ・        ・  ・  ・      ・        ・  ・  ・      ・        ・ というデータがあるとします。説明関数xが性別のダミー変数で男なら1女なら0の値をとる。変回帰分析係数β^1の値からどの様なことが読み取れますか?

  • 重回帰分析の変数についての疑問

    重回帰分析を行いたいのですが、説明変数(独立変数)に性別などの2択の変数があります。 目的変数(従属変数)は、完全な数量データなのですが、、、、 説明変数も数量データでなければならないのですよね??? しかし、過去の論文などを参考に見ていたら独立変数に性別があり、男=1、女=0とか書いてあるのです。。。 それでいいの? 多変量解析の初心者なので、変な質問かもしれません。 目的変数=(標準偏回帰係数)*説明変数1+(標準偏回帰係数)*説明変数2+・・・+定数 の回帰方程式ですよね。 あと、それぞれの標準偏回帰係数の横にt値や有意確率が算出されますが、これは何? あと、論文の表記のやり方として何をどう記せばいいのですか? 独立変数 標準偏回帰係数をそれぞれ縦に記して、RやR^2を最後の行に記せばいいの? tや有意確率も記すの?というか、これは何? 色々とわからないのですが、どれか一つでも答えをお願いします。 教えてください。

  • 重回帰分析

    現在、大学4年です。 工学部で都市計画を習っており、卒業論文は経済学に 近いテーマです。 具体的には、福岡市に新しい地下鉄ができたので、そ の効果を調べようというもの。 方法は地下鉄周辺の家賃を2002年から2005年 まで調べ、2005年に家賃が上がっていたら、それ は地下鉄の効果であるという構想です。 家賃の推定式を重回帰分析であらわし、2004年の 家賃と2005年の家賃を比較、2003年と200 5年の家賃を比較、2002年と2005年の家賃を 比較しています。 比較の方法はダミー変数を加え、2005年には1を とり、それ以外の年は0をとるという方法です。 ここで疑問が生じるのですが、普通にExcelを使って重 回帰分析を行うと、ダミー変数以外の係数も変化して しまいます。 つまり、重回帰分析により2004年と2005年を 比較したときと、2003年と2005年を比較した ときとではダミー変数の係数だけでなく、家賃に関係 するほかの変数(面積や築年数など)も変化してしま います。 係数が変化してもいいのか不安なので、どなたか教え ていただけないでしょうか。 また、係数を変えてはいけないのであれば、係数を変 えずに地下鉄の効果を求める方法を教えていただきた いと思います。 説明にわかりにくい部分があればご指摘ください。 よろしくお願いいたします。

  • 重回帰分析での交差項の意味するところ

    今現在統計学の重回帰分析をしているのですが、交差項が意味するところがわからなく、書き込みさせていただきました。 例えば、 賃金=α+β(1)教育年数+β(2)性別ダミー+β(3)教育年数×性別ダミー+u 性別ダミーは男性が1、女性が0です。 男性の教育年数が賃金に与える影響を知りたいときになぜわざわざ交差項を入れないといけないのでしょうか?男性の教育年数が賃金に与える影響なら教育年数の係数であるβ(1)と性別ダミーの係数であるβ(2)を足し合わすだけでいいような気がするのですが。。。 つまり質問は、 1)交差項はなぜわざわざ式に入れる必要があるのか?(この例で説明していただけるとありがたいです) 2)どのようなときに交差項をいれればいいのでしょうか? よろしくお願いします。

  • 単回帰分析と重回帰分析の結果の違い

    論文を読んでいて疑問に思うことがありました.よろしくお願いします. 私は,回帰分析とは変数Yを、p個の変数X1,X2 ,… Xpにより説明したり予測するための統計的手法であり,p=1のときは単回帰分析,p>1のときは重回帰分析と呼ぶ,と解釈しています. 今,ある施設のサービス改善についての調査論文を読んでおります.そこではアンケート調査でその施設のサービスの総合評価Yと,8個の各サービス毎の評価(x1~x8)を調べ,総合評価Yを従属変数, x1~x8を説明変数として重回帰分析にかけます.そして出た相関係数から施設の総合評価に対する各サービスの重要度を求め,改善につなげようとしています. 結果,重要度は x1>x2>x6>x3>x7>x8>x4>x5 という結果になりました.ここまではわかるんです. ですが次に総合評価Yを従属変数,x1を説明変数として単回帰分析,また総合評価Yを従属変数,x2を説明変数として単回帰分析,また総合評価Yを従属変数,x3を説明変数として単回帰分析・・・というようにこの操作をx8まで続け,出た相関係数を比較しています.結果は x1>x2>x4>x8>x3>x5>x7=x6 となっており,重回帰分析の結果と照らしあわせると最初のx1とx2は合致しているものの,あとはバラバラです.x6にいたっては最後にきています.なぜでしょうか.論文は「どのサービスも総合満足度に重要な影響を与えており,特にx1,x2,x3,x4を改善するのがよい」 と締めくくっています. 質問は3点です. (1)なぜ重回帰分析の結果と単回帰分析の結果が異なるのか (2)どのサービスも総合満足度に重要な影響があるとして,それは重回帰分析の結果だけで言えるのではないか(重回帰でも相関係数は出ているし,単回帰分析をする意味はあるのか) 稚文ですみません. 当方あまりオツムがよろしくないのでできるだけわかりやすくよろしくお願いします.

  • 重回帰分析と相関分析の結果の差異について

    都内4年制大学に通う学生です。 現在、学校の課題で統計処理を行っているのですが、困っている事があります。 変数Aと変数Bとの関係において、2変量の相関分析では有意ではなかった(r=-.05,p>0.1)にも関わらず、重回帰分析では独立変数Aが従属変数Bに対して負の影響を与えているという事が明らかになり(β=-.30,p<0.05)、これを他の人にどう説明してよいか分からないのです。 この場合、独立変数Aは抑制変数と呼ばれるものになるのでしょうか? まだまだ統計の知識も浅い未熟者なので、できるだけ易しく教えて頂けると助かります。 何卒よろしくお願いします。

  • 重回帰分析のやり方について教えて下さい。ど素人的な質問で恐縮なのですが

    重回帰分析のやり方について教えて下さい。ど素人的な質問で恐縮なのですが、重回帰分析は、目的変数(Y)を、説明変数 X1, X2, X3, X4.....X20などに影響されるか否かを検討しますよね。ここで、私がしようとしている統計学的処理と類似した研究の論文などを読んだりとかしていると、YとX1, YとX2, YとX3, YとX4.....YとX20の単回帰分析を各々行い、ここで有意な相関があったものを取り上げて(例えば、X1, X4, X7, X12, X18, X20の6個など)、この6個について、重回帰分析を施行して、ここで、X4, X18は有意でないといった結果が出たなら、Y=aX1+bX7+cX12+dX20という重回帰式を作成し、標準偏回帰係数を算出し、どの説明係数が最も目的変数に影響を与えているのか解析しているのですが、これが正しい方法(進め方)なのでしょうか? いきなり、YとX1~X20を重回帰分析したのは、どうでしょうか?これはダメなのでしょうか?単回帰分析では相関が有意にでない(他の説明変数の影響のために)けれども、重回帰分析では有意な結果となるような説明変数が無視されるような結果になるように思うのですが、どうでしょうか? 非常に低レベルな話しで申し訳ないのですが、お教え下さい。

  • ダミー変数を用いた重回帰分析での影響度の比較

    ダミー変数と連続変数の両方を含むデータで、重回帰分析を行おうとしています。その際、各説明変数の目的変数への影響度の大きさに興味があります。 連続変数のみの重回帰分析であれば、標準偏回帰係数の大小で影響度が比較できると思います。 またあるWebページでは、ダミー変数のみの重回帰分析(数量化1類?)では、各アイテム変数のレンジ・単回帰係数・偏回帰係数などで比較をしていました。 しかしダミー変数と連続変数が同時に含まれる場合は、各説明変数の影響の大きさをどのように比較すれば良いのでしょうか。 例えば下記参考URLのWebページで、単価・曜日・天気から売り上げ本数を予測していますが、最後の方で出てくる係数は単価、日~月までの7種類、曇~雨の3種類、の合計11種類の係数が出ています。 これを単価・曜日・天気の3種類の影響度という形にして比較する、という事は可能なのでしょうか。 偏回帰係数とレンジをそのまま比較はできないと思うのですが、方法はあるのでしょうか。 参考URL: http://homepage2.nifty.com/nandemoarchive/toukei_hosoku/tahenryo_jirei_02.htm

  • ダミー変数だけによる重回帰分析

    被説明変数は連続変数、説明変数はすべてダミー変数、という重回帰分析を行う際に何か注意することはあるのでしょうか。あるいはこうした場合は単純な重回帰分析は使うべきでないのでしょうか。