重回帰分析の変数についての疑問

このQ&Aのポイント
  • 重回帰分析を行いたい際、説明変数に性別などの2択の変数が含まれる場合、過去の論文を参考にして性別を数値化することがあります。
  • 重回帰分析の回帰方程式は、目的変数を説明変数と定数の組み合わせで表すものです。
  • 標準偏回帰係数の隣に表示されるt値や有意確率は、統計的な解析結果を示しており、変数の有意性を評価する指標です。
回答を見る
  • ベストアンサー

重回帰分析の変数についての疑問

重回帰分析を行いたいのですが、説明変数(独立変数)に性別などの2択の変数があります。 目的変数(従属変数)は、完全な数量データなのですが、、、、 説明変数も数量データでなければならないのですよね??? しかし、過去の論文などを参考に見ていたら独立変数に性別があり、男=1、女=0とか書いてあるのです。。。 それでいいの? 多変量解析の初心者なので、変な質問かもしれません。 目的変数=(標準偏回帰係数)*説明変数1+(標準偏回帰係数)*説明変数2+・・・+定数 の回帰方程式ですよね。 あと、それぞれの標準偏回帰係数の横にt値や有意確率が算出されますが、これは何? あと、論文の表記のやり方として何をどう記せばいいのですか? 独立変数 標準偏回帰係数をそれぞれ縦に記して、RやR^2を最後の行に記せばいいの? tや有意確率も記すの?というか、これは何? 色々とわからないのですが、どれか一つでも答えをお願いします。 教えてください。

質問者が選んだベストアンサー

  • ベストアンサー
  • backs
  • ベストアンサー率50% (410/818)
回答No.2

> ダミー変数は、(1、0)でも(1、2)としても問題はないでしょうか? 問題ありません。数値自体に意味はないので,極端なはなし,12386と38876としてもいいです。ただし,ダミー変数にも"使い方"というものがあるので,単に男だから1とか女だから2としていいものでもありません(http://homepage2.nifty.com/nandemoarchive/tahenryo/suryoka_01_hosoku.htmなど参考にするとよいかもしれません)。 > 定数は独立変数の項目に書いたほうがいいのでしょうか? そのとおりです。質問者さんがみた論文に書いてなかったのは定数項が0であるようなモデルだったのかもしれません。 回帰分析において説明変数を選択するのがある意味で一番難しい部分ではありますね。しっかりとした変数を選択せずに回帰分析にかけるとまず間違いなく無意味な(とんでもない)結果が返ってくるので,機会があったら本など読んでみるとよいかもしれません。

ssmarugoo
質問者

お礼

わかりました。ありがとうございます。 一応、SPSSに独立変数(説明変数)の投入(選択)に関してステップワイズ法などが付いていたり、共線の診断とかついているのです。・・・・なんのことやらさっぱりですが。持っている本は簡単な初心者向け用の教材やソフトの使い方・見方くらいしかのっていません。 ネットで調べてもいるのですが、かなり難しいです。 どうも、ありがとうございました。いつも助かります。

その他の回答 (1)

  • backs
  • ベストアンサー率50% (410/818)
回答No.1

> 過去の論文などを参考に見ていたら独立変数に性別があり、男=1、女=0とか書いてあるのです。。。それでいいの? いいんです。恐らくそれはダミー変数を用いて分析したのでしょう。説明変数が質的なデータで表された場合の分析方法として数量化I類という分析方法がありますが,ダミー変数を用いて重回帰分析を行っても同等な結果が得られます。 > それぞれの標準偏回帰係数の横にt値や有意確率が算出されますが、これは何? 要するに回帰分析において「各変数の回帰係数が予測に使えるか」ということを確かめる必要があるのです。だから例えば,y=2.04+1.34x1+0.56x2という回帰式において,1.34(p<0.05)というのがあれば,それは1.34という回帰係数は使いもんになりますよということです。 > 論文の表記のやり方として何をどう記せばいいのですか? 論文の投稿規定(というか慣習)に習って記す。というのが答えですが,項目やカテゴリ,係数,p値,という感じで表にするのが一般的かもしれません。扱うものによっては95%の信頼区間も記したり,文章中に自由度とt値を載せている場合もあるし。。。 ただ,どのような形でも必ずp値と決定係数は載せなければなりません。

ssmarugoo
質問者

お礼

そういえば、もう一つお願いします。定数は独立変数の項目に書いたほうがいいのでしょうか? 過去の論文には(1つしかみていませんが)、定数が書いてありません。

ssmarugoo
質問者

補足

ありがとうございます。だいぶ分かりました。もう一ついいですか? ダミー変数は、(1、0)でも(1、2)としても問題はないでしょうか? 多重共線の問題や独立変数の選び方など重回帰分析は難関ですね。 これらを理解しようとは思いませんが、なんとなく回帰分析は最小二乗法からできたものということは理解できました。。。たぶん。

関連するQ&A

  • 重回帰分析の結果の解釈について

    修士論文執筆(看護系大学院)のためSPSSで重回帰分析を行いましたが、結果の解釈につまずいています。 標準偏回帰係数にマイナスがついた場合、「負の影響」と解釈すると思うのですが、ダミー変数を用いた場合にはどにように解釈すればよいのでしょうか。 ちなみに、従属変数は対処行動尺度の5つある下位項目の中の一つ「私的支援追求」で、独立変数は続柄(1=親、0=配偶者)です。独立変数は続柄を含め7つあります。対象数は約100です。 標準偏回帰係数は-.256で、その他に有意だったのは家族機能の.449でした。 Rは.551、R2乗は.304、VIFは全て2以下で多重共線性はないと判断しましたが、t検定では尺度全体、下位項目とも親の方が対処行動は全て高くでていました。 この結果を私は配偶者である方が私的支援追求の得点が高い(できている)というように解釈しました。しかし、t検定の結果とは符号が異なります。 私の解釈が違うのか、解釈があっているとしたらt検定の結果と逆になっていることをどのように説明するのかここまでの情報でなにかご指摘いただけましたらお願いいたします。

  • 重回帰分析のやり方について教えて下さい。ど素人的な質問で恐縮なのですが

    重回帰分析のやり方について教えて下さい。ど素人的な質問で恐縮なのですが、重回帰分析は、目的変数(Y)を、説明変数 X1, X2, X3, X4.....X20などに影響されるか否かを検討しますよね。ここで、私がしようとしている統計学的処理と類似した研究の論文などを読んだりとかしていると、YとX1, YとX2, YとX3, YとX4.....YとX20の単回帰分析を各々行い、ここで有意な相関があったものを取り上げて(例えば、X1, X4, X7, X12, X18, X20の6個など)、この6個について、重回帰分析を施行して、ここで、X4, X18は有意でないといった結果が出たなら、Y=aX1+bX7+cX12+dX20という重回帰式を作成し、標準偏回帰係数を算出し、どの説明係数が最も目的変数に影響を与えているのか解析しているのですが、これが正しい方法(進め方)なのでしょうか? いきなり、YとX1~X20を重回帰分析したのは、どうでしょうか?これはダメなのでしょうか?単回帰分析では相関が有意にでない(他の説明変数の影響のために)けれども、重回帰分析では有意な結果となるような説明変数が無視されるような結果になるように思うのですが、どうでしょうか? 非常に低レベルな話しで申し訳ないのですが、お教え下さい。

  • 重回帰分析のモデル式の解釈についてご教授ください。

    社会学関係の論文をいくつか読んでいると、重回帰分析の結果として、 ・調整済R^2が5%~10% ・モデル式に関してのF検定は0.01%~0.1%で有意 ・いくつかの説明変数に関してのt検定は0.01%~0.1%で有意 というような重回帰モデルをいくつも見かけます。 私自身、統計学を勉強中で解釈に困っているのですが、 この重回帰のモデルの解釈としては、 「(1)予測においては、目的変数の変動はほとんど説明できておらず、このモデルを使って予測してもほとんど当たらんが、目的変数に影響を与えているいくつかの説明変数の効果がゼロではない。また、目的変数と説明変数との間の影響関係を見ることにおいて、その目的変数に影響を与えるだろう説明変数を明らかにできた」というようなところでしょうか。 よろしくお願いします。

  • ダミー変数を用いた重回帰分析での影響度の比較

    ダミー変数と連続変数の両方を含むデータで、重回帰分析を行おうとしています。その際、各説明変数の目的変数への影響度の大きさに興味があります。 連続変数のみの重回帰分析であれば、標準偏回帰係数の大小で影響度が比較できると思います。 またあるWebページでは、ダミー変数のみの重回帰分析(数量化1類?)では、各アイテム変数のレンジ・単回帰係数・偏回帰係数などで比較をしていました。 しかしダミー変数と連続変数が同時に含まれる場合は、各説明変数の影響の大きさをどのように比較すれば良いのでしょうか。 例えば下記参考URLのWebページで、単価・曜日・天気から売り上げ本数を予測していますが、最後の方で出てくる係数は単価、日~月までの7種類、曇~雨の3種類、の合計11種類の係数が出ています。 これを単価・曜日・天気の3種類の影響度という形にして比較する、という事は可能なのでしょうか。 偏回帰係数とレンジをそのまま比較はできないと思うのですが、方法はあるのでしょうか。 参考URL: http://homepage2.nifty.com/nandemoarchive/toukei_hosoku/tahenryo_jirei_02.htm

  • 重回帰分析の偏回帰係数についての質問です。

    重回帰分析の偏回帰係数についての質問です。 分析で重回帰分析をやっていたのですが、 偏回帰係数がどのくらいの値をとったらそれが有意な偏回帰係数であるかがわかりません。 どなたか教えてください。

  • 重回帰分析について

    重回帰分析を用いて、性別を調整した解析を行いたいのですが・・・ 結果の見方がわかりません。 男を1、女を0というダミー変数にし、解析を行っています。 それによって、得られた標準化偏回帰係数が-(-)を示しているときは、男性の方が負の影響を与えているのか・・・それとも女性に負の影響を与えているのかわかりません。 また、調整するためのダミー変数ならば、得られた数値は無視して他の独立変数の値を見ればよいのか・・・どのように解釈したらよいのかわかりません。 統計に詳しいかたがいましたら、お願いします。

  • 回帰分析です

    ある論文を読まされています. 論文の中で回帰分析が用いられているのですが,「被説明変数が5%水準で有意に正」であるとなっているのですが,被説明変数名とサンプル数,AdjR2,B-P.het.test,F-statisticしか書かれていません. 説明変数のT-statisticが|2|以上なら5%有意(P-statisticで0.005)だとは教わったのですが… 一体,被説明変数が5%水準で有意と何で判断してるのでしょう? 教えて下さい!

  • 重回帰分析について

    重回帰分析で、増減(ステップワイズ)法を選んだ際の結果として、変数A-Fのうち、変数A-Dがモデルに含まれました。その中でABが偏回帰係数が有意でした。CDについては有意でありません。なぜ、CDはモデルに含まれるのですか?これを抜いたらモデルの適合度(決定係数)が下がるからでしょうか。有意でないなら最初から含まなければいいのに、と思います。

  • 2つの重回帰分析結果の標準偏回帰係数の有意差

    2つのデータ集合(目的変数Y、説明変数X1,X2)について重回帰分析をそれぞれ行い、2つの回帰式を得ます。その結果求められたX1の標準偏回帰係数が、2つの回帰式間で変化したこと調べるには、検定が必要でしょうか?また、必要な場合、どのような検定を行えばよいでしょうか? 色々調べてみたのですが、わからず困っています。教えていただけると本当に助かります。どうぞよろしくお願い申し上げます。

  • 重回帰分析について(至急)

    重回帰分析(SPSS)について質問です。 従属変数(a)と独立変数(b)を入れ、ステップワイズ法でR2の決定係数を算出した結果、 p値は有意な結果が得られつつも、R2値が.10~.29と低い値が出てしまいました。 この際、その関係性は10%~29%ほどしか説明出来ないと解釈出来ますが、 このまま考察に記述しても良いのでしょうか。 はたまた調整をするために、なにか作業を行った方が良いのでしょうか。 使用しているソフトはSPSSです。 ご教授お願い致します。