• 締切済み

ダミー変数の意味

ダミー変数についてお伺いいたします。 以下のようにダミー変数を入れた場合、x(k),x(k+1)の回帰係数が0 という仮説は、それぞれどのような意味があるのでしょうか? <高校の入学試験の点数について>       x(k)   x(k+1) 一般入試 1   1 推薦入学 1   0 内部進学 0   0 宜しくお願いいたします。

みんなの回答

  • goma_2000
  • ベストアンサー率48% (62/129)
回答No.3

x(k)、x(k+1)の回帰係数が0だった場合に、通常の回帰ではその変数が有意ではないと解釈するが、ダミー変数化しているという事は、変数が効いていないとは解釈できないのので、ではどう解釈するのか?ということでよろしいでしょうか。 このデータでは、x(k)の回帰係数が0ということは、推薦入学と内部進学の差がない(一般入試とは違う)ということで、x(k+1)の回帰係数が0という事は一般入試と推薦入学の差がない(内部進学とは違う)ということになります。 なので、変数としては有意だが、その自由度(?)というのは3つではなく2つになるということでしょう。

全文を見る
すると、全ての回答が全文表示されます。
  • backs
  • ベストアンサー率50% (410/818)
回答No.2

Aさんは一般入試で受験し、試験成績は80とする。 Bさんは推薦入試で受験し、試験成績は60とする。 Cさんは内部進学で受験し、試験成績は70とする。 試験成績を目的変数Y、受験方法を説明変数としてダミー変数を用いて回帰分析をする場合を考える。 [受験者][一般入試][推薦入試][内部進学][試験成績] [Aさん][1][0][0][80] [Bさん][0][1][0][60] [Cさん][0][0][1][70] ダミー変数を導入する場合、分析には任意の列データを削除して行いますが、おそらく質問者さんのいう > 回帰係数が0という仮説 というのは、削除した任意の列データの変数の回帰係数を0とするということでしょう。例えば、一般入試の列データを削除した場合は一般入試で受験した生徒の点数を0(基準)として考えるということです。 もし仮に Y = 0*(一般入試) + 2.35*(推薦入試) + 1.60*(内部進学) という回帰式が求められたのなら、削除した列(=一般入試)の変数よりも推薦入試は2倍ほど試験成績が高かっただろうと判断できるわけです。 まだ私が勘違いしているかもしれないので、誰か他の方、フォローをお願いします。

全文を見る
すると、全ての回答が全文表示されます。
  • backs
  • ベストアンサー率50% (410/818)
回答No.1

> x(k),x(k+1)の回帰係数が0 x(k)とかx(k+1)というのは何なのですか? 私は提示されているデータも何を表しているのか察することができませんでした。もう少し丁寧に状況を説明してもらえるとありがたいですね(単に私の理解力不足なのでしょうが)。

jun-nosuke
質問者

補足

2つともダミー変数です。 例えば、x(k),x(k+1)=(1,0)(0,1)(0,0)のとき、 それぞれの回帰係数は内部進学を基にして、一般入試、推薦入学の学生の平均点がどれほど高いか(あるいは低いか)をあらわしています。

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • ダミー変数を用いた重回帰分析での影響度の比較

    ダミー変数と連続変数の両方を含むデータで、重回帰分析を行おうとしています。その際、各説明変数の目的変数への影響度の大きさに興味があります。 連続変数のみの重回帰分析であれば、標準偏回帰係数の大小で影響度が比較できると思います。 またあるWebページでは、ダミー変数のみの重回帰分析(数量化1類?)では、各アイテム変数のレンジ・単回帰係数・偏回帰係数などで比較をしていました。 しかしダミー変数と連続変数が同時に含まれる場合は、各説明変数の影響の大きさをどのように比較すれば良いのでしょうか。 例えば下記参考URLのWebページで、単価・曜日・天気から売り上げ本数を予測していますが、最後の方で出てくる係数は単価、日~月までの7種類、曇~雨の3種類、の合計11種類の係数が出ています。 これを単価・曜日・天気の3種類の影響度という形にして比較する、という事は可能なのでしょうか。 偏回帰係数とレンジをそのまま比較はできないと思うのですが、方法はあるのでしょうか。 参考URL: http://homepage2.nifty.com/nandemoarchive/toukei_hosoku/tahenryo_jirei_02.htm

  • ダミー変数をともなう回帰係数について

    ダミー変数をともなう回帰係数についての問題がよくわかりません。 平均と人数だけで係数はどのように決まるのでしょうか?                問題は 学生を3つのグループにわけ次のような推計を行った。              IQ=α+β*B+Γ*C  だだしIQは知能指数で、BとC は学生についてのダミー変数である。Bは学生がグループBにはいるとき1をとり、それ以外では0となる。同様にCは学生がグループCに入るとき1をとり、それ以外では0となる。 グループA、B、Cの平均は130、100、115であり それぞれのグループには10人、20人、15人いた。  推計結果 α、β、Γ はどんな値をとるか? よろしく願いします。

  • 回帰係数が1かどうかの検定

    変数xが1増えると変数yも1増える、という仮説を検定した研究で、1に近い回帰係数が得られてt値も低い(例えば1未満)という結果から、この仮説は支持できるというのがありました。これって統計的に正しい推論なのでしょうか。通常だと、例えば係数が正という仮説を検定するために、係数ゼロという帰無仮説を立ててt値が2未満であれば帰無仮説を受容(対立仮説は棄却)し、そして結論を保留する、ということになりますね。ですから先の場合も現状ではなにも言えないということになると思うのですが、それでは係数が1という仮説はどのようにして検定すれば良いのでしょうか。あるいは帰無仮説はどのように立てるのが良いのでしょうか(一般的なのでしょうか)。

  • 回帰分析における回帰係数(α)の意味

    回帰分析における回帰係数(α)の意味 線形回帰式Y=α+βXにおける 定数項αの意味について、2点質問いたします。 (1)定数項αが0以外の数値をとるということは、 被説明変数Yの数値に対して、αは何か影響を 与えていることを表すものでしょうか? (2)αについて仮説検定を行うために、帰無仮説・ 対立仮説をそれぞれ立てたとき、各仮説の意味は 以下の通りになるでしょうか? ・帰無仮説(α=0)→Yの数値に対して影響を与えている変数が他に存在する ・対立仮説(α>0)→Yの数値に対して影響を与えている変数が他に存在しない 当方、数学及び統計学については初学者です。 分かりやすくご教示いただける方からのご回答を お待ちしております。 以上、よろしくお願い申し上げます。

  • 多変数多項式の係数の求め方

    y  = a0 + a11*x1 + a12*x1^2 + a13*x1^3 + ・・・ + a21*x2 + a22*x2^2 + a23*x2^3 + ・・・      ・      ・ 上記のような多変数多項式の各係数をエクセル2007で求めようとしているのですが、 やり方がわかりません。 単変数や1次の多変数の係数は、LINEST関数や回帰解析ツールを使えば、 求められることが分かったのですが、多変数多項式の各係数はどのようにして求めるのでしょうか。 どなたかご教授いただけると助かります。

  • 独立変数(複数存在)が、従属変数に対しておよぼす影響の大きさ

    独立変数(複数存在)が、従属変数に対しておよぼす影響の大きさを知りたいのですが、以下のどちらの方法を適用すればよいのでしょうか。つまり、個々の独立変数ごとに従属変数の変動に占める影響割合(%)を知りたいのです。 第一の方法は、重回帰分析を行い、その偏回帰係数を標準化して(つまり、標準偏回帰係数)、その標準偏回帰係数の大きさによって、影響の大きさを比較する。 第二の方法は、分散分析のうち一般線形モデルを使用する方法です。ここで一般線形モデルとは、私が使用している統計ソフトの定義によると、独立変数としてカテゴリーデータと計量データを同時にモデルに含めることができます(ただし、モデルに含める計量データはcovariatesとして指定することになっています)。 この方法でアプローチした場合、従属変数の全変動(つまり平方和)を独立変数ごとに分解するので、その(平方和の)比率で影響の大きさを比較できます。 実際の例(カテゴリーデータと計量データを含む)を使って、上述のふたつの方法で計算してみたところ、異なる値になってしまいました。結局、どちらが正しいのかわかりません。 よろしくお願いします。

  • 重回帰分析について

    重回帰分析についての質問です *学生本人、その父親・母親の身長および性別 身長  性別(X) 父の身長(X2) 母の身長(X3) 176 1     174      166 173 1     169      160  ・  ・      ・        ・  ・  ・      ・        ・  ・  ・      ・        ・ というデータがあるとします。説明関数xが性別のダミー変数で男なら1女なら0の値をとる。変回帰分析係数β^1の値からどの様なことが読み取れますか?

  • 【エクセル2010での回帰分析】

    現在エクセルでの回帰分析に取り組んでいるのですが、おかしな結果になってしまいます。 原因がわかる方いらっしゃいましたら、ご教授いただけないでしょうか。 回帰分析は説明変数2つ、ダミー変数5つ、観測数466で行っています。 添付画像のように、 概要のうち、一つの変数の係数・標準誤差が0、tが65535、P-値が#NUM!になってしまい、 その一つ下の行の変数が、P-値が同様に#NUM!になってしまいます。 また、説明変数とダミー変数の種類・数を変えて回帰分析を行うと、変数の数が多いときに、この現象(変数のうち一つが係数・標準誤差・t・P-値がおかしな値になり、その下の行の変数のP-値が#NUM!になる)が生じます。 このような場合 どういった原因が考えられ、対策としてはなにが必要でしょうか? よろしくお願いいたします。

  • 重回帰分析について

    重回帰分析を用いて、性別を調整した解析を行いたいのですが・・・ 結果の見方がわかりません。 男を1、女を0というダミー変数にし、解析を行っています。 それによって、得られた標準化偏回帰係数が-(-)を示しているときは、男性の方が負の影響を与えているのか・・・それとも女性に負の影響を与えているのかわかりません。 また、調整するためのダミー変数ならば、得られた数値は無視して他の独立変数の値を見ればよいのか・・・どのように解釈したらよいのかわかりません。 統計に詳しいかたがいましたら、お願いします。

  • 回帰 説明変数について

    いつもお世話になっております。 ある論文を読んでいて不思議に感じたので,そのことに関して伺いたく存じます。 時系列回帰にてある推定期間を用いてy=a+bx1+cx2という回帰式でa,bおよびcの推定します。 それらのa,b,cを用いて,y=a+bx1+c(x2+x3)と説明変数の一部を変更してyの期待値を算出していました。 このように回帰式で用いた説明変数を加工して、期待値を算出することには問題はないのでしょうか? ご存知の方がいらっしゃいましたら,ご教示のほどよろしくお願いいたします。 なお、係数にハットを付さなければならない箇所がありますが,^を用いれば指数とミスリードする可能性があるので割愛しております。