高次の重回帰式について

このQ&Aのポイント
  • 多変量解析における高次の重回帰式について困っています。教科書やインターネットで調べても情報が見つからず、どのように作成すれば良いか分かりません。
  • 変数が1次の重回帰式は多くの資料で紹介されていますが、私が作ろうとしている高次の重回帰式については情報がほとんどありません。
  • 現在、x1、x2、x3の3変数に対する重回帰式を作成しようとしていますが、実際の値と一致しません。どのように修正すれば良いのか教えてください。
回答を見る
  • ベストアンサー

高次の重回帰式について

多変量解析を行なっているのですが教科書などを見ても見つからなかったので教えてください. 現在,3変数x1,x2,x3の重回帰式を作ろうとしています. 多変量解析は初めてなのでとりあえず,教科書に載っている方法を真似てみました. まず各変数と目的変数yについての単回帰式は,最小二乗法によって係数a~lを求めて y(x1) = a*x1^3+b*x1^2+c*x1+d y(x2) = e*x2^3+f*x2^2+g*x2+h y(x3) = i*x3^3+j*x3^2+k*x3+l という式が,実際の値とよく一致していることがわかりました. そこで重回帰式として y(x1,x2,x3) = a*x1^3+b*x2^3+c*x3^3+d*x1^2+e*x2^2+f*x3^2+g*x1+h*x2+i*x3+j というモデルを作ったのですが,実際の値と一致しません. 本やインターネットに載っている重回帰式はほとんどが y(x1,x2,x3) = a*x1+b*x2+c*x3+d といった,変数が1次の式ばかりで,私が作ったような重回帰式は載っていたとしても「高次回帰式である.」のようにさらっと書かれているだけでした. そのため何が悪いのか,どうすれば良いのか全くわからなくて困ってます.どなたか教えてください!お願いします.

  • vyn
  • お礼率100% (1/1)

質問者が選んだベストアンサー

  • ベストアンサー
  • ramayana
  • ベストアンサー率75% (215/285)
回答No.1

x1^3、x2^3、x3^3、x1^2、x2^2、x3^2、x1、x2、x3の9個を説明変数とする、線形多重回帰式を最小二乗法で推計すればよいのではないでしょうか。 x1^3、x1^2、x1などに関数関係があるのが気持ち悪いと思われるかもしれません。しかし説明変数どうしに関数関係があっても、それが多重共線性でない限り、最小二乗法の理論は有効です。 ただ、これだけ説明変数が多いと、多重共線性が起こりやすいので、警戒する必要があります。それをチェックする意味でも、推計後に係数の有意性を確かめることが必須です。

vyn
質問者

お礼

>> x1^3、x1^2、x1などに関数関係があるのが気持ち悪いと思われるかもしれません。しかし説明変数どうしに関数関係があっても、それが多重共線性でない限り、最小二乗法の理論は有効です。 このような状況でも最小二乗法は使えるのですね.どのような場合にどの理論が適用できるかの知識がほとんど無いので助かります. >>説明変数が多いと、多重共線性が起こりやすいので、警戒する必要があります。それをチェックする意味でも、推計後に係数の有意性を確かめることが必須です。 わかりました.確かめてみます. 回答していただき,ありがとうございます.

関連するQ&A

  • 重回帰分析かロジスティク分析か?

    多変量解析で、教えてください。 20人のケースで、Xという現象がー100~100%の幅で、増減したとして、事象A,B,C,D.E.Fが関与しているかどうかを調べるとします。 それぞれが、それぞれA~Fの現象と、変動率を散布図にて、表示すると、A,B.Cで相関があり、相関係数は R=±0.4~0.7でした。D,E.Fは、r=0.2以下でした。 単回帰分析をすると、要因A,B,Cでの回帰式は、有意とされました。A,B.Cの要因がどの程度のつよさで、Xという現象に関与しているかを調べる必要があるとすると、多変量解析をする必要があると思いますが、 その方法論として、X現象に対する重回帰分析が良いのか、X現象が増加するか、減少するかという現象に置き換えて、ロジスティク回帰分析の方が良いでしょうか? それとも、症例数から言うと多変量解析は無意味でしょうか? また、もし重回帰分析、ロジスティク回帰するとすると、A~F全て組み込むのか、単回帰で、有意だったA~Cだけで良いのでしょうか? 見よう見まねで、A~Cだけで重回帰すると、分散分析ではすべて有意でしたが、回帰式では、A,Bの組み合わせでは、A、B共に有意、A~Cの組み合わせだと、Aだけ有意とでました。この所見の記載として、 単変量解析では、A,B,Cが有意だったが、多変量解析では、Aのみが有意であるとして良いのでしょうか?

  • 原点を通る重回帰式の偏回帰係数

    はじめまして。 目的変数に対し、3つの説明変数を持つ資料があり、原点を通る重回帰式をたてたいところです。Excelなど、計算機の機能によって答えはわかっているのですが、式を作る計算過程を説明する資料を作らなければならなくなりました。 Y = aX+ bW + cZ Y: 目的変数 X:説明変数1 W:説明変数2 Z:説明変数3 a,b,c : 偏回帰係数 について、残差平方和 {Σ(Yi - ( aXi + bWi + cZi ))}^2を最小にするa,b,cを求めたいのです。残差平方和に対し、a,b,cで偏微分するといいのだ・・・などという理論は概ねわかりますが、私の数学力では、実際に計算過程を書き表すことができません。 説明変数が2つで、原点を通らない重回帰式の偏回帰係数の計算方法については、たとえば、以下のURLに書き表した例があります。 http://aoki2.si.gunma-u.ac.jp/lecture/Regression/mreg/mreg1.html このような書き表しの例で、説明変数が3つで、原点を通る重回帰式の偏回帰係数の計算方法をご紹介、またはご提示いただけないでしょうか。 どうかよろしくお願いいたします。

  • 重回帰分析のやり方について教えて下さい。ど素人的な質問で恐縮なのですが

    重回帰分析のやり方について教えて下さい。ど素人的な質問で恐縮なのですが、重回帰分析は、目的変数(Y)を、説明変数 X1, X2, X3, X4.....X20などに影響されるか否かを検討しますよね。ここで、私がしようとしている統計学的処理と類似した研究の論文などを読んだりとかしていると、YとX1, YとX2, YとX3, YとX4.....YとX20の単回帰分析を各々行い、ここで有意な相関があったものを取り上げて(例えば、X1, X4, X7, X12, X18, X20の6個など)、この6個について、重回帰分析を施行して、ここで、X4, X18は有意でないといった結果が出たなら、Y=aX1+bX7+cX12+dX20という重回帰式を作成し、標準偏回帰係数を算出し、どの説明係数が最も目的変数に影響を与えているのか解析しているのですが、これが正しい方法(進め方)なのでしょうか? いきなり、YとX1~X20を重回帰分析したのは、どうでしょうか?これはダメなのでしょうか?単回帰分析では相関が有意にでない(他の説明変数の影響のために)けれども、重回帰分析では有意な結果となるような説明変数が無視されるような結果になるように思うのですが、どうでしょうか? 非常に低レベルな話しで申し訳ないのですが、お教え下さい。

  • おしえて!重回帰分析の独立変数(説明変数)

    重回帰分析の目的変数が、(A+B+C+D)というものとします。 A~Dは、数量データです。 説明変数にAやBなどが入っていたら、それはダメですか? 説明変数X(Aとか)が目的変数Y(A+B+C+D)の一部の構成要素だったら、Xを使って重回帰分析はやったらダメなのですか?

  • 原点を通る重回帰式について

    重回帰式Y=α+βX1+・・・・という線形回帰を使っているのですが 定数項が大きく+、-に振れたりしてこまっています。 サンプル数が少ないからぶれるのは仕方ないのですが どうすれば計算上α(定数項)をゼロにすることができるんですか。 教えてください。 ちなみに、変数は4変数、一次で、各係数は今後サンプルを増やせば +になるという条件でお願いいたします。

  • 単回帰分析と重回帰分析の結果の違い

    論文を読んでいて疑問に思うことがありました.よろしくお願いします. 私は,回帰分析とは変数Yを、p個の変数X1,X2 ,… Xpにより説明したり予測するための統計的手法であり,p=1のときは単回帰分析,p>1のときは重回帰分析と呼ぶ,と解釈しています. 今,ある施設のサービス改善についての調査論文を読んでおります.そこではアンケート調査でその施設のサービスの総合評価Yと,8個の各サービス毎の評価(x1~x8)を調べ,総合評価Yを従属変数, x1~x8を説明変数として重回帰分析にかけます.そして出た相関係数から施設の総合評価に対する各サービスの重要度を求め,改善につなげようとしています. 結果,重要度は x1>x2>x6>x3>x7>x8>x4>x5 という結果になりました.ここまではわかるんです. ですが次に総合評価Yを従属変数,x1を説明変数として単回帰分析,また総合評価Yを従属変数,x2を説明変数として単回帰分析,また総合評価Yを従属変数,x3を説明変数として単回帰分析・・・というようにこの操作をx8まで続け,出た相関係数を比較しています.結果は x1>x2>x4>x8>x3>x5>x7=x6 となっており,重回帰分析の結果と照らしあわせると最初のx1とx2は合致しているものの,あとはバラバラです.x6にいたっては最後にきています.なぜでしょうか.論文は「どのサービスも総合満足度に重要な影響を与えており,特にx1,x2,x3,x4を改善するのがよい」 と締めくくっています. 質問は3点です. (1)なぜ重回帰分析の結果と単回帰分析の結果が異なるのか (2)どのサービスも総合満足度に重要な影響があるとして,それは重回帰分析の結果だけで言えるのではないか(重回帰でも相関係数は出ているし,単回帰分析をする意味はあるのか) 稚文ですみません. 当方あまりオツムがよろしくないのでできるだけわかりやすくよろしくお願いします.

  • 2つの重回帰分析結果の標準偏回帰係数の有意差

    2つのデータ集合(目的変数Y、説明変数X1,X2)について重回帰分析をそれぞれ行い、2つの回帰式を得ます。その結果求められたX1の標準偏回帰係数が、2つの回帰式間で変化したこと調べるには、検定が必要でしょうか?また、必要な場合、どのような検定を行えばよいでしょうか? 色々調べてみたのですが、わからず困っています。教えていただけると本当に助かります。どうぞよろしくお願い申し上げます。

  • 重回帰分析?

    二つの変数があり、各々従属変数に対して単回帰分析を行うと決定係数が0.5と0.4ぐらいの感じになります。この二つの変数をくっつけてもう少し精度を上げたいのですが、一方は線形なんですが、もう片方が非線形(指数関数)なのです。 たしか、重回帰分析は線形どうしでしかくっつけることができなかったような気がするのですが、どのようにしたらできるでしょうか? 混合モデルとかを使ったらよいのでしょうか??? 理論的に考えると Y=aX1 + bexp(cX2) かY=aX1 + bX1exp(cX2)と思うのです Yが従属変数X1,X2が変数、a,b,cがそれぞれ係数です。 使用できるソフトはSPSS,SAS,mintab,S-plus,R,excelです。Rでのが使い慣れているのでRでできるとよいのですが、できるならどのソフトでもかまいません。

  • 従属変数が名義尺度かつ複数事象の重回帰分析

    多変量解析の勉強をしている者です。 従属変数が名義尺度の場合の重回帰分析は、ロジスティック回帰分析を用い、その事象の発生確率において回帰式のようなものを作れるということを勉強しました。 ですが、この方法では事象Aが[発生する/発生しない]のどちらの確立が高いか分かっても、事象Aと事象Bと事象Cのどれが一番発生確率が高いかは分かりませんよね。 この、「事象Aと事象Bと事象Cのどれが一番発生確率が高いか」というのを回帰式のように表す方法はないのでしょうか。 出来れば、3つの事象だけでなく、もっと複数の事象において回帰式を作りたいと考えています。 わかりにくい文章で申し訳ありません。 どうぞよろしくお願い致します。

  • 重回帰がわかりません

    3変量の重回帰のためのデータを作り、正規方程式を導き、重回帰式を決定せよ (1,1,2,3,5,7)から5点を選び、うち3点が重回帰式が表す平面上にあるようにし、他の2点については2乗誤差が1となるようにせよ。 という問題が全く分かりません どうか解答と解説までお願いします