• 締切済み

係数データの正規化

E-VIEWSによる重回帰分析を行おうとしている者です。 事前に係数データを標準化しようと思いましたが、そのやり方が分からず、 もしご存じの方がいらしたら、是非、教えて下さい。 標準偏回帰係数?を求めればよいのでしょうか? どうぞ宜しくお願いします。

みんなの回答

  • alice_44
  • ベストアンサー率44% (2109/4759)
回答No.1

単に回帰式が欲しいだけであれば、データの標準化は不要です。 それより、前処理としては、各説明変数間の相関係数を求めて、 高い相関を持つものがないか確認し、あれば、その一方を 重回帰から外しておいたほうがよい。(多重共線性の除去) 得られた偏回帰係数を、その説明変数の寄与度と解釈したいなら、 各説明変数ごとに 標準化値 = (測定値 - 平均)/標準偏差 で 標準化しておけばよいです。

gomasan55
質問者

お礼

御礼が遅くなり、申し訳ございませんが、 この度は有難うございました。 ご指摘の通り、多重共線性も意識してデータを扱いたいと思います。 引き続きどうぞ宜しくお願いします。

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • 重回帰分析の偏回帰係数についての質問です。

    重回帰分析の偏回帰係数についての質問です。 分析で重回帰分析をやっていたのですが、 偏回帰係数がどのくらいの値をとったらそれが有意な偏回帰係数であるかがわかりません。 どなたか教えてください。

  • SPSSと標準偏回帰係数

    SPSSの重回帰分析で悩んでいます。解る方がいたら教えてください。データから、従属変数を決定し、独立変数も決定しましたが、標準偏回帰係数の求め方が解りません。違った表現なのかもしれませんが、知識が明るくないので解りません。また、その操作法も教えていただければありがたいです。お願いします。

  • エクセルで標準化偏回帰係数を求めたい

    いつもお世話になっております。 有る事象を説明するために大昔聞いたことが有る重回帰分析による複数の要因の影響の大小比較(項目の寄与率の数値化)をやってみようとNETで調べまくり、エクセルのアドインのインストールから初めて、どうやら私は「標準偏回帰係数を求めたい」というところまで分かったのですがエクセルの回帰分析の結果では当該項目が表示されていません。 言葉の定義をアレコレ調べたところ、エクセルでは何故かこの項目は算出されない、とのショックな事態。 但し、下記の式で計算できるとのことなのですが、この式の項目がエクセルの回帰分析結果のどの項目に該当するか分からず調べてみても同じページの堂々巡り状態。 標準偏回帰係数=偏回帰係数×説明変数の標準偏差÷目的変数の標準偏差 どなたか各項目が、エクセルの回帰分析結果に表示されているどの項目に該当するのか教えていただたく。 調べれば調べるほど意味不明となりつつあり、 >標準偏回帰係数は重回帰式における各変数の重要性を表す指標であり、標準化偏回帰係数どうしの大小を比較できます。 という表記が有るのですが、標準偏回帰係数と標準化偏回帰係数は意味が違うのでしょうか? このレベルですのでご了承の上よろしくお願い致します。 またもっと簡単に求める方法があればぜひお願いします。 <エクセルの分析結果で表示される項目> <回帰統計> 重相関  重決定 R2 補正 R2 標準誤差 3  観測数 <分散分析表>     自由度 変動 分散 観測された分散比 有意 F 回帰 3 残差 43 合計 46 係数  標準誤差 t P-値 下限 95% 上限 95% 下限 95.0% 上限 95.0%

  • 2つの重回帰分析結果の標準偏回帰係数の有意差

    2つのデータ集合(目的変数Y、説明変数X1,X2)について重回帰分析をそれぞれ行い、2つの回帰式を得ます。その結果求められたX1の標準偏回帰係数が、2つの回帰式間で変化したこと調べるには、検定が必要でしょうか?また、必要な場合、どのような検定を行えばよいでしょうか? 色々調べてみたのですが、わからず困っています。教えていただけると本当に助かります。どうぞよろしくお願い申し上げます。

  • 重回帰分析の変数についての疑問

    重回帰分析を行いたいのですが、説明変数(独立変数)に性別などの2択の変数があります。 目的変数(従属変数)は、完全な数量データなのですが、、、、 説明変数も数量データでなければならないのですよね??? しかし、過去の論文などを参考に見ていたら独立変数に性別があり、男=1、女=0とか書いてあるのです。。。 それでいいの? 多変量解析の初心者なので、変な質問かもしれません。 目的変数=(標準偏回帰係数)*説明変数1+(標準偏回帰係数)*説明変数2+・・・+定数 の回帰方程式ですよね。 あと、それぞれの標準偏回帰係数の横にt値や有意確率が算出されますが、これは何? あと、論文の表記のやり方として何をどう記せばいいのですか? 独立変数 標準偏回帰係数をそれぞれ縦に記して、RやR^2を最後の行に記せばいいの? tや有意確率も記すの?というか、これは何? 色々とわからないのですが、どれか一つでも答えをお願いします。 教えてください。

  • 重回帰分析の定数は、どっちの係数の式に当てはまる?

    そういえば、重回帰分析の結果で非標準化回帰係数と標準化回帰係数とがありますね。 標準化の方は、単位関係なく係数の重みを比べることができると解釈しています。 ですが、予測値Yを計算するときは、非標準化回帰係数の方で出すのが一般的なのですよね? 実は、結果の出力に標準化回帰係数のところには(定数)の値が表示されないのです。 定数は、非標準化係数の欄には表示されているのですが。。。 例えば、↓ http://www.u-gakugei.ac.jp/~kishilab/spss-mra.htm この場合、論文の表記には非標準化回帰係数の方を記したほうがいいのでしょうか? そうでないと、(標準化の方を記したら)定数を書いたら予測値Yの式が違うことになりますよね? あと、論文にはY=(非標準化係数1)*X1+(非標準化係数2)*X2+・・・+(定数)という数式も記入するのですか?

  • 標準偏回帰係数について

    標準偏回帰係数のデータから、被説明変数を予測したいのですが、 切片がわかりません。 切片がわからない中で、被説明変数をどのようにすれば求められるでしょうか。

  • 標準化係数と非標準化係数

    お世話になります7772です。重回帰分析での標準化係数、非標準化係数の意味合いは、標準化係数が、ある変数が他の変数に比べてどのように影響しているかを比べるもので、非標準化係数が、他の変数の影響を一定にして、一つの変数にのみ絞ったその変数の全体への影響を示したものと認識しています。  私が疑問に思うのは、これらの係数が負の値をとるときです。そのときは正の値のものよりも影響しないということでしょうか?具体的には、標準化係数が0.2のものと-3.3のものでは、0.2のほうがより影響していると言うことなのでしょうか?  それとも、判断は絶対値で行い、上のような場合、-3.3のほうが影響しているけれど、それは変数が増えれば全体が増えるのではなく、変数が増えると全体が減る。の用に影響していると言う意味合いなのでしょうか?

  • 独立変数(複数存在)が、従属変数に対しておよぼす影響の大きさ

    独立変数(複数存在)が、従属変数に対しておよぼす影響の大きさを知りたいのですが、以下のどちらの方法を適用すればよいのでしょうか。つまり、個々の独立変数ごとに従属変数の変動に占める影響割合(%)を知りたいのです。 第一の方法は、重回帰分析を行い、その偏回帰係数を標準化して(つまり、標準偏回帰係数)、その標準偏回帰係数の大きさによって、影響の大きさを比較する。 第二の方法は、分散分析のうち一般線形モデルを使用する方法です。ここで一般線形モデルとは、私が使用している統計ソフトの定義によると、独立変数としてカテゴリーデータと計量データを同時にモデルに含めることができます(ただし、モデルに含める計量データはcovariatesとして指定することになっています)。 この方法でアプローチした場合、従属変数の全変動(つまり平方和)を独立変数ごとに分解するので、その(平方和の)比率で影響の大きさを比較できます。 実際の例(カテゴリーデータと計量データを含む)を使って、上述のふたつの方法で計算してみたところ、異なる値になってしまいました。結局、どちらが正しいのかわかりません。 よろしくお願いします。

  • 交互作用項の標準偏回帰係数の解釈の仕方について

    重回帰分析などにおいて投入した説明変数の主効果だけではなく,交互作用についても検討したい場合,二変数を掛け合わせた交互作用項を投入するものかと思いますが,その分析結果における標準偏回帰係数の解釈の仕方がいまいちよく分かりません。 主効果と同様,プラスであれば従属変数のプラスに寄与し,マイナスであればその逆であろうと思われますが,交互作用の検討として用いた説明変数1と説明変数2の関係はどうなっているのでしょうか? 符号のプラスやマイナスと関係あるのでしょうか? どなたかご存知の方がおられましたら,ご教授ください。 よろしくお願いいたします。