• ベストアンサー

回帰係数が頑健であるとは?

回帰係数が頑健であるという表現があります。 なんとなく、「回帰係数はサンプルデータによってぶれが出てくるが、頑健である回帰係数とはその中でも『正しい』値に比較的近いものを指す」ということかと理解しているのですが、具体的にはどういう場合に頑健であると言えるのでしょうか?

質問者が選んだベストアンサー

  • ベストアンサー
回答No.1

言葉尻を捕らえるようで,申し訳ありませんが,何かの本などに,回帰の「係数」の頑健性,と書いてありますか? 統計学で言う,頑健性(robustness)は,通常,手法について言う用語です。 例えば,検定の頑健性とか推定の頑健性,とか言う時です。 ですから,係数の頑健性ではなく,係数を推定するときの頑健性,が問題となってきます。 通常,回帰では,最小2乗法が使われます。 しかし,これには,例えば,データが(それゆえ,誤差も),正規分布している必要があります。 しかし,現実データは,そうではないことが多いのです。 そのような前提条件が多少崩れても,実質的に問題なく,係数推定ができれば,それを「頑健」(頑健な推定)と言います。 このような,正規性からのズレの影響は,t検定など,パラメトリックな検定には,しばしば生じる問題です。 例えば,下記の論文なども参考になるでしょう。 原田 桂一郎 線型回帰モデルの頑健推定に関する一考察 http://libw01.kokushikan.ac.jp/data/002726/0000/registfile/0586_9749_059_04.pdf

tsurukichi
質問者

お礼

ありがとうございました。 こちらの説明のほうが分かりやすいですね。 もともとこの表現を見つけた論文は図書館に反してしまったのですが、別の論文で「~の関係を調べたところ、その弾力性が1であるという帰無仮説を棄却できない頑健な結果を得ている」という表現がありました。 何となく経済学の世界では慣行的に使われている表現かもしれません。 以下のような指摘もウェブで見つけました。 日常用語とは言えない「頑健性」という表現は, 経済分析の分野では明確な定義を意識することな く使われているように見受けられる.ある期間の 経済分析を,その前後の期間に適用してみて,そ の結果が大きく異なるかどうかを確認することは 分析の姿勢として重要である.しかし,その結果 を報告するのに「ロバスト(頑健)である」とい う表現を用いられると,違和感がある http://www.econ.aoyama.ac.jp/~yasuto_yoshizoe/econstat/stat200809.pdf

関連するQ&A

  • 重回帰分析の偏回帰係数についての質問です。

    重回帰分析の偏回帰係数についての質問です。 分析で重回帰分析をやっていたのですが、 偏回帰係数がどのくらいの値をとったらそれが有意な偏回帰係数であるかがわかりません。 どなたか教えてください。

  • SPSSと標準偏回帰係数

    SPSSの重回帰分析で悩んでいます。解る方がいたら教えてください。データから、従属変数を決定し、独立変数も決定しましたが、標準偏回帰係数の求め方が解りません。違った表現なのかもしれませんが、知識が明るくないので解りません。また、その操作法も教えていただければありがたいです。お願いします。

  • 相関係数と回帰分析

    大学でSPSSの使い方の授業を受けていますがわからないことがあるので教えてください。 私は都道府県別のコンビニの数について調べようと思いました。 ・コンビニ数と人口 ・コンビニ数と県民所得 ・コンビニ数と県内総生産 という3つの関係について調べています。 先生から教えていただいた内容ですと・・・ 相関係数を求める⇒回帰分析を行う⇒t検定をする という順番で分析すると教えて頂きました。 しかし、この場合は、 相関係数は3つそれぞれ求めてから1度の重回帰分析をしたらよいのか、それともそれぞれを回帰分析したらよいのかわかりません。 また、相関係数を求めて相関がない(0)となった場合であっても回帰分析は行うものなのでしょうか? SPSSは勉強開始したばかりなのでなかなか理解できません。 また、分析の仕方についてアドバイスありましたらよろしくお願いします。 どうか教えてください。

  • 標準偏回帰係数について

    標準偏回帰係数のデータから、被説明変数を予測したいのですが、 切片がわかりません。 切片がわからない中で、被説明変数をどのようにすれば求められるでしょうか。

  • 回帰関係の有意性と回帰係数の有意性の意味

    「回帰関係の有意性」と「回帰係数の有意性」についての質問です。 この2つなんですが、それぞれ何故こんなことをするのでしょうか? また何がわかるのでしょうか? 式を見たりしてもイマイチ理解ができず、困っています。 簡潔に説明して頂けると大変有り難いです(><;) よろしくお願いします。

  • エクセルで標準化偏回帰係数を求めたい

    いつもお世話になっております。 有る事象を説明するために大昔聞いたことが有る重回帰分析による複数の要因の影響の大小比較(項目の寄与率の数値化)をやってみようとNETで調べまくり、エクセルのアドインのインストールから初めて、どうやら私は「標準偏回帰係数を求めたい」というところまで分かったのですがエクセルの回帰分析の結果では当該項目が表示されていません。 言葉の定義をアレコレ調べたところ、エクセルでは何故かこの項目は算出されない、とのショックな事態。 但し、下記の式で計算できるとのことなのですが、この式の項目がエクセルの回帰分析結果のどの項目に該当するか分からず調べてみても同じページの堂々巡り状態。 標準偏回帰係数=偏回帰係数×説明変数の標準偏差÷目的変数の標準偏差 どなたか各項目が、エクセルの回帰分析結果に表示されているどの項目に該当するのか教えていただたく。 調べれば調べるほど意味不明となりつつあり、 >標準偏回帰係数は重回帰式における各変数の重要性を表す指標であり、標準化偏回帰係数どうしの大小を比較できます。 という表記が有るのですが、標準偏回帰係数と標準化偏回帰係数は意味が違うのでしょうか? このレベルですのでご了承の上よろしくお願い致します。 またもっと簡単に求める方法があればぜひお願いします。 <エクセルの分析結果で表示される項目> <回帰統計> 重相関  重決定 R2 補正 R2 標準誤差 3  観測数 <分散分析表>     自由度 変動 分散 観測された分散比 有意 F 回帰 3 残差 43 合計 46 係数  標準誤差 t P-値 下限 95% 上限 95% 下限 95.0% 上限 95.0%

  • 重回帰分析の定数は、どっちの係数の式に当てはまる?

    そういえば、重回帰分析の結果で非標準化回帰係数と標準化回帰係数とがありますね。 標準化の方は、単位関係なく係数の重みを比べることができると解釈しています。 ですが、予測値Yを計算するときは、非標準化回帰係数の方で出すのが一般的なのですよね? 実は、結果の出力に標準化回帰係数のところには(定数)の値が表示されないのです。 定数は、非標準化係数の欄には表示されているのですが。。。 例えば、↓ http://www.u-gakugei.ac.jp/~kishilab/spss-mra.htm この場合、論文の表記には非標準化回帰係数の方を記したほうがいいのでしょうか? そうでないと、(標準化の方を記したら)定数を書いたら予測値Yの式が違うことになりますよね? あと、論文にはY=(非標準化係数1)*X1+(非標準化係数2)*X2+・・・+(定数)という数式も記入するのですか?

  • 基準化したデータより得られた回帰式に新たな説明変数を代入する際の取り扱いについて

    基準化したデータより得られた回帰式に新たな説明変数の数値を代入し、従属変数の数値を計算(予測)する際、その代入される説明変数も基準化されている必要があると思いますが、その基準化の方法はどのように行えばよいのでしょうか? 例えば、サンプル数10、従属変数1、説明変数4というデータセットがあり、全変数を基準化し回帰係数を求めたとします。 得られた回帰式を用い新しいデータの説明変数の数値を代入することにより説明変数の値を予測したいと思います。 この際、この新たなデータも基準化される必要があると思うのですが、基準化する際には回帰係数を求めるために用いた10個のサンプルより計算された各説明変数の平均及び標準偏差を用いて、基準化を行うのでしょうか? 具体的には10個のサンプルから計算された説明変数a,b,c,dの平均がそれぞれ2,4,6,8、及び標準偏差が10,20,30,40であったとします。 新たなデータの説明変数a,b,c,dの値が3,6,9,12であった場合は、それぞれ(3-2)/10, (6-4)/20, (9-6)/30, (12-8)/40の値を計算し、その数値を回帰式に代入するのでしょうか? 長くなってしまい申し訳ありませんが、どなたか詳しい方がいましたら是非教えていただきたくお願いします。

  • 重回帰分析の回帰係数について

    重回帰モデル:Y = X b + ε の回帰係数の導出について調べているのですが,本やサイトによって,次の2通りの表現があります。  b = (X'・X)^(-1)・X'・Y (I)  b = Cxx^(-1)・Cxy (II) ただし,'は転置,^(-1)は逆行列,・は積を表しています。また,CxxはXの分散共分散行列,CxyはXとYの共分散ベクトルです。 どうして(I)と(II)の表現はイコールになるのでしょうか?教えて頂ければ幸いです。

  • 単回帰について

    今単回帰について勉強しています。 データはそれぞれ(x,y)=(170,60),(175,80),(165,60),(160,65)として回帰直線と決定係数の求め方を教えてください。なお、エクセルは使わないやり方でお願いします。 初心者なため読みづらいかもしれませんが、どうかよろしくお願いします。