• 締切済み

モデル間の係数比較

多重ロジスティック回帰について、2点質問があります。 具体的には、z=1/(1+exp(-(a+bx+cy)))の回帰式について質問です。 同じ属性のデータから上記の回帰式でモデルを2つ作ったとき、 それぞれの係数(a1とa2,b1とb2,c1とc2)に有意な差があるかどうかを 調べる方法はありますか?また、無償での便利なツールはありますか? (分散分析?共分散構造分析?) より一般的に、2つのモデル間で偏回帰係数に有意な差があるかどうかを検定する方法を知りたく思っております。どうぞ宜しくお願い申し上げます。

  • dmc
  • お礼率100% (5/5)

みんなの回答

  • solla
  • ベストアンサー率59% (45/76)
回答No.2

#1です。 特に○○法のような呼び方はないと思います。やっていることは通常の回帰モデルの分析なので。 回帰パラメータの差の検定については、共分散分析について解説している部分に書かれていることが多いですが、先の回答のように交互作用項の扱いとして明示的に書いてあるのは私の知る限り「SASによる実験データの解析」(東大出版会)の第7章くらいででしょうか。 参考になれば幸いです。

dmc
質問者

お礼

アドバイス頂き、誠に有り難うございました。 専門書の選定はなかなか難しいので、大変助かりました。 早速、勉強してみたいと思います。 取り急ぎ、御礼申し上げます。

  • solla
  • ベストアンサー率59% (45/76)
回答No.1

> 同じ属性のデータから上記の回帰式でモデルを2つ作ったとき、 というのがいまひとつはっきりしませんが、2組のデータがあって、それぞれに同じモデルを適用して分析したとき、ということでよろしいでしょうか。 それでしたら、2組のデータを一緒にして分析します。ただしそれぞれの組のデータを識別するダミー変数を作成してそのダミー変数および他の変数とダミー変数との交互作用をモデルに入れます。そうすると交互作用の回帰係数の有意確率が、組間でのその変数の回帰係数の差の有意確率に相当します。これはロジスティック回帰を含む一般線形モデル全般で使えます。 例えばAとBという2組のグループからのデータがあってxとyを説明変数として回帰モデルを適用するとします。まずそれぞれのデータにAのデータならd=0、Bのデータならd=1となるダミー変数dを用意してx、y、d、xとdの交互作用、yとdの交互作用を説明変数として全てのデータを使って分析します。結果、xとdの交互作用に関する有意確率が、AとBでxの回帰係数が等しいという帰無仮説を検定した結果に相当します。yも同様です。 あと、フリーの分析ツールというとやはりRでしょうか。

dmc
質問者

お礼

大変わかりやすく、詳細なご回答を頂きまして、 誠にありがとうございます。 幸い、回帰の方ではRを使っておりますので、 早速試してみたいと思います。 取り急ぎ御礼申し上げます。

dmc
質問者

補足

今回は前提となる説明が不足しており申し訳ありません。 改めて御礼申し上げます。 参考までに、上記の方法に関して「・・法」というような 一般的な呼称はございますでしょうか。 また、上記のような方法を勉強できる書籍などございましたら、 是非ご教示頂けないでしょうか。 自分では今、以下のような本を中心に勉強しています。 ・「統計科学のフロンティア3-モデル選択」(岩波書店) ・「自然科学の統計学」(東京大学出版会) ・「工学のためのデータサイエンス入門」(数理工学社) どうぞ宜しくお願い申し上げます。

関連するQ&A

  • 重回帰分析かロジスティク分析か?

    多変量解析で、教えてください。 20人のケースで、Xという現象がー100~100%の幅で、増減したとして、事象A,B,C,D.E.Fが関与しているかどうかを調べるとします。 それぞれが、それぞれA~Fの現象と、変動率を散布図にて、表示すると、A,B.Cで相関があり、相関係数は R=±0.4~0.7でした。D,E.Fは、r=0.2以下でした。 単回帰分析をすると、要因A,B,Cでの回帰式は、有意とされました。A,B.Cの要因がどの程度のつよさで、Xという現象に関与しているかを調べる必要があるとすると、多変量解析をする必要があると思いますが、 その方法論として、X現象に対する重回帰分析が良いのか、X現象が増加するか、減少するかという現象に置き換えて、ロジスティク回帰分析の方が良いでしょうか? それとも、症例数から言うと多変量解析は無意味でしょうか? また、もし重回帰分析、ロジスティク回帰するとすると、A~F全て組み込むのか、単回帰で、有意だったA~Cだけで良いのでしょうか? 見よう見まねで、A~Cだけで重回帰すると、分散分析ではすべて有意でしたが、回帰式では、A,Bの組み合わせでは、A、B共に有意、A~Cの組み合わせだと、Aだけ有意とでました。この所見の記載として、 単変量解析では、A,B,Cが有意だったが、多変量解析では、Aのみが有意であるとして良いのでしょうか?

  • 統計分析の方法と意味

    下記(1),(2)は5日ごとにA区とB区の値を示したもので、 A区とB区の間に有意差があるのかを調べたいのです。 時間的経過があるので単純に一元配置の分散分析では、おかしいと思い、単回帰分析を行ったところ、理解できない結果が出てきました。結果の意味が十分出来ていないのか、そもそもこのような分析に単回帰分析を用いること自体が間違っているのでしょうか。間違っているなら、正しい分析を教えてください。分析はエクセルで行っています(エクセル統計も入っています)。 統計について全く知識がありませんので、専門用語をあまり使わず、教えてください。 (1)A区 50.4,44.1,34.1,15.8   B区 67.5,46.8,39.5,16.6  一元配置の分散分析を行うと両区に有意差はない。  単回帰分析を行うと5%水準で有意差がある。 単回帰分析の結果は正しい気がする。 (2)A区 12.6,4.2,1.9,1.4   B区 12.0,5.9,2.0,1.0 一元配置の分散分析を行うと両区に有意差はない。  単回帰分析を行うと5%水準で有意差がある。 単回帰分析の結果は変な気がする(有意差がないのが正しいのでは)

  • 共分散構造分析のパス係数について

    現在アンケートを行いその結果を因子分析、共分散構造分析を行っています。解析結果についてわからないことがあるので質問しました。 アンケート調査ではA、B、Cの3つのテーマから質問項目を構成しており、A、B、Cそれぞれの項目で因子分析を行った後、共分散構造分析によりA、B、C全体の因果関係を見ようとしているのですが、ここで全体としてA→B、A→C、B→C(AはCに直接影響を与え、更にBを通して間接的にCにも影響を与える)という因果関係が成り立つと仮説をたてています。 まず共分散構造分析で A→B、 A→C、 B→C、 それぞれの関係を見ていくと適合度は基準を満たしており、パス係数も正の値で全て0.1%有意でした。 しかし、最終モデルとしてA、B、C全ての因果関係を見ていくと適合度は十分だったのですが、A→Cのパス係数が負の値になってしまいました。(A→Cだけで関係をみるとパス係数は正だったのですが、そこにBを加えA→B、B→Cという因果関係を加えるとA→Cのパス係数は負になってしまいました。)パス係数は5%有意でした。 そこで質問なのですが、他の要因が入ることによってパス係数の正負が逆転することはあるのでしょうか?

  • ロジスティック回帰式についての相関係数や決定係数?

    ロジスティック回帰分析についても相関係数や決定係数というのはあるのでしょうか?

  • ロジスティック曲線の係数の意味は?

    ロジスティック曲線の式における係数の意味を教えて下さい。 また、同じ式を2つの形で書かれているのを見かけますが、使い分けなどあるのでしょうか? (bの係数の値がどちらかの形の方が使いやすいなど) i)y=a/(1+b*exp(-cx)) ii)y=a/(1+exp(b-cx)) なんとなくですが、a「yの上限」、b「切片」、c[傾き]に関係していそうなのですが。。。 よろしくお願い致します。

  • 二つの回帰式の係数の差の検定、χ2乗検定

    二つの単回帰式における係数が有意に異なるか、を検定するのにある論文のなかで、χ2乗検定をしているのですが、それがどのようなプロセスを踏んでそのように検定しているのかがわからず、困っています。具体的には、 X(t+1)=a+bX(t)+u(t+1) Y(t+1)=c+dY(t)+v(t+1) という一階のラグを含んだ自己回帰式において、bとdがそれぞれXとYの持続性を表すとして、得られた回帰係数のどちらかが有意に大きいといえるかを検定するというものです。  参考書やウェブを調べたのとですが、これという確信をもてるものがなく、困っています。 χ2乗検定を使っているので、回帰係数の標準誤差の比でF検定?とも考えたのですが、違いますでしょうか。 またエクセルで処理する方法がありましたらご教授いただけますと助かります。 実証研究にお詳しい方、どうかお力をお貸しください。 よろしくお願いいたします。

  • 重回帰分析の偏回帰係数についての質問です。

    重回帰分析の偏回帰係数についての質問です。 分析で重回帰分析をやっていたのですが、 偏回帰係数がどのくらいの値をとったらそれが有意な偏回帰係数であるかがわかりません。 どなたか教えてください。

  • エクセルで標準化偏回帰係数を求めたい

    いつもお世話になっております。 有る事象を説明するために大昔聞いたことが有る重回帰分析による複数の要因の影響の大小比較(項目の寄与率の数値化)をやってみようとNETで調べまくり、エクセルのアドインのインストールから初めて、どうやら私は「標準偏回帰係数を求めたい」というところまで分かったのですがエクセルの回帰分析の結果では当該項目が表示されていません。 言葉の定義をアレコレ調べたところ、エクセルでは何故かこの項目は算出されない、とのショックな事態。 但し、下記の式で計算できるとのことなのですが、この式の項目がエクセルの回帰分析結果のどの項目に該当するか分からず調べてみても同じページの堂々巡り状態。 標準偏回帰係数=偏回帰係数×説明変数の標準偏差÷目的変数の標準偏差 どなたか各項目が、エクセルの回帰分析結果に表示されているどの項目に該当するのか教えていただたく。 調べれば調べるほど意味不明となりつつあり、 >標準偏回帰係数は重回帰式における各変数の重要性を表す指標であり、標準化偏回帰係数どうしの大小を比較できます。 という表記が有るのですが、標準偏回帰係数と標準化偏回帰係数は意味が違うのでしょうか? このレベルですのでご了承の上よろしくお願い致します。 またもっと簡単に求める方法があればぜひお願いします。 <エクセルの分析結果で表示される項目> <回帰統計> 重相関  重決定 R2 補正 R2 標準誤差 3  観測数 <分散分析表>     自由度 変動 分散 観測された分散比 有意 F 回帰 3 残差 43 合計 46 係数  標準誤差 t P-値 下限 95% 上限 95% 下限 95.0% 上限 95.0%

  • エクセル統計のロジスティック回帰について

    エクセル統計でロジスティック回帰をしようと思っています。 「関数のあてはめ-ロジスティック」と、 「多変量解析-多重ロジスティック」とツールが2つあり、 上限がともに1で、変数が1つであれば、理屈上は全く同じ推計結果が得られるようです(パラメータ推定方法の違いで、微妙に結果が異なるようですが)。 ちなみに、 前者はy=K/(1+a・exp(-bx))、後者はy=1/(1+exp(a+bx)) という式です。 質問1: 皆さんは、両者をどのように使い分けておられるでしょうか。 参考となるご意見などあれば、お伺いしたく存じます。 (数学的?(モデル表現的?)な意味合いで、本質的に異なるものなのでしょうか?) 質問2: フリーソフトのRでもロジスティック回帰ができるようですが、 これは上記のどちらに該当することになるのでしょうか。 ご存知の方がおられましたら、ご教示頂けると幸いでございます。 どうぞ宜しくお願い申し上げます。

  • 回帰係数の共分散がわからず困っています(確率・統計>回帰分析)

    現在、卒論執筆に際し、以下のような統計の問題にぶつかり、大変困っています。 【問題】 共通の説明変数x1~xnを持つ、N本の回帰モデルを以下の通り考える。 y1 = a1×e + b11×x1 + b12×x2 + … + b1m×xm + ε1 y2 = a2×e + b21×x1 + b22×x2 + … + b2m×xm + ε2 … yn = an×e + bn1×x1 + bn2×x2 + … + bnm×xm + εn (x,y,εはベクトル、eは単位ベクトル) このとき、各回帰式の切片a1~anの分散共分散行列V(a)を求めたいです。 分散共分散行列の対角成分に関しては、Excelの分析ツールで出力される標準誤差の項を基に計算できるのですが、共分散項については、自分で式の展開を試みるもどうにも上手くいきません。 また回帰分析の本は手当たり次第に読みましたが、一本の回帰式の中の係数の共分散行列ならば書かれていましたが、異なる回帰式の共分散行列となると、どの本にも書かれておらず、まったく先の見えない状況です。 そのものずばりの回答でなくても、そのことについて書かれている書籍や論文等がございましたら、お知らせいただければ幸いです。 また、上記の一般化された問題をもっと簡略化した以下の問題でもわかる方がいらっしゃいましたら、どうかお願いします。 共通の説明変数xを持つ2つの回帰モデルを考える。 y = ax + b z = cx + d このとき、切片b,dの共分散cov(b,d)を求めよ。