統計ソフト「R」での共分散構造分析のパス係数について

このQ&Aのポイント
  • 統計ソフト「R」の初心者が共分散構造分析の解を求めるためにsemパッケージを利用しています。
  • 標準化解を求めた結果、パス係数の値が1以上になっていますが、その原因や意味について質問しています。
  • また、パス係数の概念や潜在変数と観測変数の関連性の判断方法についても教えていただけると助かります。
回答を見る
  • ベストアンサー

統計ソフト「R」での共分散構造分析でのパス係数について

統計ソフト「R」の初心者です。 今回、共分散構造分析の解を求めようとsemパッケージを利用して みました。最後に以下のコマンドを実行してみたのですが、 標準化解というものを出力しているはずなのに パス係数の値に1以上の値があります(本記述下部参照)。 標準化解を求めれば、相関係数がパス係数として出力 されると思っていたのですが… 【質問1】1以上になるということは      どのようなことなのでしょうか。 【質問2】パス係数の概念がよくわかっていないことが      原因と思いますが、パス係数がどの値だと      潜在変数と観測変数の関連はどのように      判断すればによいかということについて      教えていただけませんか? 初心者で申し訳ございません。 何卒よろしくおねがいいたします。 ◆以下、出力結果です。 > sem.行動 <- sem(model.行動,行動,N=12) > std.coef(sem.行動,digit=4) Std. Estimate b11 b11 0.5461 y1 <--- 絆 b21 b21 1.1397 y2 <--- 絆 b31 b31 0.6249 y3 <--- 絆 b41 b41 -0.2889 y4 <--- 絆 0.3424 y5 <--- 行動 b62 b62 0.5483 y6 <--- 行動 b72 b72 1.3302 y7 <--- 行動 g21 g21 0.2397 行動 <--- 絆

  • 科学
  • 回答数1
  • ありがとう数1

質問者が選んだベストアンサー

  • ベストアンサー
  • kt1965
  • ベストアンサー率34% (116/339)
回答No.1

回答します。 参考URLに、一番詳しく説明している論文のURLを貼っておきます。(一応、他にも一杯あるので、参考まで。)この論文中のアクロバットでは「14ページ」(本文では、15ページ)以降に詳しい説明が出ています。 それらの論文群から言えば、パス解析による解析図を描いたとき、それぞれの相互ファクターの因果関係を説明する変数がパス係数と呼ばれるものです(検索してみると良いのは、「パス係数」)。 さて、今回の出力結果から1以上の出力がなされたというのは、因果関係が極めて強いとするのが一般的ですが、仮説そのものに誤りがある可能性も否定できないということになります。 一般的に、重回帰分析では、全ての経路の和が1になるはずなのです。そして、今回のような場合、パス経路が余りにも単純化されすぎているため、経路の修正を行えば正しい答えにたどり着くはずです。 他のモデル計算でも試して見ると良いでしょう。 では。

参考URL:
http://www.mus-nh.city.osaka.jp/iso/argo/nl13/nl13-3-23.pdf
jca1287
質問者

お礼

ご教示いただきありがとうございます。 参考論文URLの添付まで添付いただきまして大変勉強になります。 バス係数とは相互の因果関係を説明するための値なのですね。 1以上のものが出力されましたので、経路修正等を何度か繰り返し 実施してみることからはじめてみます。 他のモデル計算等についても勉強を継続して実施してみます。 ご指導ありがとうございました。大変わかりやすく助かりました。

関連するQ&A

  • 共分散構造分析のパス係数について

    現在アンケートを行いその結果を因子分析、共分散構造分析を行っています。解析結果についてわからないことがあるので質問しました。 アンケート調査ではA、B、Cの3つのテーマから質問項目を構成しており、A、B、Cそれぞれの項目で因子分析を行った後、共分散構造分析によりA、B、C全体の因果関係を見ようとしているのですが、ここで全体としてA→B、A→C、B→C(AはCに直接影響を与え、更にBを通して間接的にCにも影響を与える)という因果関係が成り立つと仮説をたてています。 まず共分散構造分析で A→B、 A→C、 B→C、 それぞれの関係を見ていくと適合度は基準を満たしており、パス係数も正の値で全て0.1%有意でした。 しかし、最終モデルとしてA、B、C全ての因果関係を見ていくと適合度は十分だったのですが、A→Cのパス係数が負の値になってしまいました。(A→Cだけで関係をみるとパス係数は正だったのですが、そこにBを加えA→B、B→Cという因果関係を加えるとA→Cのパス係数は負になってしまいました。)パス係数は5%有意でした。 そこで質問なのですが、他の要因が入ることによってパス係数の正負が逆転することはあるのでしょうか?

  • 回帰係数の共分散がわからず困っています(確率・統計>回帰分析)

    現在、卒論執筆に際し、以下のような統計の問題にぶつかり、大変困っています。 【問題】 共通の説明変数x1~xnを持つ、N本の回帰モデルを以下の通り考える。 y1 = a1×e + b11×x1 + b12×x2 + … + b1m×xm + ε1 y2 = a2×e + b21×x1 + b22×x2 + … + b2m×xm + ε2 … yn = an×e + bn1×x1 + bn2×x2 + … + bnm×xm + εn (x,y,εはベクトル、eは単位ベクトル) このとき、各回帰式の切片a1~anの分散共分散行列V(a)を求めたいです。 分散共分散行列の対角成分に関しては、Excelの分析ツールで出力される標準誤差の項を基に計算できるのですが、共分散項については、自分で式の展開を試みるもどうにも上手くいきません。 また回帰分析の本は手当たり次第に読みましたが、一本の回帰式の中の係数の共分散行列ならば書かれていましたが、異なる回帰式の共分散行列となると、どの本にも書かれておらず、まったく先の見えない状況です。 そのものずばりの回答でなくても、そのことについて書かれている書籍や論文等がございましたら、お知らせいただければ幸いです。 また、上記の一般化された問題をもっと簡略化した以下の問題でもわかる方がいらっしゃいましたら、どうかお願いします。 共通の説明変数xを持つ2つの回帰モデルを考える。 y = ax + b z = cx + d このとき、切片b,dの共分散cov(b,d)を求めよ。

  • 重回帰分析の定数は、どっちの係数の式に当てはまる?

    そういえば、重回帰分析の結果で非標準化回帰係数と標準化回帰係数とがありますね。 標準化の方は、単位関係なく係数の重みを比べることができると解釈しています。 ですが、予測値Yを計算するときは、非標準化回帰係数の方で出すのが一般的なのですよね? 実は、結果の出力に標準化回帰係数のところには(定数)の値が表示されないのです。 定数は、非標準化係数の欄には表示されているのですが。。。 例えば、↓ http://www.u-gakugei.ac.jp/~kishilab/spss-mra.htm この場合、論文の表記には非標準化回帰係数の方を記したほうがいいのでしょうか? そうでないと、(標準化の方を記したら)定数を書いたら予測値Yの式が違うことになりますよね? あと、論文にはY=(非標準化係数1)*X1+(非標準化係数2)*X2+・・・+(定数)という数式も記入するのですか?

  • 確認的因子分析におけるパス係数の解釈

    現在修士論文に取り組む大学院生です。 統計に関して本当に稚拙な私ですがどうかご教授お願いいたします。 修士論文では尺度の開発を行っております。 そこで確認的因子分析を用いたのですが、 標準化推定値の結果で、ある因子の下位尺度に対するパス係数が 1.20になりました。 本来ならば0~1の間を取るはずなのに。これは不適解ですか? またどうしてこのような数値が出たのか原因がわかりません。 どうかご教授ください。 よろしくお願いいたします。

  • 統計科学における共分散について質問です

    おはようございます。 自分で考えたのですが、参考資料を教官が指定していないために、非常に理解できません。皆様の力をお借りしたく記載します。   1.変数XとYの分散はそれぞれ2と8で、共分散は3であるとする。 (1)3Xの標準偏差を求めよ (2)-yの分散を求めよ (3)2x-yの標準偏差を求めよ (4)ーxと-2yの共分散を求めよ (5)xとyの相関係数を求めよ   自分で答えを出したのですが (1)2√2 (2)8 (3)0 (4)不明 (5)0.75   続いて 2.変数sとtについて次の観測値があるとする  s -5,1,3、-1、-7  t -1,2,5、-7,11 (1)sの標本分散を求めよ (2)tの不偏分散を求めよ (3)sとtの不偏共分散を求めよ (4)sとtの相関係数を求めよ   これも自分で算出しました (1)16 (2)45 (3)???? (4)   ここで質問です。共分散の式がわからないのです。 ノートを見てもどの公式を使えばいいのか不明で 予想としては、2.(3)の答えは  (-6*-3+0*0+2*3+-2*-9+6*9)÷5=19.2 で (4)の答えが 19.2÷√20÷√45=計算してません。   となると思うのですが、正解でしょか? 大変申し訳ないのですが、お答えいただければ幸いです。

  • 連立方程式です。お願いします

    A、Bの2人がXとYについての連立方程式  aX-3Y=12                            5X-bY=8  をといたのですが、AはXの係数aの値を まちがえて8と書いたので、解はx=2, Y=4/3 となった。 Bは正しく解いて、解のうちYの値はY=-2であることがわかった。このとき、a,bのあたいをそれぞれ求めなさい。 回答よろしくおねがいします

  • 2つの重回帰分析結果の標準偏回帰係数の有意差

    2つのデータ集合(目的変数Y、説明変数X1,X2)について重回帰分析をそれぞれ行い、2つの回帰式を得ます。その結果求められたX1の標準偏回帰係数が、2つの回帰式間で変化したこと調べるには、検定が必要でしょうか?また、必要な場合、どのような検定を行えばよいでしょうか? 色々調べてみたのですが、わからず困っています。教えていただけると本当に助かります。どうぞよろしくお願い申し上げます。

  • 標準化係数と非標準化係数

    お世話になります7772です。重回帰分析での標準化係数、非標準化係数の意味合いは、標準化係数が、ある変数が他の変数に比べてどのように影響しているかを比べるもので、非標準化係数が、他の変数の影響を一定にして、一つの変数にのみ絞ったその変数の全体への影響を示したものと認識しています。  私が疑問に思うのは、これらの係数が負の値をとるときです。そのときは正の値のものよりも影響しないということでしょうか?具体的には、標準化係数が0.2のものと-3.3のものでは、0.2のほうがより影響していると言うことなのでしょうか?  それとも、判断は絶対値で行い、上のような場合、-3.3のほうが影響しているけれど、それは変数が増えれば全体が増えるのではなく、変数が増えると全体が減る。の用に影響していると言う意味合いなのでしょうか?

  • Rというソフトの最小2乗法の結果について困ってます

    Rの出力結果で、「○○e+03」とは○○の10^3の、「○○e-02」とは10^-2の意味。というのは分かったのですが、どうやら有効桁数も示しているらしいのです。たとえば「3.03 e+05」の有効数字は3桁で、解答として出す際は303,000という表記で出すらしいのですが、なぜ3桁になるのか分かりません。 例えば、 出力結果が、           Estimate    Std. Error    t value    Pr(>|t|)           (Intercept)   -1.142e+05    3.668e+04   -3.115    0.00422 **           可処分所得   8.958e-01   1.724e-02    51.947   < 2e-16 *** のとき、 -1.142e+05なら-114,200と、8.958e-01なら0.8958として、 C_i=-114,200+0.8958Y_i という推定式で良いのでしょうか? あと、ついでなのですが、Pr(>|t|)の下の数値の横にある「**」や、「***」は何か意味があるのでしょうか?

  • <★困っています!>等分散性が成り立たない場合等の回帰分析

    いくつかの生物種について、独立変数である環境因子Xに基づいて、ある従属変数Yがどんな値を示したかを線形回帰分析した結果を簡単に外人の専門家に見てもらった所、 ・等分散性が成り立っていないのでPerasonの係数を用いた一般的な回帰分析はできない ・生物種によっては(複数回の実験に基づく)複数回データを(回帰分析に)使っている種もあれば、1回しかデータとして登場していない種もあるので、データ間の相互独立性が必ずしも成り立っていない という指摘を受けました。 しかし英文でのやりとりであることと私の基礎的知識の不足がたたり、理解が十分にできていません。具体的には以下の2点が疑問で残っています; ・等分散性が成り立たない場合には回帰分析はできないのでしょうか?できないにしても、変数XとYの関係を何らかの方法で評価できないのでしょうか。 ・ある種は複数のデータが使用され、ある種は1つのデータしか回帰分析に使用されていないことについて指摘を受けた所ですが、その対処方法として、一つは当然「全ての種について1つずつのデータ(プロット)しか使わない」という方法があるかと思います。しかし、折角複数のデータがある種については、それらのデータを全て回帰分析に用いる方が、より有効にデータを使っている様にも思えるので、全てのデータを使いつつ適切な回帰分析を行うという方法はないのでしょうか。 以上、どちらか一つだけでもご回答頂ければ非常に助かります。また、解決につながる単語又は概念だけでもヒントを頂ければ後は自分で調べたいと思います。