• ベストアンサー

回帰分析SPSS結果の有効性

SPSSでの回帰分析が課題に出ましたが、まったくわかりません。 「赤ちゃんの重量と母親の年齢」の回帰分析ですが、重量平均2944グラム、母親平均年齢23歳で式はY=8.51X+2747と出ました。 しかしRが0.062と異常に低い数値です。Rは0.5以上でないとだめなんですよね?どうしたらいいのでしょう。 また、「赤ちゃんの重量と母親の喫煙」の回帰分析では、喫煙=1、非喫煙=0でSPSSにかけたところ、これもRが0.189と低い数値で、有効性なしなんでしょうか。xが0か1かでは式を作っても意味がないということでしょうか。 どなたか助けていただけませんか?

質問者が選んだベストアンサー

  • ベストアンサー
回答No.2

ご存知だと思いますが、y = 8.51x + 2747 は「母親の年齢(x)」によって「赤ちゃんの重量(y)」を予測する式です。rはxとyの相関です(習ったのでは)。上の回答で言っている「決定係数」はr^2、rの自乗です。 0.062はたしかに高くはないですが、「だめ」ってことはないのでは? 課題で与えられたのがそういうデータだ、というだけで。 観測数(データ数)が非常に多ければ(自由度が大きければ)それでも有意な相関になるかもしれません。逆に、0.5を超えれば絶対有意だ、ということもないと思います。SPSSは相関が有意かどうかも計算して表示していると思うので、出力をごらん下さい。 有意でなければ「母親の年齢で赤ちゃんの重量は予測できない」という結論になるんだと思います(与えられたデータの範囲で、ですが)。 喫煙=1、非喫煙=0の回帰分析ですが、これは意味がなくはありません。 こういういわゆる「名義尺度」に数値を与えるのを「ダミーコーディング」と呼ぶはずで、結局のところ1元配置の分散分析をやったのと同じことです(t検定とも実質上同じ結果)。「一般線形モデル」ってのを勉強すると分かるはずです。 これも、有意かどうか(おっしゃるところの「有効性」はそのことだと理解しました)は観測数しだいです。出力にp値があるはずですので確認してください。

sales1027
質問者

お礼

どうもありがとうございました。おっしゃるとおり確認したところ、p値がありました。まわりが理系ばかりの中、文系は私一人なので、用語についていけず苦労しています。(同類がいたはずなのに、みんな既に脱落してしまったようです。)理系の人も頭を抱えているようで、先生もさすがにまずいと思ったのか、今週の課題はなんとspssの表の読み方になりました。(先にやっといてくれればよかったのに。)

その他の回答 (1)

  • backs
  • ベストアンサー率50% (410/818)
回答No.1

分析した数値を見るだけではなく、散布図を描いて、そこに回帰直線を加えた図を見てみましたか?決定係数が低いということはその回帰直線の当てはまりが良くないということです。 > Rは0.5以上でないとだめなんですよね?どうしたらいいのでしょう。 Rではなく、決定係数とか重相関係数とちゃんとした名称を書くようにすると良いですよ。それに0.5以上でないとダメというのことはなく、それはあくまでも目安ですからね。 どうしたらいいもなにも、そういう結果が出たのであれば、そういうことです。年齢と体重になんら関係はないということ。 > 喫煙=1、非喫煙=0でSPSSにかけたところ、 従属変数が母親の喫煙ならばロジスティック回帰分析という2値データの解析方法がちゃんとあります。独立変数として扱うのであっても、ダミー変数を用いた回帰分析を適用すればよいのです。

sales1027
質問者

お礼

ご親切にどうもありがとうございます!まったくわけがわからなくて呆然としていたのですが、光が見えた思いです。もっと頑張ってみます。

関連するQ&A

  • 初心者がSPSSで重回帰分析をしたのですが。。。

    統計学初心者です。現在アメリカの大学で統計学の授業を取っているのですが、元々数学関連全くダメな人間ですので、お手上げ状態です。↓ お手数ですが、基本的な事を質問させて下さい。 SPSSを使って、とある表からSNSサイトの友達の数と関連性のありそうな項目を3つ使い、 関連性があるかどうかを調べました。 結果、R二乗(R Square)が0.051と物凄い低い数値がでました(有意確率は0.005%)。 この結果から、これらの標本からはそれぞれ関連性が無いと結論付けるのは重回帰分析の本来の目的と合致していますか? 授業でのうっすらとした記憶だと、重回帰分析は元々関連性のあるものを探すための手法であると言っていたと思うので、ここで分析を止めてしまうのは良くないのでしょうか?他の項目を探すべきでしょか?? 後、また別の視点の質問ですが、SPSSの重回帰分析ではじき出された数値で、 上記以外にどのような所に着目するべきでしょうか?(非標準化係数などは調べましたが。。。)。 お手数ですが、ご教示のほど何卒よろしくお願いします。

  • 単回帰分析と重回帰分析の結果の違い

    論文を読んでいて疑問に思うことがありました.よろしくお願いします. 私は,回帰分析とは変数Yを、p個の変数X1,X2 ,… Xpにより説明したり予測するための統計的手法であり,p=1のときは単回帰分析,p>1のときは重回帰分析と呼ぶ,と解釈しています. 今,ある施設のサービス改善についての調査論文を読んでおります.そこではアンケート調査でその施設のサービスの総合評価Yと,8個の各サービス毎の評価(x1~x8)を調べ,総合評価Yを従属変数, x1~x8を説明変数として重回帰分析にかけます.そして出た相関係数から施設の総合評価に対する各サービスの重要度を求め,改善につなげようとしています. 結果,重要度は x1>x2>x6>x3>x7>x8>x4>x5 という結果になりました.ここまではわかるんです. ですが次に総合評価Yを従属変数,x1を説明変数として単回帰分析,また総合評価Yを従属変数,x2を説明変数として単回帰分析,また総合評価Yを従属変数,x3を説明変数として単回帰分析・・・というようにこの操作をx8まで続け,出た相関係数を比較しています.結果は x1>x2>x4>x8>x3>x5>x7=x6 となっており,重回帰分析の結果と照らしあわせると最初のx1とx2は合致しているものの,あとはバラバラです.x6にいたっては最後にきています.なぜでしょうか.論文は「どのサービスも総合満足度に重要な影響を与えており,特にx1,x2,x3,x4を改善するのがよい」 と締めくくっています. 質問は3点です. (1)なぜ重回帰分析の結果と単回帰分析の結果が異なるのか (2)どのサービスも総合満足度に重要な影響があるとして,それは重回帰分析の結果だけで言えるのではないか(重回帰でも相関係数は出ているし,単回帰分析をする意味はあるのか) 稚文ですみません. 当方あまりオツムがよろしくないのでできるだけわかりやすくよろしくお願いします.

  • 指数の回帰分析?について質問があります。

    回帰分析について質問があります。 (x, y)(18, 24000), (20, 20000), (25, 9500) このデータの時の、指数の回帰直線?(y=Ae^Bxの形の式)を求めたくて、あるサイトで計算してもらいました。 すると、yの平均値が16582.68868と出てきました。どのような計算をしたらこの数字が出るんですか?

  • 重回帰分析?

    二つの変数があり、各々従属変数に対して単回帰分析を行うと決定係数が0.5と0.4ぐらいの感じになります。この二つの変数をくっつけてもう少し精度を上げたいのですが、一方は線形なんですが、もう片方が非線形(指数関数)なのです。 たしか、重回帰分析は線形どうしでしかくっつけることができなかったような気がするのですが、どのようにしたらできるでしょうか? 混合モデルとかを使ったらよいのでしょうか??? 理論的に考えると Y=aX1 + bexp(cX2) かY=aX1 + bX1exp(cX2)と思うのです Yが従属変数X1,X2が変数、a,b,cがそれぞれ係数です。 使用できるソフトはSPSS,SAS,mintab,S-plus,R,excelです。Rでのが使い慣れているのでRでできるとよいのですが、できるならどのソフトでもかまいません。

  • 統計ソフトRの回帰分析について

    フリー統計ソフトRの回帰分析に関する質問です。 統計の研究でRというソフトを最近使い始めたのですが、なかなかうまくいきません。 特に、説明変数に期間を考慮した回帰分析のやり方です。 具体的には 二つの変数XとYがあって t期におけるYの値を過去6期間(k=1,2,3,...,6)のXの値で回帰させたいのですが (式)      6 Yt=A+ΣBkXt-k     k=1 どのような式をlm()に入れれば分析できるでしょうか? 

  • 回帰分析が分かりません。

    合計特殊出生率と一人あたりの所得の関係について埼玉県を市町村別に回帰分析を行い、その結果を都道府県を単位とした分析の結果と比較して考察する問題なのですが、教科書を見ながらExcelの散布図で一人あたりの所得を従属変数、合計特殊出生率を独立変数として回帰分析を行う所まではできたのですが、結果として何が分かってどのようなことが考察できるのかが分かりません。教えてください。 埼玉県がy=396671x+2E+06,Rの2乗=0.0379, 都道府県別がy=-1E+06x+5E+06,Rの2乗=0.1915となりました。 Excel操作が苦手で回帰分析が全く理解できていない状態です。

  • 回帰分析における回帰係数(α)の意味

    回帰分析における回帰係数(α)の意味 線形回帰式Y=α+βXにおける 定数項αの意味について、2点質問いたします。 (1)定数項αが0以外の数値をとるということは、 被説明変数Yの数値に対して、αは何か影響を 与えていることを表すものでしょうか? (2)αについて仮説検定を行うために、帰無仮説・ 対立仮説をそれぞれ立てたとき、各仮説の意味は 以下の通りになるでしょうか? ・帰無仮説(α=0)→Yの数値に対して影響を与えている変数が他に存在する ・対立仮説(α>0)→Yの数値に対して影響を与えている変数が他に存在しない 当方、数学及び統計学については初学者です。 分かりやすくご教示いただける方からのご回答を お待ちしております。 以上、よろしくお願い申し上げます。

  • 単回帰分析

    単回帰分析における回帰直線y=a+bxの係数a,bの導出方法を教えてください。 調べたところ、a=y~-bx~ , b=Σ(x-x~)(y-y~)/(x-x~)^2とあったのですが導出する方法がわかりませんでした。 y~=1/n*Σy , x~=1/nΣx お願いします

  • 単回帰分析について教えてください!!

    学校の試験問題で困っています・・・。 授業ぜんぜんいってなくてわかりません・・・。 こういう問題です。 国名 UNDP GDP 日本 100.000  4245191 米国 80.00  10171400 ... ... ... 他続きますけど、とりあえずこんな表があります。 そしてUNDP=Y GDP=Xとし、回帰分析の結果を示すグラフを作成しなさいという問題です。 【データの散布図】【回帰直線】【回帰式(t値と決定係数も含む】がグラフに集約されている。回帰式は数式エディタを使用すること。 以上です・・・。 助けてください! お願いします!

  • エクセルの回帰分析でエラー

    エクセルの回帰分析で範囲指定して実行したところ、「回帰分析入力範囲に数値以外のデータがあります」とのエラーが何回も出ます。SPSSでは問題なかったデータで、すべて数値しか入ってません。回帰分析が実行できるようにしたいのですが、どうしたら解決しますでしょうか? 取り急ぎ、太字にしたところやメモを付けていたセルは、すべて削除して元に戻しましたが、ダメでした。セルのバックの色も戻したほうがいいのでしょうか?