• ベストアンサー

重回帰による変数の作成

統計学については、初心者なのですが、論文の実証分析で使うことになり、必死に勉強しております!よろしくお願いします。 重回帰を用いて、説明変数(x1、x2・・・・xn)を用いて、新たな変数yを作成したいのですが、可能でしょうか? 参考になるHPや本など、情報をお願いします!

質問者が選んだベストアンサー

  • ベストアンサー
  • life55
  • ベストアンサー率46% (138/294)
回答No.1

重回帰分析は,目的変数yを説明変数(x1、x2・・・・xn)でどのように表現するかというようなことがわかる手法です. 例えば,英語の成績をyとすると,英語の成績は何に関係があるかと言う方をxにします.だから,この場合はxは(国語,数学,理科,社会,体育,音楽)の成績とかいうことですね. 重回帰分析をすると,xの中であまり関係なさそうなものは消えていきます.最後に残った変数で,英語の成績が表現できるということになります. たとえば,(極端で,変な例ですけど)   英語の成績y=0.7×国語+0.3×音楽 だったら,国語が100点,音楽が60点の人の英語の成績は,たぶん88点なのだろうねということになるわけです. 「新たな変数yを作成したい」というのが,説明変数(x1、x2・・・xn)の中に隠れた何らかの法則を見つけたいというのであれば,それは重回帰分析ではなくて,主成分分析とか因子分析を調べなければなりませんね. 使い方はネットで検索してもいいし,本屋さんに行くとマンガで説明したものもありますよ.

yumikorobentan
質問者

お礼

回答ありがとうございます。 すごい分かりやすいです。 主成分分析はHPでも色々載っているんですね;; 今まで知らなかった事が恥ずかしいくらいです。

その他の回答 (4)

  • backs
  • ベストアンサー率50% (410/818)
回答No.5

まずは多変量解析の本を買って「外的基準がない場合にはどのような分析方法が使えるのか」ということを知るべきでしょう。 朝野ひろ彦「入門多変量解析の実際」講談社サイエンティフィク 永田・棟近「多変量解析入門」サイエンス社 など分かりやすくてよい本だと思います。少し難しいものとしては, 水野欽司「多変量データ解析講義」朝倉書店 が良いでしょう。

noname#21649
noname#21649
回答No.4

>新たな変数yを作成したい ご質問者の分野がわかりませんが.重回帰分析の場合には次の前提条件があります。 変数Xiは互いに独立である(Xi=f(Xj)という関数が存在しない)こと Xiは正規分布であること 残さ(Yi-f(X1,X2,...,Xn)は均一分布であること 何かしら科の方法(例.定理からの導入)で該当関数が存在すること。 です。この条件から外れる内容として有名なのが.生徒の成績です。科目間の相関を示す方程式の存在が私が統計に関係していた頃でははっ権されていません。 つまり. 「たまたまのようなことになった」ので「統計的意味がない」 規格境界などに追加して.けいかんきょう.計量管理協会の本も参考になるでしょう。 ただし分野によっては.経験則として存在する場合があります。というか.分析をやったらばこんな結果になったという報告が結構出回るのです。 その意味がみつからないので゜す。発表した本人は言葉を濁してはっきりしたことをいわないのです。 医学・心理学(教育は心理学を多く使っていますので心理学に含めます)によく見られます。

  • rabbit_cat
  • ベストアンサー率40% (829/2062)
回答No.3

田口メソッド関連の本は,よく選ばないと似非科学まがいのものも数多くあるので,気をつけてください.田口先生の業績自体を否定するものではありませんので念のため.

noname#97214
noname#97214
回答No.2

田口博士の書籍ですね、 日本の統計解析の父です。 http://ja.wikipedia.org/wiki/%E7%94%B0%E5%8F%A3%E7%8E%84%E4%B8%80 他には、日本規格協会、日科技連の書籍がお奨めです。

関連するQ&A

  • 単回帰分析と重回帰分析の結果の違い

    論文を読んでいて疑問に思うことがありました.よろしくお願いします. 私は,回帰分析とは変数Yを、p個の変数X1,X2 ,… Xpにより説明したり予測するための統計的手法であり,p=1のときは単回帰分析,p>1のときは重回帰分析と呼ぶ,と解釈しています. 今,ある施設のサービス改善についての調査論文を読んでおります.そこではアンケート調査でその施設のサービスの総合評価Yと,8個の各サービス毎の評価(x1~x8)を調べ,総合評価Yを従属変数, x1~x8を説明変数として重回帰分析にかけます.そして出た相関係数から施設の総合評価に対する各サービスの重要度を求め,改善につなげようとしています. 結果,重要度は x1>x2>x6>x3>x7>x8>x4>x5 という結果になりました.ここまではわかるんです. ですが次に総合評価Yを従属変数,x1を説明変数として単回帰分析,また総合評価Yを従属変数,x2を説明変数として単回帰分析,また総合評価Yを従属変数,x3を説明変数として単回帰分析・・・というようにこの操作をx8まで続け,出た相関係数を比較しています.結果は x1>x2>x4>x8>x3>x5>x7=x6 となっており,重回帰分析の結果と照らしあわせると最初のx1とx2は合致しているものの,あとはバラバラです.x6にいたっては最後にきています.なぜでしょうか.論文は「どのサービスも総合満足度に重要な影響を与えており,特にx1,x2,x3,x4を改善するのがよい」 と締めくくっています. 質問は3点です. (1)なぜ重回帰分析の結果と単回帰分析の結果が異なるのか (2)どのサービスも総合満足度に重要な影響があるとして,それは重回帰分析の結果だけで言えるのではないか(重回帰でも相関係数は出ているし,単回帰分析をする意味はあるのか) 稚文ですみません. 当方あまりオツムがよろしくないのでできるだけわかりやすくよろしくお願いします.

  • 重回帰分析のやり方について教えて下さい。ど素人的な質問で恐縮なのですが

    重回帰分析のやり方について教えて下さい。ど素人的な質問で恐縮なのですが、重回帰分析は、目的変数(Y)を、説明変数 X1, X2, X3, X4.....X20などに影響されるか否かを検討しますよね。ここで、私がしようとしている統計学的処理と類似した研究の論文などを読んだりとかしていると、YとX1, YとX2, YとX3, YとX4.....YとX20の単回帰分析を各々行い、ここで有意な相関があったものを取り上げて(例えば、X1, X4, X7, X12, X18, X20の6個など)、この6個について、重回帰分析を施行して、ここで、X4, X18は有意でないといった結果が出たなら、Y=aX1+bX7+cX12+dX20という重回帰式を作成し、標準偏回帰係数を算出し、どの説明係数が最も目的変数に影響を与えているのか解析しているのですが、これが正しい方法(進め方)なのでしょうか? いきなり、YとX1~X20を重回帰分析したのは、どうでしょうか?これはダメなのでしょうか?単回帰分析では相関が有意にでない(他の説明変数の影響のために)けれども、重回帰分析では有意な結果となるような説明変数が無視されるような結果になるように思うのですが、どうでしょうか? 非常に低レベルな話しで申し訳ないのですが、お教え下さい。

  • 高次の重回帰式について

    多変量解析を行なっているのですが教科書などを見ても見つからなかったので教えてください. 現在,3変数x1,x2,x3の重回帰式を作ろうとしています. 多変量解析は初めてなのでとりあえず,教科書に載っている方法を真似てみました. まず各変数と目的変数yについての単回帰式は,最小二乗法によって係数a~lを求めて y(x1) = a*x1^3+b*x1^2+c*x1+d y(x2) = e*x2^3+f*x2^2+g*x2+h y(x3) = i*x3^3+j*x3^2+k*x3+l という式が,実際の値とよく一致していることがわかりました. そこで重回帰式として y(x1,x2,x3) = a*x1^3+b*x2^3+c*x3^3+d*x1^2+e*x2^2+f*x3^2+g*x1+h*x2+i*x3+j というモデルを作ったのですが,実際の値と一致しません. 本やインターネットに載っている重回帰式はほとんどが y(x1,x2,x3) = a*x1+b*x2+c*x3+d といった,変数が1次の式ばかりで,私が作ったような重回帰式は載っていたとしても「高次回帰式である.」のようにさらっと書かれているだけでした. そのため何が悪いのか,どうすれば良いのか全くわからなくて困ってます.どなたか教えてください!お願いします.

  • 【重回帰分析】stepwiseで変数選択

    こんにちは、趣味で統計学を学び始めた者です。 少し重回帰分析をかじってみて「おもしろい!」と思ったので、試しに自分でモデルを作り関連データを集めてエクセルでやってみました。 stepwiseで変数を落としていく方法をとるに当たり、とある疑問にぶつかったので、お詳しい方に質問をさせて頂きたく投稿しました。 【質問】 (1)stepwiseによる作業を経て完成した最終モデルは、他の国にも適用して良いのでしょうか?それとも、他の国の分析をする場合は再度初期モデルを用いて回帰分析を行ってstepwiseで変数選択を行う作業が必要なのでしょうか? (2)クロスバリデーション法って結局なんなんでしょうか。。。(撃沈) 【質問詳細】 対象国はヨーロッパのA国。 初期モデルはY=X1+X2+X3+X4+X5+X6+X7という形です。 (YはA国のGDP、X1~X7はA国のなんらかの数値です) stepwiseによる変数選択を経て、最終モデルはY=X1+X3+X6+X7となりました。 私のもくろみは、「Yに対してX3はpositiveな影響がある」と主張すること。 最終モデルの説明変数にはX3が含まれており、運良く係数の符号も正でしたので、ひとまず満足です。 ここからが悩みどころです。 このモデルをヨーロッパ上の他の国にも適応して、 「ヨーロッパではすべからく同様のことが言える」と言いたいのですが、 ここで他の国の分析をしていくに当たり、いちいち毎回初期モデルから回帰分析を行うべきなのでしょうか、それとも他の国にはもう最終モデルだけ当てはめて分析すればいいのでしょうか? というのも、すべての国に対していちいち初期モデルからやってもいいのですが、もし最終モデルだけ当てはめる方法でもいいなら、時間の短縮になると思ったのです。 本を漁ってみましたが初心者の私には専門用語ばかりで理解できず、ネットを漁ってみましたが私の理解力では煙に巻いたような説明ばかりです。 どうやら「クロスバリデーション法」というものを使えば、(私は初心者なので一般的な専門用語を使わずに言いますと)一度A国を分析する過程で完成した最終モデルを、そのまま他の対象国にも当てはめてOKらしいという記事をネットで見ましたが、、、このような理解で良いのでしょうか?それとも。。。何なんでしょうか。。。(撃沈) 専門的なことはまったくわからぬ初心者ですが、アホにも分かるように教えていただけると大変嬉しいです。よろしくおねがいします。

  • おしえて!重回帰分析の独立変数(説明変数)

    重回帰分析の目的変数が、(A+B+C+D)というものとします。 A~Dは、数量データです。 説明変数にAやBなどが入っていたら、それはダメですか? 説明変数X(Aとか)が目的変数Y(A+B+C+D)の一部の構成要素だったら、Xを使って重回帰分析はやったらダメなのですか?

  • 相関分析と重回帰分析

    大学3回生で、来年度の卒論のために先行研究を読んでいます。 私が書く卒論では統計分析が必要なのですが、 先行研究を読んでいて疑問に思ったことがあるので、質問させてください。 ある論文で、変数間の相関を分析した後、重回帰分析を行っていました。 ところが、相関分析において相関の出ていない変数に対しても重回帰分析を行っており、 その結果、 「相関分析では有意な相関が見られない」にも関わらず、「重回帰分析では有意な結果が見られる」 というような書き方がなされていました。 また、この論文における考察部では、相関分析と重回帰分析をまとめて考察しており、 ほとんど重回帰分析の結果についてしか触れられていませんでした。 相関分析と重回帰分析を両方行う場合、相関がない変数についても重回帰分析を行うべきなんでしょうか? ゼミに教授に質問しにいっても、現4回生の卒論などで忙しいのか、 今度にしてくれ、と言われてしまいましたので、こちらで質問させていただきました。 不勉強で、重回帰分析の仕組みが良くわかっておらず、大変心苦しいのですが、 宜しければ回答していただけると、とても助かります。

  • 重回帰分析で、独立変数を分けて投入したら…

    重回帰分析で、独立変数を分けて投入したら、結果を表にする時、R2乗値をどのように記載すればよいのかがわかりません。 独立変数が多く、分けて分析をしたら、その投入した変数によってR2乗値が変わります。しかし、先行研究を見ていると、どの論文でも、結果として載せている表のR2乗値は一つだけです。 私のように、独立変数を分けた場合、どのR2乗値を採用して表に載せればよいのでしょうか? 統計初心者で、的外れな質問かもしれませんが、どうかよろしくお願いいたします。

  • 2つの重回帰分析結果の標準偏回帰係数の有意差

    2つのデータ集合(目的変数Y、説明変数X1,X2)について重回帰分析をそれぞれ行い、2つの回帰式を得ます。その結果求められたX1の標準偏回帰係数が、2つの回帰式間で変化したこと調べるには、検定が必要でしょうか?また、必要な場合、どのような検定を行えばよいでしょうか? 色々調べてみたのですが、わからず困っています。教えていただけると本当に助かります。どうぞよろしくお願い申し上げます。

  • 重回帰分析の変数についての疑問

    重回帰分析を行いたいのですが、説明変数(独立変数)に性別などの2択の変数があります。 目的変数(従属変数)は、完全な数量データなのですが、、、、 説明変数も数量データでなければならないのですよね??? しかし、過去の論文などを参考に見ていたら独立変数に性別があり、男=1、女=0とか書いてあるのです。。。 それでいいの? 多変量解析の初心者なので、変な質問かもしれません。 目的変数=(標準偏回帰係数)*説明変数1+(標準偏回帰係数)*説明変数2+・・・+定数 の回帰方程式ですよね。 あと、それぞれの標準偏回帰係数の横にt値や有意確率が算出されますが、これは何? あと、論文の表記のやり方として何をどう記せばいいのですか? 独立変数 標準偏回帰係数をそれぞれ縦に記して、RやR^2を最後の行に記せばいいの? tや有意確率も記すの?というか、これは何? 色々とわからないのですが、どれか一つでも答えをお願いします。 教えてください。

  • 重回帰分析?

    二つの変数があり、各々従属変数に対して単回帰分析を行うと決定係数が0.5と0.4ぐらいの感じになります。この二つの変数をくっつけてもう少し精度を上げたいのですが、一方は線形なんですが、もう片方が非線形(指数関数)なのです。 たしか、重回帰分析は線形どうしでしかくっつけることができなかったような気がするのですが、どのようにしたらできるでしょうか? 混合モデルとかを使ったらよいのでしょうか??? 理論的に考えると Y=aX1 + bexp(cX2) かY=aX1 + bX1exp(cX2)と思うのです Yが従属変数X1,X2が変数、a,b,cがそれぞれ係数です。 使用できるソフトはSPSS,SAS,mintab,S-plus,R,excelです。Rでのが使い慣れているのでRでできるとよいのですが、できるならどのソフトでもかまいません。