エクセルにおける回帰分析について

このQ&Aのポイント
  • エクセルにおいて回帰分析した結果の決定係数と散布図作成から近似曲線作成した場合の決定係数に違いがあるケースがあります。これはどう解釈したよいのかという質問です。
  • マイクロソフトのサイトでは散布図からの近似曲線は最小2乗法によるとのことですので、縦軸と横軸を入れ替えても決定係数は変わらないと思っているのですが、このケースの場合変わってしまいます。ご存知の方がいましたら、是非教えていただきたいと思います。
  • パワーポイント資料等で説明する際には、決定係数だけでなく、t値やP値も併記するべきなのでしょうか。合わせて皆様の見解をお聞かせください。
回答を見る
  • ベストアンサー

エクセルにおける回帰分析について

統計分析初学者です。よろしくお願いいたします。 お聞きしたいのは、エクセルにおいて 回帰分析した結果の決定係数と散布図作成から近似曲線作成した場合の決定係数に違いがあるケースがあります。これはどう解釈したよいのかという質問です。近似曲線はもちろん線形で近似させています。マイクロソフトのサイトでは散布図からの近似曲線は最小2乗法によるとのことですので、縦軸と横軸を入れ替えても決定係数は変わらないと思っているのですが、このケースの場合変わってしまいます。ご存知の方がいましたら、是非教えていただきたいと思います。 <追記> パワーポイント資料等で説明する際には、 やはり決定係数だけでなく、t値やP値も併記するべきなのでしょうか。 合わせて皆様の見解をお聞かせください。 よろしくお願いいたします。

質問者が選んだベストアンサー

  • ベストアンサー
  • ramayana
  • ベストアンサー率75% (215/285)
回答No.1

ご質問1「決定係数に違いがあるケースがあります」 確かに、エクセルの回帰分析では、説明変数と被説明変数を入れ替えたとき、値が違うことがあります。 定数項と、そのほかに説明変数が1個あるモデルでは、理論上は、説明変数と被説明変数を入れ替えても決定係数は変わりません。ただ、次の例外があります。 [1] 説明変数が定数のとき ⇒ 本来の定数項と説明変数が共線関係になるため、回帰分析は不可能です。 [2] 被説明変数が定数のとき ⇒ 係数パラメータの推計は可能ですが、決定係数は計算できません。 [1]や[2]の場合は、本来、決定係数が存在しないはずなのに、エクセルでは、どういうわけか計算されてしまいます。また、厳密に定数でなくても、説明変数や被説明変数の変動が小さいときには、エクセルによる結果は、極めて不安定になります。そして、このようなケースのとき、上記のような現象が起きるようです。 ご質問2「t値やP値も併記するべきなのでしょうか」 下の理由により、t値またはP値を記載したほうが良いと思います。P値を記載すれば、t値を記載する必要性は薄いと思います。 [3] 決定係数は、F値とともに、推計式全体の当てはまりを見るために使われます。 [4] P値(or t値)は、個々の説明変数が効いているかどうかを見るために使われます。 説明変数が複数あるときは、[3]と[4]はまったく違った意味なので、[4]を記載するのが必須です。 説明変数が1個のときは、[3]と[4]は同様の意味なので、両方を記載する意味が乏しいとも言えるのですが、読み手が安心するという意味で、[3]と[4]を併記するのが望ましいと思います。

syogakusya
質問者

お礼

お礼が遅くなってしまい,申し訳ありません. 丁寧なご説明ありがとうございました.

関連するQ&A

  • 回帰分析について教えてください

    統計に関する質問です。 私は勤務先(金融)で特定の業種の財務分析をしているのですが、データの分析方法(回帰分析)で分からない点があります。 具体的には下記の通りです。 【状況】 ある業種業界について、2つのデータ(例えば、総資産と売上高)を収集しました。 データは5年間分をパネルとして扱っており、総数は400くらいです。 2つのデータ間に何らかの関係をあると考え、総資産を横軸、売上高を縦軸、としてエクセルで散布図を作成したところ、右上がりの関係があるように感じました。 エクセルの機能で近似値線(直線)を引いて、算式とR2を表示したところ、算式の傾きはプラスで、R2は0.2程度でした。 その後、回帰分析を行い、分散分析表を作成しました。 相関係数の有意性を検定したところ、1%水準で有意な関係、となりました。 回帰係数も検定したところ、1%水準で有意な関係、との結果でした。 【私の主張】 私は「統計学的に考えて、総資産の増加に伴い売上高が増加する傾向がある」と述べたいのですが、 (なお、背景にある理論は別途構築しており、業界内でも理解が得られると思われます。) 【ご質問】 1. 回帰分析の結果から、回帰直線の傾きがプラスで、相関係数の関係が1%の有意水準で有意であることから、統計学的に私の主張は正しいと言えるのでしょうか?評価は個人ですべきものだとは存じますが、考え方・説明方法に無理があればご教示をお願い申し上げます。 2. もし、上記1の質問が的外れであれば、どのような点がおかしいのでしょうか。ご教示いただきますようお願い申し上げます。 抽象的な部分もございますが、何卒ご教示のほど、お願い申し上げます。 【前提】 上記は私の職務柄、個人で利用する目的で作業を行っています。 論文その他レポートの作成を目的としておりません。

  • 単回帰分析について教えてください!!

    学校の試験問題で困っています・・・。 授業ぜんぜんいってなくてわかりません・・・。 こういう問題です。 国名 UNDP GDP 日本 100.000  4245191 米国 80.00  10171400 ... ... ... 他続きますけど、とりあえずこんな表があります。 そしてUNDP=Y GDP=Xとし、回帰分析の結果を示すグラフを作成しなさいという問題です。 【データの散布図】【回帰直線】【回帰式(t値と決定係数も含む】がグラフに集約されている。回帰式は数式エディタを使用すること。 以上です・・・。 助けてください! お願いします!

  • エクセル 重回帰 グラフ

    こんにちわ。 エクセルの重回帰分析について教えてください。 解析結果自体は「ツール」-「分析ツール」-「回帰分析」で実行できるのですが、重回帰のグラフの作り方がわかりません・・・ 単回帰の場合は、目的列yと説明列xを同時に選んでやって、「散布図」を作成してから、出来上がったグラフのプロットを右クリックし「近似曲線の追加」としています。 重回帰でも同じようなことができると思うのですが・・・ご存知の方、どうかよろしくお願い致します。

  • 回帰分析について

    縦軸が記憶力、横軸が年齢での回帰分析を行って、記憶力が任意の値になるときの年齢を推定する、といったことをしたいです。 これはエクセルでもできるのでしょうか?

  • 回帰分析

    回帰分析をやってベータ値や決定係数などはわかったのですが、t値がわかりません。t値から何が分かったり、できたりするのですか?

  • 回帰分析について

    はじめまして。 統計の回帰分析について質問です。 エクセルにて回帰分析をし、係数から回帰式を作成しました。 しかしt値の意味がわかりません。 どなたか教えてください。 よろしくお願いします。

  • エクセルの散布図の近似曲線で得られる式について

    エクセルで回帰分析で得られる式と 散布図からの近似曲線の式 というのは同じものなのでしょうか?ちがうのでしょうか? もし違う場合はどう違うのか教えていただけると幸いです。 よろしくお願いいたします。

  • 相関分析や回帰分析について

    相関分析や回帰分析についての記述が正しいのかわかりません。 間違っていたらどこが違うのか理由も教えていただけると幸いです! (1)ある特性、例えば、身長についてゴールドンのいう第二世代(子)の平均への回帰が観測される(b<1)のとき説明変数と被説明変数を逆にした回帰計算をしてもいわば、おやの平均への回帰が観測される可能性はない。(親と子の身長には、正の相関があると考えてよい) (2)第二世代(子)が平均へと回帰するのならば、将来は、個人のもつ身長その他、さまざまな諸特性がすべて一様な社会になってしまう。(ある経済学者はそう考えた) (3)重回帰の場合、通常の決定係数を使用すると、説明変数の増加のよるあてはまりのよさの改善を誇張してしまうので、修正済み決定係数(自由度調整済み決定係数)を使用するのが普通である。もいろん、単純回帰については、決定係数と修正済み決定係数は同じものになる。 (4)決定係数は、マイナスになることはないが、修正済み係数はマイナスになりうる。 (5)回帰分析を因果関係と結びつける(説明変数を原因、被説明変数を結果と見る)ことは、記述統計の範囲を逸脱している。 よろしくお願いいたします!!!

  • EXCELを使って…

    EXCELの、グラフツール“散布図”を使って線形回帰曲線のグラフを描きたいのですが、グラフがたくさんあってどれが線形回帰曲線なのかわかりません。 調べたり聞いたりしたのですが解決できませんでした。 回答お願いします。

  • データの回帰分析と相関係数(R, R2値)

    Kaleidagraphでグラフをプロットした後回帰分析を行うと、近似曲線の式とともにR値(相関係数)を表示します。この値が1に近いほど測定データと近似曲線が一致しているというように解釈していますが、これで正しいでしょうか? また、相関係数にはR2値というものもありますが、これとR値との違いは何でしょうか? よろしくお願い致します。