回帰平方和が全平方和を上回る原因とは?

このQ&Aのポイント
  • 回帰平方和が全平方和を上回る原因について教えてください。
  • 決定係数が1以上になることは意味があるのでしょうか?回帰平方和が全平方和よりも大きくなる理由は何かありますか?
  • 用いた式は単純な指数関数減衰曲線で、フィッティングパラメータ変数は減衰速度定数(k)のみです。回帰平方和が全平方和を上回ることについて分かりやすく教えてください。
回答を見る
  • ベストアンサー

回帰平方和 > 全平方和 の原因

当方,統計学に関してはほぼ素人です。 実験データの解析で減衰曲線の理論式のフィッティングを行ったのですが,その決定係数が何故か1以上になってしまいます。ExcelのDevSq関数で理論値と実験値からそれぞれ算出した回帰平方和 ÷ 全平方和で算出していますが,その時 回帰平方和 > 全平方和になってしまいます。式や計算範囲の確認は行ってみましたが,素人目線では特に問題があるようには感じられません。以下の点についてご教授ください。 ・決定係数1以上に意味があるのか? ・計算間違え以外で回帰平方和の方が大きくなってしまうことがありうるのか?あればその原因は何か? 参考までに使用したデータのグラフの画像を示します。 因みに現状では決定係数R^2=1.0788程度で,用いた式は以下の単純な指数関数減衰曲線で,フィッテングパラメータ変数も減衰速度定数(k)のみです N(t)=N0*exp(-1*k*t) 恐縮ですが,エンドユーザーレベルの知識しか持ち合わせない故,分かりやすく教えて頂ければ幸いです。 よろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
noname#220711
noname#220711
回答No.4

汚いですが、画像を参照してもらうと定義式と参考にした式は同じだとわかると思います。

trumpet_eam
質問者

お礼

最後まで懇切丁寧に解説して下さってとても助かります。 この度のご厚意に深く感謝致します,どうもありがとうございました。

その他の回答 (3)

noname#220711
noname#220711
回答No.3

ちなみに全平方和は変形すると回帰平方和+残差平方和と表すことができるので、回帰平方和のほうが大きくなることもありません。

trumpet_eam
質問者

お礼

最後まで懇切丁寧に解説して下さってとても助かります。 この度のご厚意に深く感謝致します,どうもありがとうございました。

noname#220711
noname#220711
回答No.2

目的変数の予測値の偏差平方和を回帰平方和、目的変数の観測値の偏差平方和を全平方和と言うのですね、恥ずかしながら初めて知りました。 読んでみましたが、このやり方だと本来の定義式と根本的な意味は同じですので、値も全く同じになるはずです。 ですので、違う値が出たならば回帰平方和の値が違っていたか、データのミスしか考えにくいです。 問題はありませんので安心して使って大丈夫です。 ちなみに本来の定義式だと残差二乗和と全平方和だけで済むので、決定係数を求めるだけならば回帰平方和も考えるこのやり方よりも早く簡単に導出できます。

trumpet_eam
質問者

お礼

最後まで懇切丁寧に解説して下さってとても助かります。 この度のご厚意に深く感謝致します,どうもありがとうございました。

noname#220711
noname#220711
回答No.1

大学生で統計学を専攻しています。 >決定係数1以上に意味があるのか? 決定係数が1以上になることはありえません。 決定係数(R^2)を求める方法は、 R^2=1-(Σe^2/Σy^2)です。 (ググっても出てくると思うので、詳しくはそちらを参照してください。) R^2の式の、(Σe^2/Σy^2)の部分は「二乗和 分の 二乗和」ですので、必ず正の数になります。 つまり、1-(Σe^2/Σy^2)=R^2は必ず1より小さくなります。 もう一度きちんと公式に当てはめてみてください。 あと、回帰平方和÷全平方和とは何のことでしょうか。(そもそも回帰平方和、全平方和とは何を指しているのでしょうか?一般的な用語ではありません。用語名を間違って使用していると思います。) >計算間違え以外で回帰平方和の方が大きくなってしまうことがありうるのか?あればその原因は何か? 回帰平方和が何を指しているのかわかりません。 基本的に統計でのミスはデータの打ち間違い、代入式の間違いが多いです。あとは、本人の勘違い(決定係数の式だと思っていたものがほかの式だった等)

trumpet_eam
質問者

お礼

定義式を見直して計算しなおしたところ無事1以下の値になりました,ありがとうございます。 因みに今回使用した決定係数算出法は以下のアドレスのHPを参照したものなのですが,この方法はどこが問題だったのでしょうか?もしよろしければ後それだけご教授頂ければ幸いです。 http://software.ssri.co.jp/statweb2/tips/tips_15.html

関連するQ&A

  • 回帰係数のt検定について

    回帰係数の検定では回帰定数を0とした帰無仮説とするということを、とあるテキストに書いてあり、その場合のt検定の式が下記のようになるらしいですが t=(求めた回帰定数)/√{(残差平方和)/(n-2) /(説明変数の偏差平方和)} このような式に至る過程を詳細に知りたいです。 どなたか詳しい方は教えて頂けませんでしょうか?一番気になる点は自由度が(n-2)になる点です。何卒宜しくお願い致します。

  • 非線形回帰モデル式

    非線形回帰モデル式の種類やその曲線の形状に関する情報が掲載されたサイトをご存知の方,ご教示いただければ幸いです. 非線形回帰式に実験データをあてはめて,回帰式のパラメータ推定を試みています.解析に使うソフトはpolymath6.1(あるいはエクセル2007)で,回帰モデル式を記述してフィッティングを行います.あてはめたい式は,もともとエクセルに入っているような回帰式よりも複雑なものです.たとえば「○○曲線」と称する回帰モデル式が多数知られていると思いますが,データにフィットしそうな回帰モデル式を探す際に,どのような種類の回帰モデル式があって,それはどのような曲線の形になるのか,といったことを前もって調べられたらいいな,と考えております. 宜しくお願い致します.

  • 原点を通る重回帰式の偏回帰係数

    はじめまして。 目的変数に対し、3つの説明変数を持つ資料があり、原点を通る重回帰式をたてたいところです。Excelなど、計算機の機能によって答えはわかっているのですが、式を作る計算過程を説明する資料を作らなければならなくなりました。 Y = aX+ bW + cZ Y: 目的変数 X:説明変数1 W:説明変数2 Z:説明変数3 a,b,c : 偏回帰係数 について、残差平方和 {Σ(Yi - ( aXi + bWi + cZi ))}^2を最小にするa,b,cを求めたいのです。残差平方和に対し、a,b,cで偏微分するといいのだ・・・などという理論は概ねわかりますが、私の数学力では、実際に計算過程を書き表すことができません。 説明変数が2つで、原点を通らない重回帰式の偏回帰係数の計算方法については、たとえば、以下のURLに書き表した例があります。 http://aoki2.si.gunma-u.ac.jp/lecture/Regression/mreg/mreg1.html このような書き表しの例で、説明変数が3つで、原点を通る重回帰式の偏回帰係数の計算方法をご紹介、またはご提示いただけないでしょうか。 どうかよろしくお願いいたします。

  • 複数の回帰直線を1本化する方法

    自分の実験結果を既往の研究と比較することを考えており、解析に必要なものとして相手の回帰直線があります。 先方の論文には8つの小グループの個々の回帰式、決定係数、データ数が明記されていますが、全データに対する回帰式と決定係数は書かれていません。複数の小グループの回帰式から全体に対する回帰式を求めるにはどうすればいいのでしょうか。

  • エクセルグラフの回帰式

    よろしくお願いします。 エクセルのグラフ近似で4次関数の回帰式を算出しました(添付)。 その回帰式から、試しにXに中央値122を入力してYを求めようと したところ、Yが223になってしまいました。 回帰曲線、実データからかけ離れた値になり困っています。 回帰式の読み方が間違っているのでしょうか? アドバイスよろしくお願いします。

  • 回帰分析

    回帰分析をやってベータ値や決定係数などはわかったのですが、t値がわかりません。t値から何が分かったり、できたりするのですか?

  • 回帰直線と相関係数

    ある任意の回帰直線に対する相関係数の求め方をどなたか教えていただけないでしょうか。 EXCELでは近時曲線(直線)を書いて、その曲線に対する相関係数を算出していると思います。 また、切片を任意に変更することによって相関係数が変わっています。 説明不足でしたら、ご指摘いただけたら幸いです。

  • エクセルにおける回帰分析について

    統計分析初学者です。よろしくお願いいたします。 お聞きしたいのは、エクセルにおいて 回帰分析した結果の決定係数と散布図作成から近似曲線作成した場合の決定係数に違いがあるケースがあります。これはどう解釈したよいのかという質問です。近似曲線はもちろん線形で近似させています。マイクロソフトのサイトでは散布図からの近似曲線は最小2乗法によるとのことですので、縦軸と横軸を入れ替えても決定係数は変わらないと思っているのですが、このケースの場合変わってしまいます。ご存知の方がいましたら、是非教えていただきたいと思います。 <追記> パワーポイント資料等で説明する際には、 やはり決定係数だけでなく、t値やP値も併記するべきなのでしょうか。 合わせて皆様の見解をお聞かせください。 よろしくお願いいたします。

  • 行列の平方和とは?

    初歩的な質問でお恥ずかしいのですが・・・。 行列Xと、負荷量ベクトルpがあります。 Xの各要素は標準化されています。 内積(p, p)、つまり、t(p)*pを、行列Xの平方和SS(X)で割ることによって寄与率を求める、 という記述に出会ったのですが、どうも腑に落ちません。 ここで、t(p)はpの転置ベクトルという意味で用いています。 t(p)*pがスカラーになるのはわかります。 しかし、SS(X)については、もしXがn行×m列の行列だった場合、 SS(X)=t(X)*Xで、n行×n列の行列になります。(よね?) スカラーを行列で割るというのがわからず、おそらく何か誤解をしているのだと思います。 それとも、行列Xの平方和SS(X)とは、t(X)*Xの主対角要素の和のことをいっているのでしょうか? もしそうだとすれば、Xは標準化されているため、tr(t(X)*X)=nとなり、 寄与率はt(p)*p/nで求められることになり、すっきりと理解できるのですが・・・。 付け焼き刃で勉強する不届きな文系人間に、どなたか説明していただけないでしょうか? お手数をおかけしますが、よろしくお願いいたします。

  • 回帰分析について

    はじめまして。 統計の回帰分析について質問です。 エクセルにて回帰分析をし、係数から回帰式を作成しました。 しかしt値の意味がわかりません。 どなたか教えてください。 よろしくお願いします。