• ベストアンサー

回帰直線の求め方

(x,y)のデータが沢山あるとします。 そしてxとyの間に直線関係(比例関係)が認められそうです。 Excelを使って、最小二乗法により回帰直線(y=ax+b)を求める際、aの値を固定してbを求める、そしてその相関係数を求めることはできますでしょうか。 ※単に回帰直線を計算させると、y=0.95x+bと算出されたのですが、 理屈から考えるとy=1x+bの関係がありそうなので、そのときのもっとも適当なbの値を知りたいのです。

  • favre
  • お礼率96% (276/287)

質問者が選んだベストアンサー

  • ベストアンサー
  • sanori
  • ベストアンサー率48% (5664/11798)
回答No.2

こんばんは。 相関係数というのは、直線の傾き(つまり、a)とデータとの一致度を評価するものですから、傾きを固定して考えるときには相関係数の概念はないはずです。 bを求めたいのであれば、下記。 最小二乗法の考え方を忠実に守った手順です。 回帰直線の方程式は y = ax+b 変形して 0 = ax+b-y さて、データがn個あるとして、各データを(xk、yk)と表すことにします。 (kは、1からnまで) 一組のデータ(xk、yk)を代入したとき、εk だけ誤差が発生するとして、 εk = axk + b - yk と表すことができます。 その二乗誤差は、 εk^2 = (axk + b - yk)^2 k=1からk=nまでのデータについての二乗誤差の合計は、 Σ[k=1→n] εk^2 = Σ[k=1→n](axk + b - yk)^2 これを最小にすればよいわけです。 ここで、aを定数としますが、データとして既知である xk と yk も定数です。 唯一、bだけが変数です。 よって、上の式をbで微分したものがゼロになれば、極小値を取ることになります。 Σ[k=1→n](axk + b - yk)^2 をbで微分したもの  = Σ[k=1→n] 2(axk + b - yk)・1  = 2・Σ[k=1→n] (axk + b - yk) これがゼロになるためには、 Σ[k=1→n](b + axk - yk) = 0 ここで、 Σ[k=1→n]b = nb なので nb + Σ[k=1→n](axk - yk) = 0 よって、 b = 1/n・Σ[k=1→n](yk - axk)  = 1/n[k=1→n](yk - axk)  = Σ[k=1→n](yk/n) - a・Σ[k=1→n](xk/n)  = [全部の点のy座標の平均] - [傾きa]×[全部の点のx座標の平均] つまり、平均値(average)の関数を使うだけで、bを求めることができるということなのでした。 最後に、 相関係数ではありませんが、誤差の度合いを評価する方法について。 上のほうに書いた式 Σ[k=1→n] εk^2 = Σ[k=1→n](axk + b - yk)^2 ですが、 これをn-1で割って、平方根を取る、つまり、 √{1/(n-1)・Σ[k=1→n](axk + b - yk)^2 } とすれば、縦方向(y座標)のばらつきの度合い(一次元データにおける標準偏差に相当)が出ます。

favre
質問者

お礼

ご回答ありがとうございます。 パッと読んだところで、とりあえず分かったつもりになりました(笑)。 実はこれ、仕事(実験)の解析のところで使おうとしています。 あまり詳しくは書けませんが、xは試験片の処理前、yは処理後の値なのです。 xとyの関係。xを処理をすると、単に一定量増える(y切片がずれる)だけではないかという事が分かってきたのですが、目分量ではなく統計的に近似直線を求める方法を探していたのです。 「分かったつもり」で終わってしまうのか「近似直線とバラツキを把握できるのか」、結果については補足にてご報告致します。 暫しのお時間を。

favre
質問者

補足

sanoriさま。 ご教示頂いた通りやってみました。 式も概ね理解できましたし、a=1に固定した場合のbの値も分かりました。一次元方向のばらつきも求めました。 xyグラフ上に全点をプロットし、求めた直線(y=1x+b)を乗せてみて、ビジュアル的にも納得できました。 ありがとうございました。 今度は#1のソルバーの方もトライしてみたいと思います。

その他の回答 (1)

回答No.1

ソルバーを使います。 EXCELのヘルプでソルバーと入力してください。 ソルバーのインストールも必要です。 インストール方法もヘルプに書いてあります。 (1)あらかじめ仮のbの値をいれておく。 (2)仮のbをつかってyを求める。 (3)Z=(真のy-計算のy)の2乗を求める。 #Zが負にならないようにするためです。 (4)ΣZが最小になるようにbを動かす。 #ここでbを求めるときソルバーを使います。

favre
質問者

お礼

さっそくの回答ありがとうございます。 ”ソルバー”。 何者なのか分かりませんが使ってみます。 Excel、とても便利なのですが、決まりきった操作だけで、最近全然機能を開拓していません。 良い機会なのでトライしてみたいと思います。 結果は補足にてお伝えするつもりです。 暫しのお時間を。

favre
質問者

補足

mistery200さま。 ソルバー使えました。 そして#2でご教示頂いた方法と同じ解が得られました(あたりまえか)。 もっと勉強していけば、複数の変数、条件つきの変数を最適化する場合など、色々と使えそうですね。 大変役にたちました。 ありがとうございました。

関連するQ&A

  • 回帰直線を求める問題

    通常の(EXCELの図や関数などで求まる)回帰直線 y = ax + b について考えよ,という問題です。 1. 相関が0であるデータ分布に対しては,直線の回帰係数つまり,傾きaは,0/0となり不定(求まらない)である。 これは,正しいか?間違いなら,数値を述べよ。 例えば,単位円上にx軸から45度ずつ,8点を取る。以下のデータである。 x      y 1      0 1/√2  1/√2  0       1 -1/√2  1/√2 -1      0 -1/√2  -1/√2 0      -1 1/√2  -1/√2  これに回帰直線を当てはめるのは不自然だが,回帰係数の性質を学ぶために,やってみよう。  すると,相関0なのに,傾き0の直線,y=0が出てしまう(添付図参考)。これは何かの間違いか?そんな例も考えてみよう。 統計ソフトを利用して考えても良い。 2. 最小二乗法で,回帰直線を求めるとき,直線のx方向にもy方向にも最小二乗となる。 これは,正しいか?間違いなら,正しく述べよ。あくまで,通常の最小二乗法である。 なお,工業統計では, 1正しい。傾き0 となることはない。 2正しい。つまり,x,yどちらから見ても最小二乗となる。 となるが,ここでは一般的に考えてみよう。 工業統計の参考として,このOKにも回答があるので,参考にして良い。 http://okwave.jp/qa/q6733154.html

  • 回帰直線

    吸光度と濃度の回帰直線をもとめるにはどうしたらいいのでしょうか。 濃度        Abs 0.0000740     1.0 0.0000909     1.20 0.000118      1.25 ちなみにこの値は実験結果です。 最小二乗法を用いて求めるらしいのですが、 エクセルを用いて算出する値と、他のソフトを使って算出する値が大きく違ってどちらが正しいのかわかりません。

  • 統計学 相関係数の算出に関する質問

    統計学 相関係数の算出に関する質問 統計学の勉強中ですが、以下の問題で悩んでます。 「10個のデータの組(Xi,Yi)があり、Xの総和が20、Yの総和が20、X^2の総和が50、Y^2の総和が50、XYの総和が30である。 最小二乗法で回帰直線を求め、その上で相関係数を求めよ。」 最小二乗法で回帰直線の方程式が Y=-X+4 であることは求められましたが、 その次の相関係数の算出でつまづいてます。 どなたか、解法を教えてください。 補足ちなみに、Excelではなく手計算での算出です。 同様の問題を自力で解答できるように、 途中式等の解法の説明も、よろしくお願いします。

  • 回帰直線と相関係数

    ある任意の回帰直線に対する相関係数の求め方をどなたか教えていただけないでしょうか。 EXCELでは近時曲線(直線)を書いて、その曲線に対する相関係数を算出していると思います。 また、切片を任意に変更することによって相関係数が変わっています。 説明不足でしたら、ご指摘いただけたら幸いです。

  • 回帰直線

    以下のデータに対し、回帰直線y=ax+bのaとbを求めよという問題です   x  1  3  5   y  2  4  7 解説部分  で x・x=35 1・x=9 x・y=49   1・y=13 n=3より (n以外は、ベクトル)    33a+9b=49    9a+3b=13 を解いてと解説しています  解説部分の意味がまったくわかりません   

  • プログラム作成。一次回帰曲線について。

    N88互換BASICのフリーソフトにて作成しています。 100個の(X,Y)データの一次回帰曲線を最小自乗法で求める問題について質問したいと思います。 最小自乗法とは、回帰曲線を表す方程式の係数を、各データと回帰曲線との間の距離(誤差)の自乗の総和が最小となるよう定める方法を指します。 一次回帰曲線で相関関係を表す場合、XとYとの関係式はY=aX+bとなる。 最終的に求めるべき問題は、このaとbである。 y方向だけに誤差が含まれているものと仮定する条件もあります。 必要な(X,Y)データ100個は乱数を用いて自動で作成します。下記が与えられ、丸写しし、先へと進めます。 10 Randomize 500 20 Dim X(100), Y(100) 30 For I=1 To 100 40 X(I)=Rnd*10:Y(I)=X(I)+(2*Rnd-1) 50 Next 最終的には、aとbを算出するプログラムを施し、Y=aX+bを表示します。 シグマ計算が多く、ここでは表示方法がよくわからないので省略しますが、アドバイス頂ける方、よろしくお願いします。勉強不足ゆえ、毎度の事でご迷惑お掛けします。

  • 回帰直線について質問なのですが・・・。

    回帰直線について質問なのですが・・・。 (Σはi=1からnまで) a=Σ(x_iy_i-bx_i)/Σx_i^2 b=(Σy_i-aΣx_i)/n=平均y_i-a平均x_i という式があります。 x=0のときy=0,x=1のときy=1,x=2のときy=4,x=3のときy=9,x=10のときy=36 というデータセットがあったとき、これらのデータに対する回帰直線y=ax+bってどうなりますか? やり方がよくわかりません。教えていただけませんか?

  • 回帰直線を交えたグラフを書く課題なのですが

    回帰直線を交えたグラフを書く課題なのですが まず回帰式の傾きと切片はだせました そこから回帰直線?をださなきゃいけないのですがよくわかりません… 課題では物理の特点を出す となっているのですが … 数学の点数をx 物理をyとして 式y=ax+bに代入したらでる と書いてあります その場合 セルにはどんな式を記入したら答えがでるのでしょうか? わかりにくくてすみません よろしくお願いいたします…!

  • 回帰分析のフィット具合について質問させて頂きます。

    回帰分析のフィット具合について質問させて頂きます。 回帰直線や回帰曲線のフィット具合(当てはまり具合? )を見る指標として、カイ二乗値(値が小さいほど良い)と相関係数(値が大きいほど良い)があるんですよね? この二つの指標は、どう違うのですか?また、どちらの値が優れているほうが、よりフィットしていると言えるのですか? よろしくお願いします。

  • 回帰 独立性

    こんにちは。生物を学んでいるのですが、統計学が必要なので勉強し始めました。単回帰について、質問があります。 2変数xとyとのあいだのピアソン相関係数や決定係数を求める際、 たとえばy=x-zのようにyがx自体の関数として表せる場合、単純に求めた相関係数や決定係数は意味がありますか ? (ここでzはxの関数であるかもしれないし、そうでないかもしれなく、つまり、具体的な関数の形はわかっていないと考えてください) 友人に、zの具体的な関数の形はさておき、yはとにかくxの関数であり、xとyは独立ではないので、上記の統計はあまり意味がないと言われました。でもそれはおかしいと思ったのです。なぜなら、仮にaとbが独立だとして、回帰分析後に相互に相関があるとわかった場合、結局bはaに依存している(あるいはその逆)という結論が導きだされ、それはaとbは独立でなかったことを意味し、よってその統計に意味がなかったとされ、aとbを比べるということ(すなわち回帰分析自体)が意味がないということになってしまいます。 つまり、独立かどうかの判断が、統計を行う前になされるか後になされるかの問題にすぎず、aとbとの間の相関を見つけるために回帰分析をしたい人にとっては、永久に相関を見つけることができないということになります(なぜなら相関を見つけるということは、aとbが独立でなかったことを示す事他ならないからです) よろしくおねがいします。