回帰直線を求める問題

このQ&Aのポイント
  • 回帰直線を求める問題について考えます。相関が0であるデータ分布に対して回帰直線を当てはめると、傾き0の直線が得られることがありますが、これは何かの間違いです。最小二乗法によって回帰直線を求める際は、直線のx方向にもy方向にも最小二乗となります。
  • 回帰係数を求める際に相関が0であるデータ分布に対して回帰直線を当てはめると、傾き0の直線が得られることがありますが、これは誤りです。最小二乗法によって回帰直線を求める際は、直線のx方向にもy方向にも最小二乗となります。
回答を見る
  • ベストアンサー

回帰直線を求める問題

通常の(EXCELの図や関数などで求まる)回帰直線 y = ax + b について考えよ,という問題です。 1. 相関が0であるデータ分布に対しては,直線の回帰係数つまり,傾きaは,0/0となり不定(求まらない)である。 これは,正しいか?間違いなら,数値を述べよ。 例えば,単位円上にx軸から45度ずつ,8点を取る。以下のデータである。 x      y 1      0 1/√2  1/√2  0       1 -1/√2  1/√2 -1      0 -1/√2  -1/√2 0      -1 1/√2  -1/√2  これに回帰直線を当てはめるのは不自然だが,回帰係数の性質を学ぶために,やってみよう。  すると,相関0なのに,傾き0の直線,y=0が出てしまう(添付図参考)。これは何かの間違いか?そんな例も考えてみよう。 統計ソフトを利用して考えても良い。 2. 最小二乗法で,回帰直線を求めるとき,直線のx方向にもy方向にも最小二乗となる。 これは,正しいか?間違いなら,正しく述べよ。あくまで,通常の最小二乗法である。 なお,工業統計では, 1正しい。傾き0 となることはない。 2正しい。つまり,x,yどちらから見ても最小二乗となる。 となるが,ここでは一般的に考えてみよう。 工業統計の参考として,このOKにも回答があるので,参考にして良い。 http://okwave.jp/qa/q6733154.html

質問者が選んだベストアンサー

  • ベストアンサー
  • takurinta
  • ベストアンサー率71% (64/90)
回答No.1

1. Yを目的変数、Xを説明変数とする回帰分析で、Yの予測値と実測値の差についての最小2乗推定をするのであるならば、傾きa=0となります。 2. 世間で最も使われているものを通常の最小二乗法と呼ぶのであれば、それは、目的変数の実測値と説明変数から推定された予測値との差についての最小二乗法なので、Y方向について最小二乗となります。X方向については最小二乗にはなりません。極端な場合が1. の円形の例で、Xを目的変数とする回帰分析にすると、X方向についての最小二乗になりますが、そのとき回帰直線 X = cY + d はY軸方向の直線、つまり、c=0の直線になります。

Iguchi_Y
質問者

お礼

ありがとうございます。 全く,そのとおりだと思います。 思います,どころか,それが通常のいわゆる,Ordinary Least Square: OLS です。 質問の一番下に挙げたサイト http://okwave.jp/qa/q6733154.html で,さかんに回答されているsanoriさんという方,自己紹介を見ると,理系だと書いてあり,工業統計をやっているらしいが,通常の定義と,どう違うものを使っているのだろうか,と思ってしまう。 sanoriさんの誤解を指摘したら,私のほうが間違っている,と繰り返し反論されている。 takurintaさん,全く正解で,ベストアンサーにしたいけど,今すると,締め切りになってしまうので,もう少し待ちます,他にも誤解してる人がいるかも。。 すみません。

Iguchi_Y
質問者

補足

>他にも誤解してる人がいるかも。。 と書いたのは,ちょっと間違いで,実際に,工業統計では,そう使われているかも,という気がする。 もしそうなら,参考サイト,文献が知りたい。

関連するQ&A

  • 回帰直線の求め方

    (x,y)のデータが沢山あるとします。 そしてxとyの間に直線関係(比例関係)が認められそうです。 Excelを使って、最小二乗法により回帰直線(y=ax+b)を求める際、aの値を固定してbを求める、そしてその相関係数を求めることはできますでしょうか。 ※単に回帰直線を計算させると、y=0.95x+bと算出されたのですが、 理屈から考えるとy=1x+bの関係がありそうなので、そのときのもっとも適当なbの値を知りたいのです。

  • 統計学 相関係数の算出に関する質問

    統計学 相関係数の算出に関する質問 統計学の勉強中ですが、以下の問題で悩んでます。 「10個のデータの組(Xi,Yi)があり、Xの総和が20、Yの総和が20、X^2の総和が50、Y^2の総和が50、XYの総和が30である。 最小二乗法で回帰直線を求め、その上で相関係数を求めよ。」 最小二乗法で回帰直線の方程式が Y=-X+4 であることは求められましたが、 その次の相関係数の算出でつまづいてます。 どなたか、解法を教えてください。 補足ちなみに、Excelではなく手計算での算出です。 同様の問題を自力で解答できるように、 途中式等の解法の説明も、よろしくお願いします。

  • 相関係数と回帰直線ってなんですか?

    相関係数と回帰直線ってなんですか? ある資格の勉強をしているのですが、上の2つの用語の意味がよく分かりません。自分なりに調べたのですが、???な状態です。 どなたか、用語の意味を簡単に説明してください。 また、相関係数や回帰直線を調べることによって何が分かるのでしょうか? ちなみに私は、統計学についてはド素人ですので、専門用語などはまったく分かりません。説明する際、専門用語の使用はできるだけ避けてください。お願いします。

  • 相関係数と回帰直線の使い分け

    相関係数は2つの変数とも無作為型であること、回帰直線は片方の変数は固定型であること・・・ということが、統計の本には書いてあります。 なぜでしょう? 片方の変数が固定型であった場合、相関係数を求めてはいけないのでしょうか?

  • 回帰 独立性

    こんにちは。生物を学んでいるのですが、統計学が必要なので勉強し始めました。単回帰について、質問があります。 2変数xとyとのあいだのピアソン相関係数や決定係数を求める際、 たとえばy=x-zのようにyがx自体の関数として表せる場合、単純に求めた相関係数や決定係数は意味がありますか ? (ここでzはxの関数であるかもしれないし、そうでないかもしれなく、つまり、具体的な関数の形はわかっていないと考えてください) 友人に、zの具体的な関数の形はさておき、yはとにかくxの関数であり、xとyは独立ではないので、上記の統計はあまり意味がないと言われました。でもそれはおかしいと思ったのです。なぜなら、仮にaとbが独立だとして、回帰分析後に相互に相関があるとわかった場合、結局bはaに依存している(あるいはその逆)という結論が導きだされ、それはaとbは独立でなかったことを意味し、よってその統計に意味がなかったとされ、aとbを比べるということ(すなわち回帰分析自体)が意味がないということになってしまいます。 つまり、独立かどうかの判断が、統計を行う前になされるか後になされるかの問題にすぎず、aとbとの間の相関を見つけるために回帰分析をしたい人にとっては、永久に相関を見つけることができないということになります(なぜなら相関を見つけるということは、aとbが独立でなかったことを示す事他ならないからです) よろしくおねがいします。

  • 回帰直線と相関係数

    ある任意の回帰直線に対する相関係数の求め方をどなたか教えていただけないでしょうか。 EXCELでは近時曲線(直線)を書いて、その曲線に対する相関係数を算出していると思います。 また、切片を任意に変更することによって相関係数が変わっています。 説明不足でしたら、ご指摘いただけたら幸いです。

  • 統計最小二乗法から95%正しい値を推定したい

    どなたか教えてください。私は統計は苦手なのですがどうしても必要になってしまい困っています。 問題は、最小二乗法で求めた直線式があるとします。X-Yとします。あるXの値X1に対応するY1値は直線式から出ますが、それは100%正しくは無いはず。例えば95%正しいYの範囲はいくつ? 相関係数とかで求まらないものでしょうか?

  • 最尤法で回帰直線の傾きと切片を求めるには?

    今回、業務で初めて回帰直線を扱うことになりました。 大昔に最小二乗法で回帰直線を描くプログラムを書いたのですが、今回はお客様より最尤法を適用できませんか?と言われています。 インターネットで調べてみたのですが、中々思うような情報を得ることが出来ません。 最尤法で回帰直線の傾きと切片を求める方法又は、プログラムが説明されているwebサイトや書籍はありませんでしょうか? ちなみに、最尤法自身もあまり理解できていませんので、こちらの参考文献も教えていただけるとうれしいです。 統計については、初心者ですので、的外れであればご指摘ください。

  • 回帰直線の意味

    回帰の意味は、gooの国辞書で、 一周してもとへもどること、とある。 最小二乗法で求める直線であるが、 名前からイメージがつかめない。 なっとくする説明を知っている方が いたら教えてください。 また、英語で回帰直線は どのようにいいますか? よろしくお願いします。

  • 単回帰について

    今単回帰について勉強しています。 データはそれぞれ(x,y)=(170,60),(175,80),(165,60),(160,65)として回帰直線と決定係数の求め方を教えてください。なお、エクセルは使わないやり方でお願いします。 初心者なため読みづらいかもしれませんが、どうかよろしくお願いします。