• ベストアンサー
  • 困ってます

最小二乗法ってなんですか

件名の通り最小二乗法ってなんですか? 自分なりに調べてみましたが、イマイチ分かりません。 皆さんからすれば、初歩的な事かもしれませんが、ご教授下さい。 例えば、5つのサンプルの長さを測定して、 1 2.5 2 5.7 3 3.8 4 9.3 5 8.6 を得たとします。 これをエクセルで散布図にして線形近似曲線を引くと、 y=1.58x+1.24と近似式が出ますが、何を意味しているのですか? (具体的に言うと、上記の近似式の値が大きいほどばらつきが大きいってこと?)

共感・応援の気持ちを伝えよう!

質問者が選んだベストアンサー

  • ベストアンサー
  • 回答No.2

たとえばバネに分銅を吊るしてどれだけ分銅が下がったかを測ってみます。 よく知られているようにバネはかけた力に比例して伸びますから、重りの質量をmとして mg = k (x - x0) という式が成り立ちます。これを変形すると、 x = x0 + (g/k) m となります。したがって、横軸に分銅の重さを、縦軸に下がった距離をとってグラフにすると直線になるはずで、 その直線の傾きからg/kが、つまり、重力加速度gは機知の量なのでバネ定数kがわかります。 切片からはバネの自然長の位置x0がわかります。 プロットした点が完全な直線になればめでたしですが、実験ですからどうしても誤差が入り込んで、 測定点は直線のまわりで上がったり下がったりします。 そういう場合に、もっとも確からしい傾きや切片の推定値を求める方法が最小二乗法です。 そのエクセルのデータがこのケースであれば、y=1.58x+1.24の1.58からバネ定数が、 1.24から自然長の位置x0がわかります。最確値ですが。 ここは見ましたか? http://szksrv.isc.chubu.ac.jp/lms/lms1.html

共感・感謝の気持ちを伝えよう!

質問者からのお礼

ありがとうございました。

その他の回答 (1)

  • 回答No.1
  • asuncion
  • ベストアンサー率33% (1924/5809)

当該の5個のサンプルが直線y=ax+b上に並んでいるとした際に、 各々のサンプルがその直線からどの程度離れているか(正確には距離の2乗だと思います)が 最小になるように、直線の傾きaとy切片bを決めるための方法のことをいうのだと思います。 今回の場合、その5個のサンプルがどういう直線上に載っているかを決めようとしたとき、 y=1.58x+1.24 とした場合が、最も距離の2乗(直線からのばらつき)が小さくなりますよ、ということだと思います。

共感・感謝の気持ちを伝えよう!

質問者からのお礼

ありがとうございました。

関連するQ&A

  • 最小二乗法での線形近似

    excelの最小二乗法による線形近似でわからないことがあります. たとえば,xy平面でデータが散布している状況で・・・ データがほぼ垂直(y軸に平行)に分布している場合,最小二乗法による線形近似がうまくいきません. ばらつきは少ないはずだから,決定係数も高くなると思うのですが,垂直線ではなく斜めの直線が引かれてしまい,決定係数も低くなってしまいます. これは,垂直線だと傾きaの値が∞に大きくなり,データの大きさ(?)上,近似不可能ということなのでしょうか?

  • 円の最小二乗法の公式

    いくつかのデータから最小二乗法で近似曲線を求めたいのですが、よくわかりません。そのデータ集の近似曲線は円になります。 最小二乗法を調べ、1次、2次関数についてはわかりました。ある点の座標を(x1,y1), (x2,y2)…、近似曲線上の座標を(x1,y’1),(x2,y’2)… とした時、 (y’1-y1)^2 + (y’2-y2)^2 … が最小となるような係数a,b などを偏微分 → 連立方程式で求めるという方法でした。 円についても、同様の方法で r^2 = (x-a)^2 + (y-b)^2 のような近似曲線の式が求められるのでしょうか?1次関数などのように、y’1-y1を求めようとすると、±√ が出てきてしまい、ややこしくなる気がしますが、これを解くしかないのでしょうか?もしくは別の解法があるのでしょうか?詳しく教えていただけたらと思います。よろしくお願いします。

  • 散布図からの近似曲線、近似式の出し方(Xの値が大きくなると、ある一定のYの値に限りなく近づく場合)

    少々複雑な酵素反応から得られた、あるデータから散布図を書きます。 これから求められる曲線は、Xの値が大きくなると、Yの値は、ある一定の値に限りなく近づくと考えられます。 (プラトーに達するという意味です。反応系から行っても、多分、そうなると予測はつきます。) しかし、マイクロソフトExcelでは、そのような近似曲線はかけません。 このような近似曲線(近似式)は、何というのでしょうか? このような近似曲線および、近似式、R2乗値、がでるフリーソフトウェアが教えて頂けないでしょうか? 実際にやりたいのは、その近似式を使い、Yが特定の数値の場合、Xの値はいくつなのかを計算したいと考えています。 わかりづらい質問で恐縮ですが、大変困っています。 どうぞ、よろしくお願いします。

  • 最小2乗法とエクセル

     質問したいのですが、(x,y)=(0.1,0.306),(0.3,0.807),(0.5,1.177),(0,0)の値を利用して、最小2乗法を使ってエクセルでグラフを書きました。このとき、自分で計算した値と、エクセルで作成したグラフで近似線を描き、その直線の式を出したものとでは値が異なりました。なぜでしょうか?

  • 最小二乗法の応用について

    実験により、xに対するyの値をxの値をかえながら、N回測定した。測定したxに対するyの関係をグラフに描くと、次の二次関数で表現するのが適当であることがわかった。 y=ax*x+bx+c この時、最小二乗法によりパラメータa、b、cの値を求める式を導出せよ。という問題なのですが、どのようにしたら最小二乗法で求めることができるのですか? どうか教えてください

  • 多項式近似

    エクセルであるデータの散布図を作りました。 ばらつきがみられたので、近似曲線をどうしようかと思ったのですが、6次の多項式近似を行ったところ、プロットした点をほぼすべて正確に通る近似曲線がひけました。 その近似式の式は y==3E-10*x^6 - 8E-08*x^5 + 8E-06*x^4 - 0.0004*x^3 + 0.0091*x^2 - 0.0695x + 0.3314 でした。 R^2も0.999でほとんど1だったので、このデータ(曲線)の式=近似曲線の式とみなしてもいいと思ったのですが、ダメなのでしょうか? 実際のデータではx=97.12561のときy=6.37なのですが、この式に代入するとy=-14になってしまいます。 なぜでしょうか? E-10というのは10^(-10)ということで正しいですよね?

  • 非線形最小二乗法のmarquardt法とsimplex法に関して

    ほぼ一定の周期を持つデータがあり、それに対してy = a*cos(b*X+c)+d*X+eという形の近似式を求めたいと思っております。 いろいろ調べてみると非線形最小二乗法を利用して、求めればいいことが分かりました。 しかし非線形最小二乗法にはmarquardt法とかsimplex法などがあることが書かれていたのですが、それらの処理法が何をどうしているのか、参考書を見ても、よく分からず、脳が悲鳴をあげています。 この非線形最小二乗法のmarquardt法とsimplex法に関して、違いと求め方を素人でも分かるような形で教えていただくことができましたら、どうかご教授よろしくお願い致します。

  • EXCELの近似曲線について

    右下がりで途中から一定値になるような実験をし、EXCELで表を作りました。その値を散布図のグラフで作ったのですが結構バラツキがあり近似曲線で表したいんですがどの近似曲線が最適なのかアドバイスをくださいm(_ _)m

  • 最小二乗法とデータのばらつきを除去

    実験データに最小二乗法を適用して近似関数(y=ax+b)を求めたいです。 しかし,実験データにはばらついた値があり,得られた近似関数も それらの値によって,おおきくずれてしまいます。 そこで,何らかの方法でばらついた値を排除していき, 信頼できる近似関数を求めたいと思います。 聞いたところ,正規分布か何らかの方法で, 信頼区間(95%)以外のデータを除去すれば良いと のことですが,具体的な方法が分かりません。 実験データyi,xiと最小二乗法でy(=a*xi+b)から どのような処理をすればよいのか教えてください。 よろしくお願いします。

  • 近似曲線におけるR-2乗値の名前

    エクセルで散布図に点をプロットし、引いた近似曲線において 信頼性の参考値となる、R-2乗値の正式な名前は何というのでしょうか? 教えてください。