• 締切済み

近似曲線からはずれるデータの抽出・削除

最適な近似曲線を引く際に、明らかに誤差とされるデータを除いた上で行ないたいと考えています。 つまり、散布図のようなプロットに近似曲線を引いたとき、 極端にその近似曲線から外れているとされるデータを抽出し、削除する方法を探しています。 例えば、 X 1 2 3 4 5 Y 1 3 100 7 9 のとき、三番目のYのみを削除し、求めたい近似曲線に最適化したいです。 回答よろしくお願いします。

みんなの回答

  • foobar
  • ベストアンサー率44% (1423/3185)
回答No.1

よく使われる手順としては、以下のような方法があるかと思います。 1. 最初に全部のデータを使って、近似を行い、各点の近似曲線からのずれを計算する。 2. 標準偏差σを計算する。 3. ずれが3σより大きなデータは、異常データとして除外する。 4. ずれの大きなデータを除外した残りのデータで改めて近似曲線を作る。 ここで留意しないといけないのは、データの除外は一度だけ行う(上記の操作を何度も繰り返して行わない。)ことかと思います。

関連するQ&A

  • 1/x^2のような近似曲線の求め方

    いつもお世話になっています. 近似曲線の求め方について,教えてほしく投稿しました. X軸とY軸の2軸からできる散布図のデータプロットが手元にあります. このデータに対して,y=A(1/x^2)+B,のようにX値の2乗の逆数としての近似曲線を求めたいのですが,その方法を教えてもらえますか? エクセルで求めようとしたのですが,標準で選択できる近似曲線では,このような近似方法はなく,どうすればよいか困っております. よろしくお願いします.

  • 多項式近似

    エクセルであるデータの散布図を作りました。 ばらつきがみられたので、近似曲線をどうしようかと思ったのですが、6次の多項式近似を行ったところ、プロットした点をほぼすべて正確に通る近似曲線がひけました。 その近似式の式は y==3E-10*x^6 - 8E-08*x^5 + 8E-06*x^4 - 0.0004*x^3 + 0.0091*x^2 - 0.0695x + 0.3314 でした。 R^2も0.999でほとんど1だったので、このデータ(曲線)の式=近似曲線の式とみなしてもいいと思ったのですが、ダメなのでしょうか? 実際のデータではx=97.12561のときy=6.37なのですが、この式に代入するとy=-14になってしまいます。 なぜでしょうか? E-10というのは10^(-10)ということで正しいですよね?

  • エクセルのグラフの近似曲線について

    エクセル2003で散布図を作成後、近似曲線を追加しました。その後、その近似曲線と同様の演算をするセルを作りましたが、散布図にプロットした値と全く異なる値を弾き出しました。何がいけなかったのでしょうか?

  • 近似曲線と近似式の結果のちがい

    X軸1200、900、600、300 Y軸900、600、480、300 これを散布図でグラフ化して、多項式(3次)で近似曲線を表示すると ちゃんと4点を通過する曲線が表示されます。 ところが、この近似曲線の近似式を表示させて、その式にXの値を入力すると、 グラフとまるでかけ離れた数値になります。 データ数が少なすぎるためでしょうか。

  • 近似曲線の方程式

    Microsoft Excel で散布図のグラフを作成し、近似曲線の方程式を求めました。 すると、 y = 523507x + 1E + 06 となりました。 この、「E」とは何でしょうか。 そして、y = 5197212 のとき、x はどうなるのでしょうか。 すみませんが、どなたか教えてください。

  • 近似曲線の設定方法

    Sma4 for Windows で、あるデーターのプロットを取りました。 このプロットに対して、近似(フィッティング)曲線をつくるため x,yの関数としてy=1-(b/1+(c/x))を入れたいのですが、うまくいきません。 bとcはxの変化によって変化する定数の事です。  Sma4起動中の、どこに式を入れればいいのか教えて下さい。  つまり、プロットに対して近似曲線を作るための式の設定方法を教えて下さい。

  • excelの近似曲線について

    近似曲線がデータプロット上を通る場合、そのデータプロットの上を近似曲線が通ってしまうんですが・・・・意味通じるでしょうか・・。データプロットの上を近似曲線が通る場合、団子にささった串のようになかの棒が見えないようにしたいのです。マーカーの色を色々変えてみたりしたのですが、駄目でした。 説明が足りないかもしれませんが、指摘してもらえれば補足しますので、わかる人がいましたらよろしくお願いします。

  • エクセルの近似曲線(直線)

    いつもお世話になっております。 ある実験での測定結果をグラフにしたいのですが困っています。 測定は二回行ったので、一回目と二回目それぞれの近似曲線が記入可能でした。しかし、どうしても、グラフ上に、二本近似曲線がひかれてしまいます。それを一本にしたいのですが可能でしょうか。 データはおよそこんな感じです。 一回目→(x=1.3のときy=1540)     (x=0.7のときy=840)         (x=0.3のときy=600)     (x=0.2のときy=250) 二回目→(x=1.3のときy=2300)     (x=0.7のときy=680)         (x=0.3のときy=630)     (x=0.2のときy=260) 散布図で、8点がグラフに描かれますが、8つのポイントのぶれ具合を考慮したうえで、一本の近似曲線(直線の一次関数)を引くことが出来ますでしょうか? 例えばxが1.3のときy=1540と2300なので、大きくぶれが生じます。単にxが1.3、0.7、0.3、0.2のときの2つのy測定結果を足して平均するだけでは、グラフの傾きが正常より上がりすぎ困ります。 説明が下手ですいません。 とにかく、複数のxに対するyの値がそれぞれ2つある場合、そのそれぞれの点の真ん中らへんを通る直線が引きたいのです(そのとき直線は大きく外れたデータのポイント付近に存在しないようにする)。 よろしくお願いします! 一回目データと二回目のデーターから得られるそれぞれの近似曲線(一次関数)の傾きと切片の平均からなら一本の直線が求められるなど、どんな些細なことでもいいのでお願いします。

  • Excelの近似曲線で求めた式の検算が合わない?

    Excel2007 Windows Vista です。 A1~A5のセルに順次 8809 8876 8831 8929 8917 と入力しました。 B1~B5のセルに順次 215014 225187 233321 218311 213570 と入力しました。 これらのデータから、 挿入→散布図→散布図(マーカーのみ)→レイアウト→近似曲線→ その他の近似曲線オプション→多項式近似→次数(4とした)→グラフに数式を表示する→ グラフにR-2乗値を表示する と操作すると、 y=0.0001X^4-3.962X^3+50923X^2-3E+08X+6E+11 R^2=1 と表示されます。 ここで検算の意味で X=8809 と入力すると y=-1.97285E+11 となって y=215014 とはなりません。 どこがまずいのでしょうか。 宜しくお願いいたします。

  • 近似曲線におけるR-2乗値の名前

    エクセルで散布図に点をプロットし、引いた近似曲線において 信頼性の参考値となる、R-2乗値の正式な名前は何というのでしょうか? 教えてください。