• ベストアンサー

EXCELのグラフについて

あるデータをもとに3次の多項式曲線(自然スプライン曲線)を計算し、 EXCELで描画しました。 R^2値=0.9937 です。 試しに次数を5次と入力すると R^2値=0.9999 となりました。 3次式でプロットしてあるものに対し、5次と入力することにより R^2値がより向上したので、5次の曲線を使ってもよいものなのでしょうか。

質問者が選んだベストアンサー

  • ベストアンサー
  • FT56F001
  • ベストアンサー率59% (355/599)
回答No.2

質問内容を確認すると, あるデータから3次多項式の自然スプライン曲線を作った。 スプライン曲線から計算される数値データをエクセルに入れて,3次式で近似するとR^2=0.9937, 5次式で近似するとR^2=0.9999だった, ということでしょうか? 厳密に3次式で表されるデータを,3次曲線にあてはめて近似すれば,完全に近似できるのでR^2=1.0になるはずです。 3次の自然スプライン曲線で表すとは「各区間では3次式だが区間ごとに係数が変る式」という意味です。 全体を1本の3次式で表した場合より,細かい表現になっています。全体を1本の近似多項式で表そうとすれば,多項式の次数を5次に上げれば,よりよく近似できて当然です。 質問内容を誤解していたらごめんなさい。

kakehasi
質問者

お礼

FT56F001さん、ありがとうございます。 納得がいきました。

その他の回答 (2)

  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.3

 モデルがデータを良く説明できている場合、近似を使ってAIC(赤池の情報量規範)を簡略化できます。すなわち、データの個数をn、モデルのパラメータの個数をf (k次式ならf=k+1)、そして残差二乗和をSとするとき、ln( )は自然対数として n ln(S) + 2f が小さいのがbetterだ、という判定をする。  この式は、「パラメータをm個増やすことで n ln(S)が2m以上減るのなら増やした方がいいが、さもなきゃ増やすのは過剰だよ」という意味ですね。  しかし、「これを使えば正しいモデルを見つけられる」という訳ではありません。あくまで「どっちがましか」という話です。

  • at9_am
  • ベストアンサー率40% (1540/3760)
回答No.1

> 3次式でプロットしてあるものに対し、5次と入力することによりR^2値がより向上した 当然、次数を増やすとr^2は向上します。減ることはありません。 例えば年間降水量の説明変数に猫の体重を入れても、入れる前よりもr^2は必ず同じか向上します。 これは、例えば最小二乗法であれば y = a0 + a1 x1 + ...+ an xn という式で当てはめを行った場合の残差wを w = b0 + b0 z1 という当てはめを行っているのと同じことを行うことになります。 > 5次の曲線を使ってもよいものなのでしょうか。 この結果からいえば、自由度調整r^2を考えれば下がっていると思われる(標本数が分からないので正確には分からないが)ので、良くないと思います。 いずれにしても、AICかBICを使って判定する方がモデル選択としては良いと思います。

関連するQ&A

  • エクセル多項式近似について

    エクセルで多項式近似の横に次数とあるのですが、これは何の数字をあらわすのでしょうか? また、グラフに普通に曲線をつけるのと、多項式近似では異なるのでしょうか?

  • エクセルのグラフでの近似曲線

    こんにちは。 早速質問ですが、エクセルでグラフを作成して、近似曲線を追加する時、近似曲線の式を計算してくれますよね。 その近似曲線についてなのですが、グラフを対数グラフにしたとき、近似曲線の式は自然対数で表されてしまいます。これを常用対数に変えることは無理なのでしょうか?ぜひ知っている人がいましたら教えて下さい。

  • エクセルのグラフについて教えて下さい。

    エクセルで、表から折れ線グラフを作ったのですが、そのグラフの参照するセルには、他のセルを参照して数式が入力されています。 確かに、その数式により計算された値は、もちろんグラフにプロットされますが、「=IFERROR(K13/L13,"")」で数式が満足されない時には、NULLを入れる式が入っています。 しかし、グラフを書くとNULLで表示されない値が「0」でプロットされ表示されてしまいます。 この、NULLがプロットつまり、グラフに表示されないようにするには、どうしたらよいのでしょうか? 教えてください。お願いします。

  • エクセルの折れ線グラフの近似式で得られた式を自動で入力する

    エクセルのA列に数字が入力されていてそれを基にエクセルで折れ線グラフを書くとします。 その折れ線グラフをを近似曲線で近似した場合、「近似曲線の書式設定」の「オプション」にある「グラフに数式を表示する」をチェックすると、 その近似曲線の元になる数式が表示されます。 その数式の計算式をB列に入力すると、近似曲線で得られたY値をB列に入力することができます。 ここで質問ですが、A列の数字を変えると、近似曲線の式そのものが変わってしまうため、B列のY値を得るためにはその都度、得られた式をB列に入力しなければなりません。 A列の数字を変えたとき、前もって設定した近似の種類や次数のまま、自動的にB列の近似式の数字も変更する方法(つまり得られた式を自動でB列に入力する方法)はありますか。

  • エクセルによるデータの近似式について

    (x,y)の組が100ぐらいあり、x→yを計算するための高次多項式近似を求める問題です。やり方は定型処理ですからエクセルに任せました。エクセルだと6次式まで対応してくれました。近似式による線(自動的にグラフで表示される)とプロットした点はほぼ満足できるものでした。そもそもデータ(x,y)はプロットしてみると滑らかですし、高次多項式による近似式で十分対応できるな、と思えるものです。 ところが、です。 この高次多項式の係数を表示して、その通りの関数で表計算してみてプロットすると、グラフの右方向(すなわちXが増えると)急激にデータから離れていくのです。不思議なのはその式で計算されているはずの近似式の線(自動で出力された線)からも離れていくのです。一方、Xが小さいところではしっかり一致しています。 原因として考えられるのは、多項式の高次項の係数の桁が大雑把ということがあります。2e-9*x^6+3e-6*x^5......0.0123*x+23.194 というような感じの多項式です。x^6の項の係数が2e-9というのは有効桁数が小さすぎるように思います。これが原因かなと思っているのですが。いかがでしょうか。また、それが原因ならどうやって修正すればよいでしょうか。ほかに原因と対策がありましたら教えて頂きたいのですが。

  • Excelのグラフで計算式部分の表示について

    Excelグラフを作りたいのですが、 IF(COUNT(A1:A2)>0,SUM(A1:A2),"")といったデータが入力されたら合計を求める式を含むセルを選択するとデータ未入力部分(見かけ上は空白のセル)が、0とプロットされてしまいます。 未計算部分をプロットしない様には出来ないでしょうか。 困っていますので、教えて下さい。

  • エクセルグラフの回帰式

    よろしくお願いします。 エクセルのグラフ近似で4次関数の回帰式を算出しました(添付)。 その回帰式から、試しにXに中央値122を入力してYを求めようと したところ、Yが223になってしまいました。 回帰曲線、実データからかけ離れた値になり困っています。 回帰式の読み方が間違っているのでしょうか? アドバイスよろしくお願いします。

  • エクセルのEってなんですか?二乗はどう入力?

    エクセルで多項式近似曲線を描いてのですが、 数式が、 y=2E-06x2 - 0.0025x + 9.3609 になりました。 実際に、計算式をエクセルに入れて理論値をだしたいのですが どう入力したらいいのでしょうか? そもそもEってなんでしょうか? xの二乗ってどう入力すればいいのでしょうか?? 教えてください。よろしくお願いします。

  • 多項式近似

    エクセルであるデータの散布図を作りました。 ばらつきがみられたので、近似曲線をどうしようかと思ったのですが、6次の多項式近似を行ったところ、プロットした点をほぼすべて正確に通る近似曲線がひけました。 その近似式の式は y==3E-10*x^6 - 8E-08*x^5 + 8E-06*x^4 - 0.0004*x^3 + 0.0091*x^2 - 0.0695x + 0.3314 でした。 R^2も0.999でほとんど1だったので、このデータ(曲線)の式=近似曲線の式とみなしてもいいと思ったのですが、ダメなのでしょうか? 実際のデータではx=97.12561のときy=6.37なのですが、この式に代入するとy=-14になってしまいます。 なぜでしょうか? E-10というのは10^(-10)ということで正しいですよね?

  • excel

    963 978 993 1008 1023 がx軸で 2.86E-13 4.93E-13 6.79E-13 6.65E-13 2.76E-13 がy軸です。 この近似曲線を描くために、多項式近似(4次元)で行いました。 しかし、この出てきた式を利用したが、プロット点とかけ離れた値となりました。 原因が、まじ不明です。 助けてください。