• 締切済み

シミュレーションを元に得られた近似式の有効桁と平均2乗誤差について

卒業研究で「有限バッファモデルの待ち行列シミュレーションを行い、その結果(呼損率やバッファ使用率、平均待ち時間等)をもとに近似式を導き出す」 ということをやっているのですが、結果として出した近似式について、教授にもっと簡単な式にするべきと言われました。 近似式はシミュレーション結果をExcelにプロットし近似曲線を引くことで得ています。 助言として次の2点を言われています。 ・式の係数は2桁ないし、1桁ぐらいにしてみる ・平均2乗誤差を使う 実際、以下のようにExcelで得た線形近似or多項式近似の式の係数を削り、平均2乗誤差を出してみました。 ※(0.01 <= x <= 0.50、0.01刻み)の範囲での実験結果です y = 0.3181x2 + 0.0399x - 0.0018    ↓ y = 0.32x2 + 0.04x - 0.0018 平均2乗誤差:4.89E-07 x=0.01の時の99%信頼区間:3.76E-05 <= y <= 8.04E-05 x=0.50の時の99%信頼区間:5.38E-03 <= y <= 9.67E-02 xの値が0.01に近い所と0.50に近い所では、明らかに有効な桁が変わってきて、係数を削った影響も異なると思うのですが、 単純に平均2乗誤差だけを見て精度を落とさず、近似できていると結論付けてよいものなのでしょうか? 長文になってしまいましたが、何か助言できる方いましたら、力をお貸しください。 よろしくお願い致します。

  • 科学
  • 回答数2
  • ありがとう数1

みんなの回答

  • masa2211
  • ベストアンサー率43% (178/411)
回答No.2

>xが小さいほど分散も小さな値になっている為、xの値によって0.0012の持つズレの意味も異なってくるとは思うのですが。 >そもそも、このようなデータの場合、xの範囲によってどの程度誤差を無視していいのか、がいまいち掴めておりません。。 当初、yがいったい何を意味するのか、また、99%信頼区間とはいったい何のことなのか さっぱりわからなかったので、その部分はスルーしました。 まず、yは呼損率ということは、負の値はとらないわけだし、 x=0のときy=0 は確定しているようです。 その場合、回帰式を選定する際に、 x=0のときy=0 になるような式を選定します。 具体的には、 y=Ax2+Bx など。 excelで計算する場合、 多項式近似で2次式--切片=0にチェックマーク で計算できます。 そして、これで充分とは思いますが、問題が無いわけではありません。 excelで計算した近似式とは、(回帰式-シミュレーション値) のズレ具合と yの大きさには無関係と仮定されてしまっている点。 今回の場合、明らかに、yが小さいほどズレの絶対値は小さいということがいえます。 このような場合の方法について。 まず、Y=y/xとします。 で、xとYでグラフを書くと、うまいことに xの大きさにかかわらずyの分散は一定だし、xとYの関係は直線になります。 したがって、 Yに対し普通の最小2乗直線回帰(excelの切片付の直線回帰) を求め、その値を Y=Ax+B  とすると、 あとは、この式をy=...に直すだけなので y=Ax2+Bx  (AもBもそのまま使える) となります。 ※こんなことしなくも、excelで、切片ゼロの2次式を求めても大丈夫(そんなことまで教授は求めていない可能性が大きい。)とは思いますが、  小さい値の誤差を追求する場合、こういった方法でできます。

  • masa2211
  • ベストアンサー率43% (178/411)
回答No.1

EXCELで2次式の回帰をしたということは、最小2乗法で係数を求めたということです。 この場合、 測定値(x,y)の組に対し、回帰式(x,f(x))を考えた場合、 (Σ(f(x)-y)^2)/nが最小となるように回帰係数が求まります。 で、回帰係数の有効桁を落とした場合、その関数を(g(x))とすると (Σ(z(x)-y)^2)/nがはたしてどのくらいになるか。 (Σ(f(x)-y)^2)/nと、大して変わらないなら、係数の有効桁を何桁も書く理由はありません。 極端にいえば、 y=0.3x^2+0.05x-0.002 と丸めたとします。これでも、当初の4桁係数の式の値と比べ、 最大でも0.0012しか違いません。 0.0012違うことが意味を持つかどうかは、シミュレーション結果がどれだけ式からズレているかによります。ですので、シミュレーション結果の データが無いので、何ともいえません。 あと、 >簡単な式にすべき とは、係数の有効桁が少ないということでなく、係数の数が少ないことを意味するので、 たとえば、 y=(0.61x+0.01)^2 y=0.35x2+0.023x を近似式の候補にあげておきます。

behind_up
質問者

お礼

ご回答ありがとうございます。 いくつか質問させて頂いてもよろしいでしょうか。 y=0.3x^2+0.05x-0.002に丸めた場合の0.0012の持つ意味についてですが、 以下が今回の式を導いた元データになります。 ※シミュレーション10回試行の平均と分散(一部略) x(呼量) y(呼損率) 分散 0.01 0.000059 4.32E-10 0.02 0.000198 1.31E-09 0.03 0.000469 5.34E-09 0.04 0.000837 1.36E-08 0.05 0.001258 1.02E-08 0.06 0.001783 1.45E-08 0.07 0.002463 3.04E-08 0.08 0.003155 4.14E-08 0.09 0.003847 1.96E-08 0.1 0.00472 7.62E-08 0.11 0.00578 8.81E-08 0.12 0.006912 4.64E-08 0.13 0.008112 1.33E-07 0.14 0.00922 9.96E-08 0.15 0.010562 6.35E-08 0.16 0.012066 1.48E-07 0.17 0.0134 1.10E-07 0.18 0.01523 1.33E-07 0.19 0.016646 8.76E-08 0.2 0.018571 1.81E-07 0.25 0.028188 1.41E-07 0.3 0.039225 4.29E-07 0.35 0.051804 1.37E-06 0.4 0.065664 2.97E-07 0.41 0.068876 6.08E-07 0.42 0.071305 1.01E-06 0.43 0.074426 2.51E-07 0.44 0.07745 4.07E-07 0.45 0.0807 1.15E-06 0.46 0.083312 1.59E-06 0.47 0.086467 1.36E-06 0.48 0.09061 1.70E-06 0.49 0.093025 1.28E-06 0.5 0.095857 6.71E-07 xが小さいほど分散も小さな値になっている為、xの値によって0.0012の持つズレの意味も異なってくるとは思うのですが。 そもそも、このようなデータの場合、xの範囲によってどの程度誤差を無視していいのか、がいまいち掴めておりません。。 データ全体の特性からして、小さい値の誤差はある程度諦めるべきなのか。それとも小さい桁での誤差の影響を少なくする為には、また別の近似方法が必要なのでしょうか? >あと、 >>簡単な式にすべき >とは、係数の有効桁が少ないということでなく、係数の数が少ないこ>とを意味するので、 >たとえば、 >y=(0.61x+0.01)^2 >y=0.35x2+0.023x >を近似式の候補にあげておきます。 なるほど。式を簡単にするとは係数の数が少ないということですね。 提示して頂いた式の方が単に丸めた式よりも実用的にも楽ですし、グラフの特性に近づいていると思います。 式をこのように変形するにはどのようなアプローチが必要なのでしょうか? 数学的知識が少ないため、あまり複雑な計算を必要としなければいいのですが。。

関連するQ&A

  • エクセルによるデータの近似式について

    (x,y)の組が100ぐらいあり、x→yを計算するための高次多項式近似を求める問題です。やり方は定型処理ですからエクセルに任せました。エクセルだと6次式まで対応してくれました。近似式による線(自動的にグラフで表示される)とプロットした点はほぼ満足できるものでした。そもそもデータ(x,y)はプロットしてみると滑らかですし、高次多項式による近似式で十分対応できるな、と思えるものです。 ところが、です。 この高次多項式の係数を表示して、その通りの関数で表計算してみてプロットすると、グラフの右方向(すなわちXが増えると)急激にデータから離れていくのです。不思議なのはその式で計算されているはずの近似式の線(自動で出力された線)からも離れていくのです。一方、Xが小さいところではしっかり一致しています。 原因として考えられるのは、多項式の高次項の係数の桁が大雑把ということがあります。2e-9*x^6+3e-6*x^5......0.0123*x+23.194 というような感じの多項式です。x^6の項の係数が2e-9というのは有効桁数が小さすぎるように思います。これが原因かなと思っているのですが。いかがでしょうか。また、それが原因ならどうやって修正すればよいでしょうか。ほかに原因と対策がありましたら教えて頂きたいのですが。

  • 平均2乗誤差の分解について

    こんにちは。 平均2乗誤差(E(\hat{\theta}-\theta))が,誤差分散とバイアスの2乗に分解できると聞いたのですが,どういう意味でしょうか? よろしくお願いします。

  • エクセルの近似式について

    どの分野で質問していいかわからなかったので、違う分野でしたらすみません。エクセルでグラフを作り、近似式を導きたいのですが、y=ax1/2 (xの1/2乗)という近似式はできますか。オプションのところで近似式の追加、累乗根の近似をしましが、「何乗」のところが指定できません。よろしくお願いします。

  • この1次近似式の問題の求め方を教えてください。

    (1)g(Arctanx+logy)の(x,y)=(a,b)のまわりでの1次近似式と偏微分係数を求めなさい (2)f(cosx+Arcsiny)を(x,y)=(a,b)のまわりで1次近似しなさい (3)Arctan(f(x,y))を(x,y)=(a,b)のまわりでi次近似しなさい (4)Arcsin(g(x,y,z))を(x,y,z)=(a,b,c)のまわりで1次近似しなさい (5)f(x,y,z)の(x,y,z)=(a,b,c)のまわりでの1次近似式を書きなさい。 (6)e^(xsiny)の任意点のまわりでの1次近似式を全微分の形式で書きなさい。 (7)x^2×y^3×z^4の任意点のまわりでの1次近似式を全微分の形式で書きなさい xはエックス、×はかけるの記号です。 わからない問題や、解いてみたけど自信がない問題なんで、式と答えを教えてください。 お願いいたします。 もちろん、全部でなくわかるやつだけでも全然かまいません。 お願いします。

  • 不偏推定量:平均二乗誤差

    不偏推定量に対して、平均二乗誤差を求める問題で 計算に困っています。 データX1,X2,...,Xnがとある分布から独立に得られています。 ここでパラメータλに対する 不偏推定量 T1=(1/n)Σ(i=1~n)Xiにおいて平均二乗誤差を求める。 平均二乗誤差 =E((T1-λ)^2) =E(((1/n)ΣXi -λ)^2) =E((1/n)^2*(ΣXi-nλ))^2) =(1/n)^2* E((Σ(Xi-λ))^2) ここまではいいのですが E((Σ(Xi-λ))^2)をうまく処理できません。 授業では E((Σ(Xi-λ))^2)=Σ(E((Xi-λ)^2)と処理していたようなのですが、 どうしてもこの式が同値であることに納得いきません。 E((Σ(Xi-λ))^2) = E(Σ(Xi-λ)) * E(Σ(Xi-λ)) = Σ(E(Xi-λ)) * Σ(E(Xi-λ)) = (Σ(E(Xi-λ)))^2 なら 納得いくのですが…これではこの先計算できないなぁと困っている次第です。 もしよろしければ アドバイスをください。よろしくお願いします

  • 近似式。

    xとyからなるデータを複数とって、グラフ上にプロットすると、点が散在しながらも、なにがしかのまとまりがあって、そのデータを何かの曲線y=f(x)に近似したくなったとします。 しかし、何に近似していいかは分かりません。 何かの関数に近似したくても、何に近似するべきか分からないときは、どうしたらいいですか。 例えば、直線に近似しようと思っても2次式に近似しようと思っても、指数関数に近似しようと思っても、最小二乗法を使えば、それに近似されます。 このように、この種類の関数に近似させてやる!ということを決めていれば、それに近似されますが、近似させる関数の種類を限定したくないけど、何かの関数にしたいと思ったら、どうしますか。

  • 2次近似したときの誤差R3について

    f (x) = 1 /( 1 + x ) x=0 の近似式 1-x + x^(2) - x^(3) + ・・・・・になりますが、 これの2次近似したときの誤差R3(x)を求めたいのですが、 近似の誤差の公式に当てはめたのですけど、うまく答え通りになりませんでしたので、答えまでの手順を教えてください。宜しくお願いします。 答え -x^3 / (1+c)^4   (c は0とx の間の数)

  • 近似曲線の数式の値を指定した場合のR二乗値について

    ただ今,エクセルで近似曲線のR二乗値を用いた解析を行っております. 私は近似式でははく,単にy=xの式に対するプロットした点のR二乗値が知りたいと考えています. R二乗値がなるべく1に近づくようにモデル式の係数を検討したいのでこうような方法を取っています. 縦軸に実験値,横軸にモデル値を取りプロットし,R二乗値が1に近づけば近づくほど,できたモデル式は実験値を上手く表現出来ているものだと判断したいためです. すみませんがよろしくお願いいたします.

  • 近似式の補正

    f(x)=1/24*x*(x^2-1)(x-1)を y(x)=1/2*a*x(x-1)で近似するために最小2乗法で y(x)=-0.0003+0.0938x^1-0.0938x^2 と言う近似式を求めたのですが-0.0003の定数を補正する方法が思いつきません。何か方法はありませんか。 それとも-0.0003は小さいので無視しても良いのでしょうか。 回答お願いします。

  • 6乗式(近似式)からXの値を求めるには?

    エクセルグラフより下記例のような近似式を求めましたが、 yが判っている場合のxの求め方がわかりません。 どなたか、計算手順を含めてご教示ください。 例) y = -ax^6 + bx^5 - cx^4 + dx^3 - ex^2 + fx + g ※a,b,c,d,e,f,gにはそれぞれ小数点以下15桁程度の数字がわかっています。