• 締切済み

推測の精度を求めるには?

プログラムを作って、日によって異なる、ある行動を起こした時間を推定しました。実際にその行動を起こした時間と比較して、このプログラムの精度を求めたいと考えました。 実際に行動を起こした時間が、3日間で、 A1- 6:18, A2- 10:21, A3- 12:38... プログラムで推測の時間が B1- 6:30, B2- 10:11, B3- 12:53... とすると、誤差(偏差?)は(12,-10,15...)となります。これは、ほぼ正規分布に従っていました。この誤差の平均や、標準偏差などが精度の指標になると思っていますが、正しい方法と、そういった値の正しい名称を教えていただきたいです。

みんなの回答

  • tomtom_
  • ベストアンサー率39% (43/110)
回答No.1

正規分布でありそうだというのなら,正規分布を仮定して平均等のパラメータを推測することは難しくありません. EMアルゴリズムを用いてみてはいかがでしょう. 平均と標準偏差でエラーバーが出せると思うのですが.

参考URL:
http://www.neurosci.aist.go.jp/~akaho/MixtureEMj.html
goo_Condor
質問者

お礼

アドバイスありがとうございます。また、お礼が遅れてしまい申し訳有りませんでした。EMアルゴリズムについて調べてました。推定のプログラムのところから直してみればと言ったアドバイスですよね。 今回は推定のプログラムのパラメータは総当たりで、誤差の二乗和が一番小さくなるように設定し、推測値データを求めており、出来ればプログラムは変更したくないと考えております。ですが、最尤法でパラメータを求めた方が、説得力もありますね。ついでにエラーバーが出せるとのことで、もう少し勉強してみます。 本当にありがとうございました。

関連するQ&A

  • 精度、近似値について

    AとBの関係(比)について計算しています。 A=365.24219...  B= 224.62... とすると、 両者の関係はA÷B もしくは B÷Aで表されますよね? 計算結果1.62604... 0.614989... となりました。 この場合の精度?近似する数字として、 1.6250という値と、0.61500という値はどの位正確と言えるのでしょう? 前者ですと1000分の1位の誤差、後者ですと少数点第1位から数えて、10000分の1位の誤差と表現するのでしょうか? 実際は後者のほうが正確なのでしょうか?? そもそも比の話なので、具体的なモノの精度ではありませんが、世間で言う『1万分の1の精度』とかケタ数での精度表現との関係はいかがでしょうか?

  • 統計に関する基礎的質問

    (1)標準偏差や標準誤差をエラーバーとして示して、95%の信頼区間が推定できるようにすることが多いですが、これらは母集団が正規分布しているという前提のときのみ成り立つものなのですか?(お忙しい中ご回答頂くので、回答は「はい」あるいは「いいえ」のみで大丈夫です。ありがとうございます!) (2)「統計手法を選択する際の6チェックポイント」というのを見ていましたら、「正規分布」か否かという項目がありました。母集団が正規分布するか否かというのはどうやって分かるのでしょうか?

  • 分布からみた 標準偏差、標準誤差について

    はじめまして。よろしくお願いします。 さまざまな標準偏差、標準誤差についての投稿をみましたが、 分布から見た場合標準偏差と標準誤差とはどのようになるのでしょうか? データのサンプルをとり、それを正規化し、分布にあらわすと正規分布に限りなく近づいてくると思います。(これには中心極限定理がかかわっていると思います) そこでその分布の山の幅(というのでしょうか?)が標準偏差になっていると思うのですが、標準誤差とはどこを表すものなのでしょうか? また標準誤差をあらわすにあたって、中心極限定理を使ってあらわすことはできるのでしょうか?

  • 平均値、標準偏差、幾何平均、幾何標準偏差の推定

    数学素人でさっぱり意味が分かりません。 分布なのですが、一部書き込みます。 A  累積分布  確率密度 1   0.0009329 0.0009329 2  0.0012776 0.0003447 4  0.0023306 0.0010530 6  0.0040988 0.0017682 8  0.0069518 0.0028531 10  0.0113821 0.0044303 ~   ~     ~ 28  0.4085144 0.0898605 30  0.5000000 0.0914856 32  0.5882070 0.0882027 ~   ~     ~ 68  0.9995101 0.0002532 70  0.9996741 0.0001640 80  0.9999535 0.0002795 100 0.9999989 000000453 Aを正規分布で近似した場合、平均値と標準偏差の推定 Aを対数正規分布で近似した場合、幾何平均と幾何標準偏差の推定 エクセルにデータ入れて計算しようとしてるのですが、方法が分かりません。どのように計算すれば良いのでしょうか?全く知識ないのですみませんが御教授してください。(何か計算に足りない物があれば指摘下さい)

  • 統計学における標準化について

    A)標準化は、次のページの https://bellcurve.jp/statistics/course/19647.html サンプルxー平均値/標準偏差 であり、これで正規分布のz値と照らし合わせて確率を求めるというのは理解できました。 B)ただ、実践において、統計量Zを求める際に、次のサイトでは、 https://bellcurve.jp/statistics/course/9317.html z=x⁻(xの平均) -μ / √σ² * √n とあります。 分母が標準誤差です。 C)一方次のページでは、 https://bellcurve.jp/statistics/course/9490.html z=X-np / √np(1-p) とあり、こちらは標準偏差で割っています。 以下質問ですが、 1)Aは何も推定しておらず、すなわち記述統計で全サンプルが分かっている、すなわち母集団での話で、あるサンプルxiの全体のうちでの発生確率を示すために標準化してZ値を求めている、という考え方で正しいですか? 2)Bは標準誤差で割っているのは、母集団σ²から抽出した標本であり、抽出した確率変数Xについて、母集団が正規分布に従うのであれば、X~N(μ、σ²/n)に従うので、この分散の√を使っている(すなわち標準誤差を使う)という認識で正しいですか? 3)Cは二項分布のnが大きいときに中心極限定理で正規分布と近似させて解くという計算の話なのかと思いますが、これは、Aと同じように、変数Xから平均を引き、標準偏差で割っています。これは抽出した標本だと思うのですが、Aと同じ方法でいいのでしょうか?かといって。正規分布から抽出していませんが……。 それぞれの用語とかも良く調べましたが、いまいち使いこなせていません。A,B,Cそれぞれ分子も違うので、標準化を基本に色々やっているのだろうと思うのですが、使い分けというか、それぞれの出てくる場面とかも教えてほしいです。 よろしくお願いいたします。

  • 距離計の精度

    国産のバイク(自動車もそうですが)の速度計は、ややプラス方向に偏差があるのはご存知だと思う(たとえば、メーター上では60Km/hでも実際は55Km/hかそこら)のですが、距離計はこれと関係なく、あるレベルで正確なんでしょうか。あるいは速度計と同期して多めに出るのでしょうか。 速度計の偏差は、多分速度違反をしたときに、メーターの誤差のせいにされることを防ぐためだと推測していますが。(速度計は5%の誤差を許容しているので) 知人の輸入車ではこんなことは無かったです。

  • 標準偏差について

    ある正規分布(標準偏差a)に従う集団からある正規分布(標準偏差b)に従う集団を引いたもの(または足したもの)の正規分布の標準偏差cは、aとbを用いてどのように表せるのでしょうか? 確か数式があったと思うのですが、ど忘れしました。 平均はただ足しただけだったと思うのですが、 標準偏差は足してルートとったりとかしてたような気が… ネットで調べてもうまく見つからないので、 覚えている方がいればお願いします。 稚拙な説明で申し訳ありません。

  • 統計学?

    初めて投稿します。まともに勉強もしないで生きてきて全然わからない問題あります。 Aの測定値は、平均値μ1、標準偏差のα1の分布 Bの測定値は、平均値μ2、標準偏差のα2の分布 Aの測定値の分布とBの測定値の分布から1つずつの値を抜き取ったとして Aの測定値-Bの測定値という値を計算すると、その分布は正規分布する。 正規分布の平均値と標準偏差は下記のとおりである。 平均値μ=μ1-μ2である。なぜこうなるのかを記述せよ。 さらに標準偏差を導きなさい。 言葉の意味も含めて教えていただけるとうれしいです。よろしくお願いいたします。

  • 誤差分布について

    確率誤差とは50%の確率で生じる誤差の範囲のことですよね。 標準偏差をσとすると ε=0.6745σ で求められます。 ここからが本題で、 誤差分布の式および標準正規分布 上側分布表より 誤差が約30%の確率で生じる範囲はどのように求めれば良いのでしょうか。教えてください。

  • MATLABの計算精度

    いま,  A=[0.803, -0.803, 1.2124, 0.803, -0.803, -0.803, 1.2124, 0.803]; とします. このとき,次の2通りの演算をします. (i) a=0; for I=1:8  if( A(I)>=0 )   a=a+A(I)*0.25;  else   a=a+A(I)*0.75;  end end (ii) Bi=[0.25, 0.75, 0.25, 0.25, 0.75, 0.75, 0.25, 0.25]; b=sum(Bi.*A); (i)と(ii)によって得られる和の値をMATLABのコマンド上で表示すると, 同じ値として表示されるのですが,a-b と計算すると,0 ではなく, 8.04e-15のようになります.(現環境ではMATLABが使えないので,確認できませんが,もっと大きいデータでやったとき場合には,上記のように誤差が生じました). 困っているのは,現在組んでいるプログラムでは計算した値の正負によって 異なった計算をする必要があり,計算精度が非常に重要になってきます. そのため計算結果が例えば +1.4e-15となるか -6.4e-16 となるかによってその後の計算結果が大きく変わってしまいます. MATLABでは,上記(i)(ii)のような誤差が生じるためか,+1.4e-15となってほしいところが,なぜか -6.4e-16となってしまいうまくプログラムが動きません. MATLABでは,for文によって和をとるのではなく,一回でまとめて計算しなければ誤差が生じるのでしょうか? また,MATLABで計算精度を変更できないのでしょうか? (formatコマンドによって,「format short g」「format double g」としましたが有効な小数点が増減するだけで結果は同じでした.) よりよい精度で計算するにはどうしたらよいのでしょうか? 回答よろしくお願いします.