- 締切済み
推測の精度を求めるには?
プログラムを作って、日によって異なる、ある行動を起こした時間を推定しました。実際にその行動を起こした時間と比較して、このプログラムの精度を求めたいと考えました。 実際に行動を起こした時間が、3日間で、 A1- 6:18, A2- 10:21, A3- 12:38... プログラムで推測の時間が B1- 6:30, B2- 10:11, B3- 12:53... とすると、誤差(偏差?)は(12,-10,15...)となります。これは、ほぼ正規分布に従っていました。この誤差の平均や、標準偏差などが精度の指標になると思っていますが、正しい方法と、そういった値の正しい名称を教えていただきたいです。
- goo_Condor
- お礼率100% (1/1)
- 数学・算数
- 回答数1
- ありがとう数3
- みんなの回答 (1)
- 専門家の回答
みんなの回答
- tomtom_
- ベストアンサー率39% (43/110)
正規分布でありそうだというのなら,正規分布を仮定して平均等のパラメータを推測することは難しくありません. EMアルゴリズムを用いてみてはいかがでしょう. 平均と標準偏差でエラーバーが出せると思うのですが.
関連するQ&A
- 精度、近似値について
AとBの関係(比)について計算しています。 A=365.24219... B= 224.62... とすると、 両者の関係はA÷B もしくは B÷Aで表されますよね? 計算結果1.62604... 0.614989... となりました。 この場合の精度?近似する数字として、 1.6250という値と、0.61500という値はどの位正確と言えるのでしょう? 前者ですと1000分の1位の誤差、後者ですと少数点第1位から数えて、10000分の1位の誤差と表現するのでしょうか? 実際は後者のほうが正確なのでしょうか?? そもそも比の話なので、具体的なモノの精度ではありませんが、世間で言う『1万分の1の精度』とかケタ数での精度表現との関係はいかがでしょうか?
- ベストアンサー
- 測定・分析
- 統計に関する基礎的質問
(1)標準偏差や標準誤差をエラーバーとして示して、95%の信頼区間が推定できるようにすることが多いですが、これらは母集団が正規分布しているという前提のときのみ成り立つものなのですか?(お忙しい中ご回答頂くので、回答は「はい」あるいは「いいえ」のみで大丈夫です。ありがとうございます!) (2)「統計手法を選択する際の6チェックポイント」というのを見ていましたら、「正規分布」か否かという項目がありました。母集団が正規分布するか否かというのはどうやって分かるのでしょうか?
- 締切済み
- その他(学問・教育)
- 分布からみた 標準偏差、標準誤差について
はじめまして。よろしくお願いします。 さまざまな標準偏差、標準誤差についての投稿をみましたが、 分布から見た場合標準偏差と標準誤差とはどのようになるのでしょうか? データのサンプルをとり、それを正規化し、分布にあらわすと正規分布に限りなく近づいてくると思います。(これには中心極限定理がかかわっていると思います) そこでその分布の山の幅(というのでしょうか?)が標準偏差になっていると思うのですが、標準誤差とはどこを表すものなのでしょうか? また標準誤差をあらわすにあたって、中心極限定理を使ってあらわすことはできるのでしょうか?
- ベストアンサー
- 数学・算数
- 平均値、標準偏差、幾何平均、幾何標準偏差の推定
数学素人でさっぱり意味が分かりません。 分布なのですが、一部書き込みます。 A 累積分布 確率密度 1 0.0009329 0.0009329 2 0.0012776 0.0003447 4 0.0023306 0.0010530 6 0.0040988 0.0017682 8 0.0069518 0.0028531 10 0.0113821 0.0044303 ~ ~ ~ 28 0.4085144 0.0898605 30 0.5000000 0.0914856 32 0.5882070 0.0882027 ~ ~ ~ 68 0.9995101 0.0002532 70 0.9996741 0.0001640 80 0.9999535 0.0002795 100 0.9999989 000000453 Aを正規分布で近似した場合、平均値と標準偏差の推定 Aを対数正規分布で近似した場合、幾何平均と幾何標準偏差の推定 エクセルにデータ入れて計算しようとしてるのですが、方法が分かりません。どのように計算すれば良いのでしょうか?全く知識ないのですみませんが御教授してください。(何か計算に足りない物があれば指摘下さい)
- 締切済み
- 数学・算数
- 統計学における標準化について
A)標準化は、次のページの https://bellcurve.jp/statistics/course/19647.html サンプルxー平均値/標準偏差 であり、これで正規分布のz値と照らし合わせて確率を求めるというのは理解できました。 B)ただ、実践において、統計量Zを求める際に、次のサイトでは、 https://bellcurve.jp/statistics/course/9317.html z=x⁻(xの平均) -μ / √σ² * √n とあります。 分母が標準誤差です。 C)一方次のページでは、 https://bellcurve.jp/statistics/course/9490.html z=X-np / √np(1-p) とあり、こちらは標準偏差で割っています。 以下質問ですが、 1)Aは何も推定しておらず、すなわち記述統計で全サンプルが分かっている、すなわち母集団での話で、あるサンプルxiの全体のうちでの発生確率を示すために標準化してZ値を求めている、という考え方で正しいですか? 2)Bは標準誤差で割っているのは、母集団σ²から抽出した標本であり、抽出した確率変数Xについて、母集団が正規分布に従うのであれば、X~N(μ、σ²/n)に従うので、この分散の√を使っている(すなわち標準誤差を使う)という認識で正しいですか? 3)Cは二項分布のnが大きいときに中心極限定理で正規分布と近似させて解くという計算の話なのかと思いますが、これは、Aと同じように、変数Xから平均を引き、標準偏差で割っています。これは抽出した標本だと思うのですが、Aと同じ方法でいいのでしょうか?かといって。正規分布から抽出していませんが……。 それぞれの用語とかも良く調べましたが、いまいち使いこなせていません。A,B,Cそれぞれ分子も違うので、標準化を基本に色々やっているのだろうと思うのですが、使い分けというか、それぞれの出てくる場面とかも教えてほしいです。 よろしくお願いいたします。
- ベストアンサー
- 数学・算数
- 統計学?
初めて投稿します。まともに勉強もしないで生きてきて全然わからない問題あります。 Aの測定値は、平均値μ1、標準偏差のα1の分布 Bの測定値は、平均値μ2、標準偏差のα2の分布 Aの測定値の分布とBの測定値の分布から1つずつの値を抜き取ったとして Aの測定値-Bの測定値という値を計算すると、その分布は正規分布する。 正規分布の平均値と標準偏差は下記のとおりである。 平均値μ=μ1-μ2である。なぜこうなるのかを記述せよ。 さらに標準偏差を導きなさい。 言葉の意味も含めて教えていただけるとうれしいです。よろしくお願いいたします。
- ベストアンサー
- その他(学問・教育)
- MATLABの計算精度
いま, A=[0.803, -0.803, 1.2124, 0.803, -0.803, -0.803, 1.2124, 0.803]; とします. このとき,次の2通りの演算をします. (i) a=0; for I=1:8 if( A(I)>=0 ) a=a+A(I)*0.25; else a=a+A(I)*0.75; end end (ii) Bi=[0.25, 0.75, 0.25, 0.25, 0.75, 0.75, 0.25, 0.25]; b=sum(Bi.*A); (i)と(ii)によって得られる和の値をMATLABのコマンド上で表示すると, 同じ値として表示されるのですが,a-b と計算すると,0 ではなく, 8.04e-15のようになります.(現環境ではMATLABが使えないので,確認できませんが,もっと大きいデータでやったとき場合には,上記のように誤差が生じました). 困っているのは,現在組んでいるプログラムでは計算した値の正負によって 異なった計算をする必要があり,計算精度が非常に重要になってきます. そのため計算結果が例えば +1.4e-15となるか -6.4e-16 となるかによってその後の計算結果が大きく変わってしまいます. MATLABでは,上記(i)(ii)のような誤差が生じるためか,+1.4e-15となってほしいところが,なぜか -6.4e-16となってしまいうまくプログラムが動きません. MATLABでは,for文によって和をとるのではなく,一回でまとめて計算しなければ誤差が生じるのでしょうか? また,MATLABで計算精度を変更できないのでしょうか? (formatコマンドによって,「format short g」「format double g」としましたが有効な小数点が増減するだけで結果は同じでした.) よりよい精度で計算するにはどうしたらよいのでしょうか? 回答よろしくお願いします.
- 締切済み
- その他(プログラミング・開発)
お礼
アドバイスありがとうございます。また、お礼が遅れてしまい申し訳有りませんでした。EMアルゴリズムについて調べてました。推定のプログラムのところから直してみればと言ったアドバイスですよね。 今回は推定のプログラムのパラメータは総当たりで、誤差の二乗和が一番小さくなるように設定し、推測値データを求めており、出来ればプログラムは変更したくないと考えております。ですが、最尤法でパラメータを求めた方が、説得力もありますね。ついでにエラーバーが出せるとのことで、もう少し勉強してみます。 本当にありがとうございました。