信頼度比の試行回数とは何ですか?

このQ&Aのポイント
  • 試行回数による信頼度の比について教えてください。
  • 装置の測定精度と誤差の関係について教えてください。
  • 試行回数による信頼度の変化について教えてください。
回答を見る
  • ベストアンサー

試行回数による信頼度の比

試行回数による信頼度の比 分かる方がいらっしゃったら教えて頂けませんか。 ★ ★ ★ ★ ★ 平均 M 、分散 S^2 の分布で示される実数 R があります。 また、R の値を読み取るための、n個の装置(実験器具のようなものと考えて下さい) M1~Mn があります。 任意の装置 Mm には以下の性質があります。 装置 Mm が R を測定した際の、測定値の誤差(R - 測定値)は、 平均 Am、分散 σm^2 の分布をとります。 このAm, σm は各装置の測定精度といえると思います。 いずれも小さいほど精度が高くなります。 装置 M1~Mn を使って R を測定する場合、 任意の装置 Mm が測定した値を Pm とすると、 ΣWm(Pm-Am), {Wm = (1/σm^2)/Σ(1/σm^2)} が最ももっともらしい R の測定値だと思います。 (合ってるか分かりませんが、数学の得意な人に計算してもらいました) ★ ★ ★ ★ ★ さて、ここからが本題です。 実際は装置 Mm の精度 σm が厳密に分かりません。 しかし、各装置は過去に何度か R を測定したことがあり、 その時の測定誤差の結果が残っているため、σm が予測できます。 任意の装置 Mm で Cm 回測定した誤差の結果は、 平均 Am', 不偏分散 σm'^2 の分布をとっています。 この Cm がタイトルにある試行回数です。 Cm により Am',σm' をどれだけ信頼していいか変わるため困っています。 この状態で M1~Mn を使って R を測定する場合、 M1~Mn の測定値をどのように組み合わせれば、 最ももっともらしい R の測定値となるでしょうか? また、M1 ~ Mn の間での、Am, σm の分布を考えたとき、 Am は、平均 a, 分散 o^2 σmは、平均 b, 分散 p^2 の分布をとるとします。 (実際は分からないのですが、これが無いと計算できないような気がするので仮定しておきます) 感覚的にはCm=0なら、Am=a, σm=b とみなすのが妥当で、 Cm=∞なら、Am, σm が分かっているときと変わらないと思うのですが、 その中間が Cm によりどう変わるのか分かりません。 ★ ★ ★ ★ ★ 答えを求めるにあたり足りない情報などがあれば、 遠慮無く書いて下さい。

質問者が選んだベストアンサー

  • ベストアンサー
回答No.4

補足です。 二つの装置があり、装置1はRが小さいところで分散が小さく、装置2はRが大きいところで分散が小さいとしたら、Rが小さいときは装置1を使い、Rが大きいときは装置2を使うと信頼性が高くなるというのが自明の理です。 しかし、Rが大きいところも小さいところも一緒にして意味はないけど式に当てはめて分散を計算し、信頼性を求めたところで、Rの値によって結果が変わるという正しい結果が出ることはありません。

zigzagfire
質問者

お礼

お付き合い頂きありがとうございますm(_ _ )m そういった事柄を考慮したのが↓です。 >答えを求めるにあたり足りない情報などがあれば、 >遠慮無く書いて下さい。 「Rの大小によって測定値の分散がどう変わるか?」という情報が足りていません。 なので「Rの大小によって測定値の分散は変わらない」とします。 足りない情報は全て仮定して、今ある情報で分かる最善を考えます。 仮定に大きな誤りがあれば、結果も意味の無いものになってしまいますが、 その点は、仮定しなければならないものが分かり次第、 検討していこうと考えています。 まず一つ必要な仮定が分かったのは収穫です。 ありがとうございます!

その他の回答 (3)

回答No.3

>過去に測定した Cm 回 は何なのかというと、 >変化する値の別のポイントを測定したものです。 >つまり、Cm 回 は全て異なる値を測定しているので、 >測定の平均値というのは出せません。 それなら無理です。 すべてのポイントで系統誤差と母分散が等しいという保証もないので、 統計処理をしても無意味です。

zigzagfire
質問者

お礼

もっと単純化した質問をしたので、参考までに載せておきます。 http://oshiete1.goo.ne.jp/qa5748333.html

回答No.2

気が代わったので答えてみようと思います。 まず測定の誤差には系統誤差と偶然誤差があり、統計処理ができるのは偶然誤差だけなので、系統誤差分は補正しておくというのが大前提です。なので、話を簡単にするために、系統誤差分Amは補正済みとしてすべて0にします。この系統誤差の補正で不確かさが入り込んでくるようなら、その不確かさはσmに繰り込みます。 さて、最も確からしい値、つまり最確値とは何かということですが、最も確率が高くなる値ということになります。ガウス分布を仮定してこの確率を求めてみます。今の場合、n個の測定値ym(m=1,2,・・・,n)があり、母平均はすべて等しくμ、母分散はそれぞれ異なりσm^2であるとすると、m番目の測定値がymの値をとる確率P(ym)はガウス分布なので、 P(ym)~exp{ -(1/2)[(ym-μ)/σm]^2 } したがって、n個の測定値がy1, y2, ・・・, ynという値を同時にとる確率はその積で P(y1)P(y2)・・・・P(yn) ~ exp{ -(1/2)[(y1-μ)/σ1]^2 }exp{ -(1/2)[(y2-μ)/σ2]^2 }・・・・exp{ -(1/2)[(yn-μ)/σn]^2 } = exp{ -(1/2)Σm [(ym-μ)/σm]^2 } = exp(-χ^2/2) ここで、χ^2=Σm [(ym-μ)/σm]^2 で、確率を最大にするにはこのχ^2値が最小になればいいことが分かります。母平均μは求めることができない量なので、ミューの代わりにYと置いて、χ^2を最小にするように決めたYを最確値とします。このχ^2を最小にするYを求めるためにYで微分して0とおくと d(χ^2)/dY=d/dY (Σm [(ym-Y)/σm]^2)=Σm 2 [(ym-Y)/σm](-1/σm) =-2 [ Σm (ym/σm^2)-Y Σm (1/σm^2) ] = 0 Y = [Σm (ym/σm^2)]/[Σk (1/σk^2)] = Σm [(1/σm^2)]/[Σk (1/σk^2)] ym = Σm Wm ym,   Wm = [(1/σm^2)]/[Σk (1/σk^2)] これが、「数学の得意な人」が求めた結果です。 ここでのポイントは、Yがymの線形結合になっているということです。 ここのymはすべて独立で各ymの分散がσm^2なので、この場合のYの分散σY^2は σY^2 = Σm Wm^2 σm^2 = Σm { [(1/σm^2)]/[Σk (1/σk^2)] }^2 σm^2 = [Σm (1/σm^2)]/{ [Σk (1/σk^2)] }^2 = 1/[Σm (1/σm^2)] です。信頼性が高いを分散が小さいの意味だとすれば、このσY^2を最小にするものが最も信頼性が高いことになります。 さてここで、各ymは一回の測定値ではなくn回測定の平均値であることに注目します。各測定値の分散がσ^2であるときの平均値の分散はσY^2の式でσmをσに置き換えればよく、n回ならσ^2/nに等しくなります。したがって、σm^2を個々の測定値の分散であるとするとymが平均値である場合にはこれをσm^2/Cmで置き換えなければなりません。したがって、ymがCm回測定の平均値である場合のσY^2の式は σY^2 = 1/[Σm (Cm/σm^2)] に修正されます。 σmですが、十分な回数の過去の測定からσmが推定できるなら、それを使います。過去の蓄積がないなら、回数に依存しなくなるまで十分な回数の測定を繰り返して求めます。少ない回数の測定から推定するなら不偏分散を使います。 ちなみに、k番目の測定値をxk、平均をXとしたとき、n回の測定で S^2 = Σk (xk - X)^2/n を標本分散 u^2 = Σk (xk - X)^2/(n-1) を不偏分散 とよび、母分散をσ^2としてnS^2/σ^2、および、(n-1)u^2/σ^2 は自由度n-1のχ二乗分布に従います。 系統誤差Amの不確かさがσa,m^2で表記できるとすると、生の測定値をPmとしてym = Pm - AmなのでPmの分散をσm^2としてymの分散は σ(ym)^2 = σm^2 + σa,m^2 σa,m^2は別立てで求めておく必要があります。 と、ざっとやってみました。教科書にあるようなものではないので確認のしようがないですが、多分、間違ってはいないと思います。 まあ、書いてていやになるくらい説明不足ですが、不明分は適宜調べてください。

zigzagfire
質問者

お礼

回答ありがとうございます! >各ymは一回の測定値ではなくn回測定の平均値であることに注目します。 すいませんが、ここが質問の意図と異なります。 各ymは一回の測定値です。 質問文の冒頭にある分布によって、測定される値は常に変化していて、 変化する値の特定のポイントに対し、各装置は一回しか測定できません。 過去に測定した Cm 回 は何なのかというと、 変化する値の別のポイントを測定したものです。 つまり、Cm 回 は全て異なる値を測定しているので、 測定の平均値というのは出せません。 そのため、過去の誤差によって正確さを出そうとしています。 >この系統誤差の補正で不確かさが入り込んでくるようなら、その不確かさはσmに繰り込みます。 この質問で2番目に知りたいことがそれに当たります。 系統誤差分Amを0にすることができない(装置をキャリブレーションできない)ため、 系統誤差の補正の不確かさをどのようにσmに繰り込めばいいのか知りたくて、 それも質問に入れてしまいました。 しかし、まずは単純化のためAmを0と考えてしまっても構いません。 気が向けば追加回答して頂けると嬉しいですが、 回答がなければ適当な頃合いで諦めます(笑) その場合でも他に回答者がいらっしゃらなければ、 hitokotonusiさんの回答を良回答にしたいと思います。

noname#107242
noname#107242
回答No.1

何のため?目的は?

zigzagfire
質問者

お礼

すいませんが、秘密です^^

関連するQ&A

  • 測定値に誤差がある場合の分散について

    射的をして、ある回数を撃ったあと、的の弾痕の分散σ^2を求めたい(自分の能力を調べたい、みたいな理由で)。平均は的の中心とします。でも、持っている測定器の精度が悪く、的の中心から弾痕までの距離を正確に測ることができず、分散σ'^2で誤差が生じるとします。このとき、実際に計算した弾痕の分散の推定量(不偏分散)から、測定誤差を除いた、正味の弾痕の分散を推定するにはどうしたらよいでしょうか。 たくさん撃てば、σ'は気にしなくてよいのかもしれませんが、σ'を考慮しなければいけない状況だとしてください。 まとめると、繰り返し測定ができない値を測定してその分散を求めたいけれど、測定で偶然誤差が発生してしまうから、正確な分散がわからないとおもうのですが、どうでしょうか、という質問です。 言葉足らずでしたら補足要求してください、わかりにくいかもしれませんがよろしくおねがいします。

  • 分散値だけの検定方法

    統計の初心者です。 2群もしくはそれ以上の群の比較についての質問です。 一般的に、比べたい物が正規分布に属していると仮定した時、平均値の差をT検定を使って、差があるかどうかを検討します。 では、その2つのグループの平均値ではなく、分散値に差があるかどうかを考える事は可能なのでしょうか? すでに正規分布としていると前の文章で仮定しているので、分散値に差があるかどうかを検討するのはおかしい事なのかもしれませんが… 分散値の等分散性を考える上で、F検定やShapiro-Wilk検定なる物があると聞いたのですが、これはそれぞれの群が等分散になっているかを検討する物だと思っています。 では、お互いの分散値が同じなのか違う物なのかを検討するのは無理なのでしょうか? 例えば、2つの定規を作る機械があるとします。 1つの機械で30cm定規を作った時の、それを1つ1つきちんと計測できる測定器で計測すると、出来上がった定規にプラスマイナスで誤差が出てくると思います。 次にそのもう1つの機械で30cmの定規を作ったとします。 同じように計測すると、出来上がった定規にも誤差が出ると思います。 では、この機械は同じ性能を発揮しているのかどうかを検討する時、平均値には差が出てこないと思います。 しかし、これだとこの機械は精度的に大丈夫かどうかを考える時に、誤差つまり分散値のばらつきが同じかどうかを検討する必要があると思います。 こんな時はどうしたらよいのでしょうか? またもう1つ機械が増えて、3つの場合はどうなるのでしょうか? 作った個数が多いと、T検定をした時、ボンフェローニー補正をかけると思いますが、分散値の検定にもボンフェローニー補正をかけるのでしょうか? 長文でわかりにくい所があるかも知れませんが、統計の本やインターネットを検索していくとわからない事だらけで… 教えて下さい。よろしくお願いいたします。

  • 平均値の誤差の求め方は?

    平均値の誤差を見積もりたい考えています。 ただ、抽象的な話では私には難しいので具体例をあげて 質問させてください。 ========== 日本国民男性20歳の平均身長を求めたい。 条件にある人を無作為に1000人集めて身長を測定すると、 平均=170cmで、分散=10cmとなった。 日本国民男性20歳の人は100万人おり、 身長の測定誤差は、0.5cmと仮定してください。 ========== 「日本国民男性20歳の平均身長」は、170cmに であると言ってよいと思いますが、この平均身長の誤差は どのように見積もればよいでしょうか? ここでいう誤差は、10万人の人、全員を集めて、 (測定誤差がなく)測定した身長の平均を真の値として、 そのずれを見積もりたいと考えています。 例えば、信頼度99%で、平均身長は170cm±Xcmと いうときの、Xの値をどのように計算すればよいのでしょうか? ちょっとネットで調べて自分なりには以下の計算式になるのでは ないかと考えています。 X=2.58 x 0.5cm / sqrt(1000) = 0.04 cm ただ、これが正しいか少々不安です。 理由は、Xが測定誤差(0.5cm)より小さくなってしまうことと 全母集団の数値(10万)を用いていない点にあります。

  • 傾きの差の信頼限界を求めるには

    共分散関係かなと少し勉強してみたのですが、傾きに差があることの検定は見つかるのですが 傾きの差の信頼限界について見つかりませんでした。よろしくお願いします。 測定値を時系列で並べてその傾きが「求める値」 となるような計測をしています。  バックグラウンドの測定での傾き(Bo)  標準試料(求める値=ms)を測定したときの傾き(Bs)  試料1を測定したときの傾き(B1) から、試料1の求める値m1 = ms * (B1 - Bo)/(Bs-Bo) とするわけです。 測定数 n, 相関係数R、回帰の傾きB、Xの分散をSxx、残渣の分散Se、傾きゼロに対するt値 t とすると 次のような結果になりました。(分散は大きいので10^6で割った値)  バックグラウンド n=19 R=0.999998 Bo=19.53, Sxx=260.40, Se=0.32, t=2301  標準試料   n=23 R=0.999993 B1=20.95, Sxx=311.41 ,Se=1.85, t=1244                              傾きBoに対するt値85 自由度20近辺のt値は99%でも3弱ですから、 各々の傾きも、傾きに差があることも検定できていると思うのですが、 各々の傾き、傾きの差の信頼限界はどのように考えたらよいでしょうか。 測定試料の m値の測定誤差、測定限界を知りたい というのが目的です

  • 実験値の統計処理-T分布-について

    今、実験値の統計処理を行っています。 同じ試料について一定量をサンプリングし、測定値を理論式に当てはめ、誤差伝播を考えた形x±Δxで実験値を算出しています。何度も測定を行ったので、平均値や分散などを計算したいんですが、処理の方法に困っています。 標本の平均値や分散などの不確かさは、それぞれに誤差伝播式 f:=f(x_i) ⇒ Δf = ( Σ(∂f/∂x_i)^2 Δx_i^2 )^(1/2) を当てはめて計算して良いですか? あと、t分布で母平均を推定したいんですが、標本の平均や分散に不確かさが含まれている場合、どのように計算すれば良いのでしょうか・・・?? 何卒ご教授宜しくお願いします。

  • 検査での測定回数について

    試料を測定する場合、測定回数をいくらにすべきかを考えています。 同一試料での測定の標準偏差はN増し測定の結果、ほぼ0に近く、測定誤差としては十分です。 1回の測定には複数のプロセス(乾燥、計量、静置、加熱)があり、どの1つを間違っても精度はでません。 現状、測定誤差の観点から、検査での測定回数を1回で行っています。(抜き取り回数は議論の対象外とします) ただ、その1回だけの測定が仮に失敗した場合を考えた場合、1回で十分なのか?と思います。 例えば、測定回数を2回にして、2つの測定結果がほぼ同値であったらその平均を測定結果にするとか? その辺の、測定誤差に対しての最適な測定回数の決定方法はないでしょうか?

  • 期待値

    1の目がr回出るまでサイコロを投げ続けるとき、投げる回数の確率分布と、平均、分散を求めよ。という問題を考えているのですが、その時の確率分布は求めることができたのですが、平均分散の計算の仕方がわかりません。どうか教えてください。また平均の答えは6r 分散は30rです。

  • 勉強してるのですが、結局、分散の意味がわかりません。

    勉強してるのですが、結局、分散の意味がわかりません。 分散は平均値からのばらつきを示しますので、値が大きければ、分布が大きく、小さければ分布が平均値付近に集中していることを示します。 とあるのですが、値が大きいというのはどの程度を示しますか? いい例が思いつかなかったのですが、 (2 3 5 5 5 7 8 9 10 100) では、分散は801.04ですが、これは大きいほうでしょうか? また、これ以外にもわかりやすい例があれば教えてほしいです。 特に、クラスのテストの平均点・血液型の分布 などを知りたいです。 経済学部一回生のものですが、いまいちわからなかったので質問しました。 また、標準偏差はバラツキをあらわす目安で たとえば製品の長さを測定した結果、40、50、60、70、80cmだったとします。 この場合の標準偏差は14.1で 14.1cmのバラツキがあるということだと思いますが、 このバラツキというのはどこを基準としたバラツキなんでしょうか? 長さはそれぞれ10cmずつしか違いませんし・・・ 中央値からのバラツキなんでしょうか? これももっとわかりやすい例とかあればお願いします。

  • 統計学の正規分布、信頼区間について質問です。

    問1、ある錠剤のA成分の含有量を9回測定して標本平均6.85mg、標本標準偏差0.006mgを得た。測定値は正規分布に従うと仮定して、A成分の含有量の真の平均を95%信頼区間で推定せよ。 問2、同年齢の身長は正規分布に従っていると考えられる。15歳の男子10人を無作為抽出して測定したところ169,155,163,164,151,162,160,150,156,150の結果を得た。15歳の男子の平均身長および分散を95%信頼区間で推定せよ。 この二つの問題がいくら考えてもわからないのでわかる方居ましたら解答・解説をご教示願います。よろしくお願いします。

  • 微小面での真直度と平面度の意味合い

    巾1mm 長さ50mmの面を利用して低粘度の液を薄く塗工したいが この面の加工指示精度は平面度、真直度どちらが良いのか 意味合いの違いも含めた見解をお願いします。 平面度はある面積以上に対して用いるのか、真直度は円筒外面での 指示も見たことがあります。 真直度2μとか可能か、ナンセンスか。経験のある方情報下さい。 ダイコータのリップ先端精度で真直度とか見たことがあるのですが。 測定器誤差範囲の気がします。