最大値の平均と標準偏差を求める方法

2023/10/14 18:32

このQ&Aのポイント

仕事で解が解けずに悩んでいます。最大値の平均と標準偏差を求める方法を教えてください。
集団からサンプルを取り出し、その最大値の確率分布を求める方法を知りたいです。
処理時間ばらつきを持つ工程を連続配置したときのスループットの推定方法を教えてください。

ベストアンサー

最大値の平均と標準偏差

2007/07/06 20:17

仕事で解が解けずに悩んでいます。助けてください。平均値E(1)～E(N)　標準偏差V(1)～V(N)の正規分布の確率分布を持つＮ群の独立した事象があるとします。各集団のn数は等しく十分に大きいものとします。このときに各集団から１つづつ任意にサンプルをＮコ取り出して、その最大値がどのような確率分布(平均と標準偏差）になるか、一般解を求めたいと考えています。もっとも単純な例として、等しい分布の集団から２コ取り出す例で平均：E(1)＝E(2)=150　標準偏差；V(1)＝V(2)=50とおいてn=5000で実数検証してみると、最大値の分布は　E=178　V=40ぐらいになりました。処理時間ばらつきを持つ工程をNコ連続配置したときにスループットがどのようになるかの推定が目的です。

plateboron
お礼率50% (2/4)

数学・算数
回答数4
ありがとう数3

みんなの回答 （4）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

rabbit_cat
ベストアンサー率40% (829/2062)

2007/07/09 01:13 回答No.4

＞具体的にn=2のとき　e1 e2は　どのような式(値)に＞なるのでしょうか。稚拙な質問で恐縮です。 n=2ぐらいなら厳密に計算できるかな、と思ってやってみました。 n=2のときの確率密度関数は、 f(x) = e^(-x^2/2)*(1+erf(x/√2))/√(2π) なんで、平均 = ∫xf(x)dx = 1/√π = 0.56418958354775628695… 分散 = ∫x^2f(x)dx - (∫xf(x)dx)^2 = 1-1/π = 0.68169011381620932846… となるようです。

質問者

お礼 2007/07/09 09:06

感激です。ありがとうございます。私の質問での言葉の定義が不正確で申し訳なかったのですが Eは平均で　Vは標準偏差（＝分散^1/2）のつもりでした。 E=150　V＝50の正規分布は±3σで0～300まで大きくばらつきがあるものを想定していました。したがって E＝150＋0.564*50＝178　V^2＝0.6817・50^2　V=41 これで完璧に合うのではと思われます。一方、私の式は、標準正規分布でG(x)＝0.5のときにｘが（中央値＝平均）とみなして値を出そうとしてました。 e1はGinv(0.5^(1/2))＝0.545で近い値ですが、 e2の出し方は私の先の考え方が間違っていて、　Ginv［｛Ｇinv(1)｝^1/2］－Ginv(0.5^(1/2))＝0.8418 で教えていただいた数字0.682に対して0.8418^2＝0.707とまあ使える数字でした。いずれにせよ、きちんと工学的に解法が見出せてきた感があり、とても感謝しています。　　

その他の回答 (3)

rabbit_cat
ベストアンサー率40% (829/2062)

2007/07/09 01:02 回答No.3

単純に１次近似で近似式を求めてみると、 β分布B(n,1)は、平均が、n/(n+1) 標準偏差が、 √(n/{(n+2)(n+1)^2}) ですから、正規分布の累積分布関数の逆関数をGinv(x)と書いたときに、標準正規分布に独立に従うn個の確率変数の最大値は、平均が、 Ginv(n/(n+1)) 標準偏差が Ginv'(n/(n+1))*√(n/{(n+2)(n+1)^2}) と近似できそうです。平均μ=150，分散σ^2=50の正規分布で、n=5000として実際に計算してみると、平均 ≒ 175.03254578514972967 標準偏差 ≒ 1.8657075963054361591 となりました。平均は数値実験（E=178　V=40）とあってるようですが、標準偏差のほうがかなりずれてますね。数値実験の分散=40ていうのは直感的にはちょっと大きすぎるような気もするのですが、もし本当だとすると、１次近似では無理があるってことですかね。

rabbit_cat
ベストアンサー率40% (829/2062)

2007/07/07 12:42 回答No.2

＃１で書いたことと本質的には全く同じですが。区間[0,1]の一様分布に従う独立なn個の確率変数の最大値の分布は、β分布 B(n,1) に従います。 http://en.wikipedia.org/wiki/Beta_distribution http://www.kwansei.ac.jp/hs/z90010/sugakuc/toukei/beta/beta.htm ところで、正規分布の累積分布関数の逆関数をG(x)とすると、[0,1]一様分布に従う確率変数Xがあるとき、定義からG(X)は正規分布に従うことになります。（別に正規分布だけではなくて任意の分布について言えることですが）ということで、β分布B(n,1)に従う確率変数をYとしたとき、 G(Y)は、正規分布に従う独立なn個の確率変数の最大値の分布になりますね。これから、計算するほうが多分楽でしょう。

質問者

お礼 2007/07/07 13:43

rabbit_cat様早々にありがとうございます。すばらしいアドバイスで一気に解に近づけました。β分布の活用までは行き着けていたのですが、まだまだ理解不足で断念していました。もう少しきちんと勉強してみます。ところで　ANo１の２つめURLで紹介いただいた解説から、平均=μ　標準偏差σ　の正規分布　ｎコの最大値の分布でＥ=μ＋e1・σ　V=e2・σ^2　でe1 e2はそれぞれｎについての増加、減少関数と表現できることはピンとくるのですが、単純例として　具体的にn=2のとき　e1 e2は　どのような式(値)になるのでしょうか。稚拙な質問で恐縮です。

質問者

補足 2007/07/07 20:08

下記の追加質問について自分で解けました。標準正規分布関数を用いて　さらに単純化して考えるとわかりました。累積分布関数の逆関数をGinv(x)とすると平均はGinv(0.5^(1/2))=0.54495　標準偏差は平均の二乗で0.7511 実数検証結果と一致していると思われ、だいぶ理解が深まりました。ありがとうございます。

rabbit_cat
ベストアンサー率40% (829/2062)

2007/07/07 12:14 回答No.1

一般に累積分布関数がF(x)で表せる、独立なn個の確率変数の最大値の累積分布関数は (x)={F(x)}^n となります。これから、一応、平均、分散を計算することが可能です。 http://ja.wikipedia.org/wiki/%E9%A0%86%E5%BA%8F%E7%B5%B1%E8%A8%88%E9%87%8F http://www.geocities.jp/ikuro_kotaro/koramu/278_max.htm

関連するQ&A

平均値の標準偏差
とある画像処理に関する論文を読んでいて次のような記述があったのですが分からない点があったのでどなたか教えてください。（簡単にまとめてあります。）「ノイズのある画像を複数回撮影し、その平均値をとることでノイズ成分を小さくすることができる。ノイズ成分が正規分布の場合、標準偏差σと測定回数ｎ回の平均値の標準偏差σ1は以下で記述される。 σ1=σ/√n 」この記述に関して、 1．ノイズ成分が正規分布の場合しか、上記式は適用できないのでしょうか。ランダムノイズの場合でも平均化できるような気がするのですが・・・。 2．またなぜ、測定回数の平方根に反比例するのでしょうか。 3．上記式では測定回数ｎを多くすれば平均値の標準偏差σ1は0に近づきますが、この数値はいくつくらいならいいのでしょうか。0に近いほど母集団の平均値を推定できているということまでは分かったのですが、どのくらいの数だったらいいという閾値や評価基準みたいなものはあるのでしょうか。以上、どなたかご回答お願いします。
- ベストアンサー
- 数学・算数
標準誤差と標準偏差の違いは何？
誤っているのはどれか？１．　算術平均値とは対象群のすべての変量の総和をその対象群の総数で徐したものをいう２．　２集団の平均値が同じであっても２集団を構成する標本の分布が等しいとはいえない３．　集団の標本が正規分布している場合、平均値±標準偏差の範囲には標本中の約６８．２７％が抱合される４．　集団における平均誤差の絶対値は常に標準誤差の絶対値より大きい５．　正規分布する標本数の等しい２集団において、標準偏差の絶対値が等しければ平均誤差の絶対値も等しい ――――-―――――――------------------------------------- このような問題を考えています。自分なりに答えを出すと・・・・・・１．　算術平均値とは対象群のすべての変量の総和をその対象群の総数で徐したものをいう →（○）正しい。　定義どおりだと思います。　小学校で習った平均値ですね。２．　２集団の平均値が同じであっても２集団を構成する標本の分布が等しいとはいえない →（○）正しい。極端な例が混ざれば平均値は同じでも、バラツキがちがう３．　集団の標本が正規分布している場合、平均値±標準偏差の範囲には標本中の約６８．２７％が抱合される　　 →（○）正しい。そのとおり標準偏差（ＳＤ）のＳＤ±１は６８．２７％である。　ＳＤ±２はたいか９５％くらいでしたっけ。　ＳＤ±３は９９．９％くらいだね。　つまりバラツキの度合いに占めるパーセンテージだと。４．　集団における平均誤差の絶対値は常に標準誤差の絶対値より大きい →（○）正しい。これがうさんくさい。でも、私の持論によると・・・・・ ■ＳＥχ（標準偏差の平均値）＝σ/ √n 　　　　σは標準偏差です。 ■ＳＤχ（標準誤差の平均値）＝s/ √n 　　　　　ｓは限られたサンプルより抽出した標準偏差の「予想値」です。　　　　　　　　　　　　　　　　　　　　　　　　　そしてｎはサンプルのサイズ（数）です。つまり、標準偏差（ＳＤ）は国勢調査などで「全員」の数が把握できている場合であり、標準誤差（ＳＥ）は、大阪のミナミの繁華街の商店街の「全員」ということでつまり、 ■ＳＥχ（標準偏差の平均値）＝σ/ √n 　　　　　　　　　→σ/ √日本の総人口 ■ＳＤχ（標準誤差の平均値）＝s/ √n 　　　　　　　　　→s/ √大阪ミナミの商店街の人口・・・・ということで分母が小さくなりますから、１/１０００　と　１/１０　では、１/１０がおおきいですね。つまり、調査の数が少ないと、誤差も大きくなるとそういうわけで、　誤差の絶対値は標準偏差よりも高くなるというわけです。ですから一見この選択肢が誤りに見えますが、実は正しいのだと思います。間違っていればどこがまちがっているか教えてください！５．　正規分布する標本数の等しい２集団において、標準偏差の絶対値が等しければ平均誤差の絶対値も等しい →（○）正しい。そのとおり。　本物と同じだから誤差も無い
- 締切済み
- 数学・算数
母標準偏差・標本標準偏差と標本平均（Ｘバー）の標準偏差
（聞きたいのは、最後の３行がメインです） http://oshiete1.goo.ne.jp/qa3478996.html の質問をしたものです。標準偏差を求めるとき、（ルートの中の）分母が「ｎ」か「ｎ－１」の２種類があることはわかりました。母標準偏差であっても標本標準偏差であっても「ｎ」で求められるが、標本から母標準偏差を推定するときが「ｎ－１」を使うということで理解しました。ところで、「ｎ」にしても「ｎ－１」にしてもそんなに値としては変わらないということなんですよね？高校の時の教科書で、「標本平均（Ｘバー）の標準偏差」というのがありました。　「母平均ｍ、母標準偏差ｓの母集団から大きさｎの無作為標本　抽出するとき、標本平均Ｘバーの標準偏差σ＝ｓ／（ルートｎ）」というのがありました。　「標本標準偏差」とこの「標本平均Ｘバーの標準偏差」というのは全然違うものなんですよね？（値も全然違うものになってしまうと思います。）
- ベストアンサー
- 数学・算数
母集団の標準偏差
統計の初心者ですが困っているので教えてください。母集団（N=30)で各グループ（N=10）の標準偏差がわかっている場合、母集団の標準偏差は計算ででるのでしょうか？例グループA（N=10)　σ＝2　平均値＝１０グループB（N=10)　σ＝3　平均値＝９グループC（N=10)　σ＝2　平均値＝１１この場合母集団（N=30）のσは？
- ベストアンサー
- 数学・算数
高校数学の標本平均について教えてください。
母集団から大きさnの無作為標本を抽出しそれらの変量xの値をX1.X2.….XnとするときXバー=(X1+X2+…Xn)/nを標本平均という。標本平均Xバーの確率分布と母集団分布関係を調べよう。母平均m,母標準偏差σの母集団から大きさnの無作為標本を抽出しそれらの変量xの値をX1.X2.….Xnとする。各Xkはどれも大きさ１の標本で母集団分布に従う確率変数である。よってE(X1)=E(X2)=E(Xn)=m σ(X1)=σ(X2)=σ(Xn)=σであるしたがって E(Xバー)=mになる。また復元抽出の場合はX1.X2.….Xnは互いに独立な確率変数であるから分散V(Xバー)=｛V(X1)+V(X2)+…+V(Xn)｝/n＾2というところがわかりません。なぜn＾2で割ることになるのですか？どなたか教えてください。お願いします。
- 締切済み
- 数学・算数
最大値分布の作成
最大値分布の作成最大値分布に関する質問です。ある母集団からN個サンプルをとることを永遠に繰り返した時の、その最大値の分布を導出するのはどうしたらよいですか？Nが2の時、4の時、8の時と分けて3つの異なる分布を得たいです。例えばある母集団の分布（平均6.3、標準偏差1.3）があり、ここから４個サンプルを取り出すとします。これが（５，９，６，４）だったとするとこの中の最大値は９です。このサンプリングを無限に行う時の最大値の分布はどのように計算できますか？この最大値の分布は１回のサンプル数の大きさに比例して大きくなると考えられますが、サンプル数が２の時、４の時、８の時の最大値分布の平均と標準偏差を求めたいです。順序統計量の最大値の確率分布を用いるのかと思い調べたのですがよくわかりません。どうか知恵をお貸しください。よろしくおねがいします。
- 締切済み
- 数学・算数
標本平均の標準偏差の変化について
σ＝１０の正規分布から、ｎ＝9、ｎ＝36、ｎ＝100、ｎ＝1000、ｎ＝10000の標本を抽出したとき(無限母集団)、標本平均の標準偏差はどのように変化するか簡単に述べなさい(50文字以内)。 ※指摘する論点は二つこの問題が分かる方がいたら教えてほしいです。よろしくお願いします。
- 締切済み
- 数学・算数
標準偏差について
ある正規分布（標準偏差a）に従う集団からある正規分布（標準偏差ｂ）に従う集団を引いたもの（または足したもの）の正規分布の標準偏差ｃは、aとbを用いてどのように表せるのでしょうか？確か数式があったと思うのですが、ど忘れしました。平均はただ足しただけだったと思うのですが、標準偏差は足してルートとったりとかしてたような気が… ネットで調べてもうまく見つからないので、覚えている方がいればお願いします。稚拙な説明で申し訳ありません。
- ベストアンサー
- 数学・算数
標準偏差について教えてください。
標準偏差について教えてください。統計初心者です。正規分布するとわかっている母集団があって、ある値がその母集団で標準偏差がいくつなのかを知りたいと思っています。母集団は平均値、1.5SDの値はわかっていますが、それ以上はわかっていません。初心者のため、簡単に教えていただけるとうれしいです。お願いいたします。
- 締切済み
- 数学・算数
最大値(最小値)の分布
ある母集団は、平均値がAの正規分布又はポアソン分布であり、その標準偏差は√Aで表されます。その母集団から、N個サンプリングしたとします。(正規分布とポアソン分布のどちらで考えてもいいです。) N個サンプリングしたデータについて、最大値と最小値の標準偏差はどのように表されるでしょうか。平均値Aとサンプリング数Nで表されるはずなのですが、どうしても分かりません。よろしくお願いいたします。
- ベストアンサー
- 数学・算数

最大値の平均と標準偏差を求める方法

最大値の平均と標準偏差