• 締切済み

平均が正規分布になる確率過程

同じ分布に従う独立でない確率変数、X1,X2,・・・,Xn があるとします。この平均が正規分布に従うための十分条件、あるいは、必要十分条件には、どんなものがあるのでしょうか。もちろん n は、十分大きな値であるとします。 また、時間が連続の過程X(t)においては、平均が正規分布に従う十分条件、あるいは、必要十分条件はなんでしょうか。平均については十分長い時間の平均とします。 どちらの問題でも、とりうる値は離散的とします。(連続の場合もわかると嬉しいです) 定常状態を想定しています。

みんなの回答

  • sen-sen
  • ベストアンサー率31% (66/211)
回答No.5

ランダムサンプリングではない場合に得られた統計量がどのような分布に従うかという問題に帰着すると思います。無意味な質問ではなく実際の統計解析での本質的な問題をついたものではないでしょうか。お近くの統計屋さんにお聞きしたらいろいろなアプローチを考えていただけると思います。事前に計算機でシミュレーションするのも有益かもしれません。どうしても解決が付かないのであれば青木先生にお聞きするのはいかがでしょうか?

参考URL:
http://aoki2.si.gunma-u.ac.jp/
  • sen-sen
  • ベストアンサー率31% (66/211)
回答No.4

モデルへの当てはめが可能かどうかをシミュレーションして調べてみてはいかがでしょうか?タイプ1エラーとタイプ2エラーが予想どおりないにおさまっているかどうかで、モデルへの当てはめが可能かどうか判定するというアプローチです。 また時刻によって確率変数の振る舞いが変わるとすると、調べたいと考える条件だけではなく「相関」を特徴づける変数を追加して2元配置で調べてみると言うのはいかがでしょうか?

aboo
質問者

補足

ご回答ありがとうございます。 こちらの無知でおっしゃる内容がよく理解できません。 個々の事例において、正規分布に従うかどうかを知りたいのではないのです。 確率過程が与えられた時、数学的に、「これは時間をかけてシミュレーションすれば、平均は正規分布に近づくぞ」と判定できる数学的条件(十分条件)が欲しいのです。シミュレーション前に分かりたいのです。 定常過程は、十分条件ではないのでしょうか。 それとも、個々の事例でしか解析できないのでしょうか。 理論的に平均が正規分布に従うことがわかっていれば、 理論的に平均は分かっていることが多いのかもしれませんね。 なんか、自分の質問が無意味に思えてきました。

  • sen-sen
  • ベストアンサー率31% (66/211)
回答No.3

>つまり、確率過程が与えられた時、これは、t-分布 >で区間推定ができるかを判断する指標が欲しいので >す。 正規分布を使わずt-分布で済ませても良いかということでしょうか?標本から得られた統計量のt-分布の当てはめは、それなりの頑強性があるので標本の分布などにかかわらず近似することが可能なはずです。 「定常状態であること」:標本からの母集団の推定はランダムサンプリングを基にしているので、必要条件でしょう。 「観測時間が十分長いこと」:標本の分布が観測時間が長いと正規分布になることを考えていらっしゃるのであれば、t-分布への当てはめは必ずしもその条件を厳しく問われないかもしれません。 「定常状態において、ある程度時間間隔があけば、X(i), X(j) (i << j) は、ほぼ独立とみなせること」:最初の条件と同じお話ではないでしょうか。

aboo
質問者

補足

レスありがとうございます。 返事が遅れました。 一回書いたのですが、反映されていないようです。 >正規分布を使わずt-分布で済ませても良いかということでしょうか? 長時間シミュレーションにおいて、 確率過程 X の平均(確率変数)が、正規分布に従うなら、 正規分布の分散がわからなくとも、 独立な数回の長時間シミュレーションによって、 X の「真の平均」の区間推定(t-分布利用)が行えます。 それが可能な十分条件が知りたいのです。 (Xの平均が正規分布に従うための X の十分条件が知りたいのです。) 確率過程としては、相関のあるものを想定しています。 この場合、定常状態にあることは、必要条件なのでしょうか。 この場合、正規分布からのずれに対して t 推定は頑強なので、 強引に、t-推定を行ってもいいということでしょうか。

  • sen-sen
  • ベストアンサー率31% (66/211)
回答No.2

「M/M/1の系内数」が理解できないのですが、素人考えでは、非常に狭い間隔で長時間サンプルリングして得られた X1(x11,x12,・・・,x1n),X2,・・・,Xnが独立かどうかは、それぞれの標本から得られた時間に依存するであろう(独立とみなせない)統計量が、本当に時間に依存しているかどうかを調べてみてはいかがでしょう。例えば、その統計量が周期的に変化しているのであれば、その統計量をカテゴリイ化して次の同じカテゴリが出現するまでの時間分布を調べて一様分布にみなせるかどうかを検討するなどしてはいかがでしょうか。

aboo
質問者

補足

ご回答ありがとうございます。上の話はよくわからないです。私が知りたいのは、真の平均値の区間推定の際に、一回の長時間のシミュレーションにおける計測平均値が正規分布に従うなら、10回程度、独立にこれを繰り返せば、t-分布による区間推定ができるので、確率過程が与えられた時に、長時間平均が正規分布に従うなるべく広い十分条件が知りたいのです。つまり、確率過程が与えられた時、これは、t-分布で区間推定ができるかを判断する指標が欲しいのです。そこで、十分条件として、「定常状態であること」「観測時間が十分長いこと」「定常状態において、ある程度時間間隔があけば、X(i), X(j) (i << j) は、ほぼ独立とみなせること」を考えてみました。証明したわけではありませんが、ちょっと考えてみると、正しいような気がします。 1)それでは、十分条件になっていない。 2)必要十分である。 3)十分条件が狭すぎる。 4)定常状態の長時間観測で十分条件である。 5)広い十分条件である。 のどれ(複数OK)になるのでしょうか。

  • sen-sen
  • ベストアンサー率31% (66/211)
回答No.1

十分大きな標本の平均が正規分布と見なせるかどうかは、中心極限定理が成り立つ条件を満たしているかどうか(標本の分布などを条件として)によるのではないでしょうか。定常状態であるということは、確率変数X(t)が同じ分布に従うと仮定することではないでしょうか。

aboo
質問者

補足

ご回答ありがとうございます。私の頭の中で中心極限定理は、nが大きい時「確率変数 X1, X2, ・・・, Xn が独立に同じ分布に従う時、平均は正規分布に従う」というものです。定常状態の時間連続過程を考えた場合、非常に狭い間隔で長時間サンプルリングして、平均を取ったもので期待値の推定値にすることができると思います。この場合 X1,X2,・・・,Xnは独立でないことがほとんどです(M/M/1の系内数とか)。この独立でない場合、平均は、無条件に正規分布に従うのでしょうか。

関連するQ&A

専門家に質問してみよう