私も統計的自由度というのがいまいちわかりませんが計算だけなら
確率変数Xの確率分布P(X)があるとします。
このとき標本 Xi (i=1~n) で平均m= ΣXi/n として
<Σ(Xi-m)^2>を計算します。
P(X1)P(X2)・・・P(Xn)
が{Xi (i=1~n)}の確率で
∫dX1 P(X1) ∫dX2 P(X2)・・・∫dXn P(Xn) Σ(Xi-m)^2 ...(※)
を展開して母集団の分散
∫dX P(X)(X-<X>)^2
との関係を導くと(※)をn-1で割ればいいことがわかります。
この計算においては、∫dX P(X)(X-<X>)^2という1体問題と
(※)というn体問題の関係を求めているわけですが
このときn-1は結局、n体問題の関係を1体問題にするときに
XiXj(i,j=1~n) のなかから
相関のない2つのパラメータの関係(XiXj) (i=jでない)
(すなわち本質的な1体問題と)
相関のある自分自身(Xi^2)との関係を
分離することによって出てくるものです。
すなわち、サンプル平均とサンプルの値 Xi (i=1~n) を通して相関がある値が
発生するために自由度が減少しているという計算になっているように見えます。
(力学でいえば、統計的に等質量の質点のサンプルから
重心と慣性モーメントを求めたときに、
本当の重心の位置とサンプルの重心の違いがあるために、
サンプルの慣性モーメントが小さく見えてしまう
(ので、1個あたり揺らぎの大きさn^(-1/2)ずつ加算して
n個で丁度和の自乗が1になる揺らぎを含んでいるので
その分1だけ小さい値で割る)
ということに対応しているのでしょうか?)
投稿日時 - 2002-04-10 12:41:39