• 締切済み

統計学における自由度

統計を勉強し始めたものです。 統計学における自由度の定義がイマイチわかりません。 なるほど!、と思う説明に出会えないでいます。 よく自由度は「自由に動ける変数の数」だと教科書に書いてあるのですが 例えば、2標本問題(e.g.男女の身長)で標本平均の差の標本分布を求める際、男子の標本の大きさをm、女子の標本の大きさをnとした時(互いに独立)の自由度はm+n-2となることが理解できません。 この場合、 「男子の平均」ー「女子の平均」 の分布を考えるので自由度(自由に動ける変数の数)はm+n-1でもいい気がしてしまいます。 教科書には「2つの標本平均を使って偏差の平方和を計算するから、自由度が2失われる」と書いてあるのですがなかなかこの説明が頭に入りません。 勉強不足で申し訳ありませんが、自由度を定性的に理解できる説明を教えて下さい。 よろしくお願い致します。

みんなの回答

  • Ishiwara
  • ベストアンサー率24% (462/1914)
回答No.3

真の平均値は不明です。そこでm個の男子データから男子平均を推定します。その推定のために1個分の情報が費やされてしまった、と考えます。女子の場合も同様です。そこで合計2個分の情報が費やされた、と考えます。「自由度」という言葉の意味にとらわれすぎると、かえってややこしくなります。解析上必要な尺度であって、名前は何でもよかったのだ、と考えると気がラクになります。

参考URL:
http://okwave.jp/qa3124271.html
sunn5471
質問者

お礼

確かに・・納得できました。 参考URLも参考になりました。 ありがとうございました。

  • goma_2000
  • ベストアンサー率48% (62/129)
回答No.2

確率変数をXとし、平均値をX'、標準偏差をσとすると、 標準化された変数は(X-X')/σとなります。 このとき、X-X'は(Xではなく)   Σ(X-X')=0 という制約があるので自由度が一つ下がります。 X,Yに関してはそれぞれ独立に(全体の和としてではなく)上記の制約がかかるので自由度が2下がります。 「2つの標本平均を使って...」というのはそういう意味になります。

sunn5471
質問者

お礼

参考になりました。 独立の時はそれぞれに制約がかかるということですね。 ありがとうございます。

  • Tacosan
  • ベストアンサー率23% (3656/15482)
回答No.1

「平均を使うと自由度が 1 減る」って説明を見たことがあります. つまり, 本来 n 個のデータがあると自由度は n なんだけど, 平均を使うと「平均が固定された分布」を考えなければならないので自由度が 1 だけ減る (n-1 個のデータが決まれば最後の 1個は自動的に決まってしまうため) という説明だったような.

sunn5471
質問者

お礼

参考になりました。 ありがとうございます。 自分なりにまとめてみたいと思います。

関連するQ&A

専門家に質問してみよう