• ベストアンサー
  • すぐに回答を!

【統計学基礎】自由度とは?

【統計学基礎】自由度とは? 以下の問題で自由度について答えさせられるのですが自由度とはなんでしょうか?自分はただ自由度=標本の大きさ-パラメータと考えていたのですが色々パラメータがどれを指すかによってかわってきて混乱してきています。 平均u=5、分散σ^2=4 の正規母集団より大きさn=16の無作為標本を抽出する。このときy=(n-1)s^2/σ^2は以下省略…また‐xを標準化したZは正規標準分布にしたがい、‐Xとs^2は統計的に有意であることから、z/√y/15は自由度???のt分布に従う。 という問題です。まずそもそもz/√y/15の式の意味もよくわからないのですがご回答お願いします。

共感・応援の気持ちを伝えよう!

質問者が選んだベストアンサー

  • ベストアンサー
  • 回答No.4
noname#227064
noname#227064

> この式の「-5]は母集団の平均u=5を指しているのですよね? 「5」はその通りですが、「-5」は違いますよ。 E(x1-5)^2 = E(x1-u)^2 で平均からの偏差の二乗の期待値を意味しており、これは母集団の分散の定義そのものです。 > あと分散の式と言うのは確かに^2の式を含みますが前にΣがついた式である1/n-Σ(x-u)^2だと思ったのですが。。。 E(x-u)^2は、母集団が離散分布ならΣp(x)(x-u)^2(ただしp(x)はxとなる確率)、有限母集団なら(1/N)Σ(x-u)^2(ただしNは母集団の大きさ)、連続分布なら∫(x-u)^2dxを意味します。 記述統計と推測統計、母集団と標本についてきちんと区別をする必要があります。 (1/n)Σ(x-u)^2は記述統計の場合の分散の定義です。 推測統計の場合、母集団の分散は上に述べたとおりE(x-u)^2が定義になります。 そして、その母集団の分散の推定値として(1/n)Σ(x-u)^2或いは不偏分散{1/(n-1)}Σ(x-u)^2があるのです。

共感・感謝の気持ちを伝えよう!

質問者からのお礼

>> 記述統計と推測統計、母集団と標本についてきちんと区別をする必要があります。 (1/n)Σ(x-u)^2は記述統計の場合の分散の定義です。 推測統計の場合、母集団の分散は上に述べたとおりE(x-u)^2が定義になります。 よく理解できました!わざわざ自分のためにこんなに丁寧に解説していただいて幸いです。試験が終わったら金融のゼミに入りたいので統計を一から勉強したいと思います。 ただまた同じようなことかもしれませんが勉強を進めていくうちに疑問点が見つかりまた質問をしたので、そちらの方もまた御解答頂けたら幸いです。

その他の回答 (3)

  • 回答No.3
noname#227064
noname#227064

・平均がuで分散がσ^2である分布から大きさnの標本を得たとき、標本平均の分布の平均uで分散が(σ^2)/nである。 ・正規分布については再生性があるため、標本平均の分布も正規分布に従う。 上の二点はどんな参考書でも必ず書いてあると思いますので、確認してみてください。 この二点から E(‐x-5)^2=(σ^2)/n = 4/16 = 1/4 となります。 > 明日の試験と言うことでこれ以上自分で文献を探してくるのも厳しいので、すみません。 明日ですか。厳しいですね。 時間があれば平均値の確率密度関数を求めてみるのもいいのですが……

共感・感謝の気持ちを伝えよう!

質問者からの補足

>>・平均がuで分散がσ^2である分布から大きさnの標本を得たとき、標本平均の分布の平均uで分散が(σ^2)/nである。 ・正規分布については再生性があるため、標本平均の分布も正規分布に従う。 上の二点はどんな参考書でも必ず書いてあると思いますので、確認してみてください。 この二点から E(‐x-5)^2=(σ^2)/n = 4/16 = 1/4 となります。 なんとなくやりたいことは見えてきて上記2点も再確認できたのですがそもそもE(x1-5)^2とかが何故分散を意味するのかがわかりません。。 この式の「-5]は母集団の平均u=5を指しているのですよね? あと分散の式と言うのは確かに^2の式を含みますが前にΣがついた式である1/n-Σ(x-u)^2だと思ったのですが。。。 何度も何度もすみません!

  • 回答No.2
noname#227064
noname#227064

> この場合E(x1-5)^2=??、E(‐x-5)^2=???である。 x1は平均がu=5、分散がσ^2=4である正規分布に従うことはわかりますよね。 ‐xはANo.1でも書きましたが、平均がu、分散が(σ^2)/nである正規分布に従います。 あとは、E(x1-5)^2とE(‐x-5)^2がそれぞれx1と‐xの分散であることがわかっていれば、値を代入するだけです。

共感・感謝の気持ちを伝えよう!

質問者からの補足

―x1は平均がu=5、分散がσ^2=4である正規分布に従うことはわかりますよね。 ここまではx1が母集団から標本されたものですから理解できますが、後の部分の解説された部分が分かりません…。これ以上は厳しいかもしれませんがさらに優しく説明していただけると幸いです。。 明日の試験と言うことでこれ以上自分で文献を探してくるのも厳しいので、すみません。

  • 回答No.1
noname#227064
noname#227064

平均を表すのに断りもなく‐x, ‐Xというように書くのは、マイナスXと誤解してしまうのでしないほうが良いでしょう。 あと、 > ‐Xとs^2は統計的に有意であることから は有意ではなく独立の書き間違いでしょうね。 まず、標準正規分布にしたがう確率変数Zと自由度φのカイ二乗分布に従う確率変数Yがあり、ZとYが独立であるとき、Z/√(Y/φ)が自由度φのt分布に従うというのは、天下り式に受け入れましょう。 そして、自由度とは分布の形を決めるパラメータの一つと思っておいて構いません。 さて、X1, X2,…XnはN(μ, σ^2)からのiidな確率変数で、μ及びσ^2は未知母数とします。 こういう場合、未知母数μの値がある値μ0と同じかどうか知りたいということがあります。 μの真の値はわかりませんが、X1~Xnの平均mで推定でき、μ=μ0であるならm-μ0という値は0から大きく外れることは滅多にありません。 つまり、0から大きく外れているならμ≠μ0であるに可能性が高いということです。 実際mの分布はN(μ, (σ^2)/n)従いますし、μ=μ0であるなら(m-μ0)/(σ/√n)が標準正規分布に従うことを利用してどの程度滅多にないことか計算できます。 (m-μ0)/(σ/√n)(=z)が0から大きく外れるということは、m-μ0も0から大きく外れていることに注意してください。 しかし、σの値はわからないので推定しないといけません。 σの推定値としては、 s = √{(Σ(Xi-m)^2)/(n-1)} がありますが、これをσの変わりに使用して(m-μ0)/(s/√n)の値で考えます。 sはσの推定値ですので、(m-μ0)/(s/√n)は標準正規分布に従いませんが、(n-1)(s^2)/(σ^2)(=y)が自由度n-1のカイ二乗分布に従うことと、mとsが独立であることから、 (m-μ0)/(s/√n) = {(m-μ0)/(σ/√n)}/{(s/√n)/(σ/√n)} = z/(s/σ) = z/√{y/(n-1)} となり、これが自由度n-1のt分布に従うことがわかります。 結局、z/√{y/(n-1)}が0より大きく外れているかどうかを知ることで、μ=μ0かどうかがわかります。 mとsが独立であることは少し難しいので説明はしないでおきます。 疑問点等があれば補足してください。

共感・感謝の気持ちを伝えよう!

質問者からの補足

天下りにするのはわかりました!そう覚えます。 後者についてはもう一度考えてみます。 あと質問の個だしになってしまうのですが以上の問題文の続きで 標本平均‐xの期待値E(‐x)はuに等しく、この性質を推定量の普遍性という。さらにx1の期待値E(x1)は5に等しく、やはり推定量の普遍性を満たしている。いずれかがより望ましい平均uの推定量かを決めるには、それぞれの推定量の分散を比較してより小さい方をより有効な推定量という。この場合E(x1-5)^2=??、E(‐x-5)^2=???である。 という以上の問題はどうやって考えればよいのでしょうか? ??の部分がわかりません。また今回に限り‐xと、統一するため書いてしまうのをご容赦ください。

関連するQ&A

  • 統計学の問題について教えてください。

    統計学を独学で学んでいるのですが、コンセプトの所でつまずいています。 大学で統計学を学んだ方や、統計に詳しい方、教えてください。 {問題1} 変数の対(X,Y)ならびに(Y,Z)の両者に有意な相関が観測される場合、(X,Z)に関しては何が言えるか。以下の中から最も適当であると思われるものを選べ。 A、有意な相関がある。B、有意な相関はない。 C、どちらともいえない。 (私の答え)C、(X,Y),(Y,Z)に相関があっても、(X,Z)に相関があることは分からないと思う。 {問題2} ある無限母集団から1000個のサンプルを無作為に抽出しヒストグラムを描くと、かなり左裾が長い分布となった。その後、2000個のランダムサンプルを追加してもう一度ヒストグラムを描いた場合、その分布の形状はどうなると考えられるか。以下の中から最も可能性が高いと思われるものを選べ。 A、左右対称に近づく。B、右裾が長い分布となる。 C、左裾が長い分布となる。 (私の答え・疑問点)Nが増えるにつれてヒストグラムは左右対称に近づくと思う。しかしこの場合、無限母集団とランダムサンプリングとの違いが不明である。 {問題3} A大学の男子学生と女子学生の身長は、それぞれ正規分布をし、男性の平均は170cm、標準偏差は10cm、女性の平均は156cm、標準偏差は9.8cmであると仮定する。この大学の男子学生一人と女子学生一人をランダムに選んだ場合、選ばれた男子学生の身長が女子学生の身長より高い確率はおよそいくつか。以下の中から最も適当であると思われるものを選べ。なお、いかにPrで示した標準正規分布の下側確立を参考にせよ。 Pr(Z<0.7)=0.76 Pr(Z<1.0)=0.84  Pr(Z<1.3)=0.90 Pr(Z<1.4)=0.92 A、0.76 B、0.84 C、0.90 D、0.92 (私の疑問点)それぞれSDが分かっているが、生徒が何人いるのか分からないのでどう計算するのか分からない。

  • 統計学における自由度

    統計を勉強し始めたものです。 統計学における自由度の定義がイマイチわかりません。 なるほど!、と思う説明に出会えないでいます。 よく自由度は「自由に動ける変数の数」だと教科書に書いてあるのですが 例えば、2標本問題(e.g.男女の身長)で標本平均の差の標本分布を求める際、男子の標本の大きさをm、女子の標本の大きさをnとした時(互いに独立)の自由度はm+n-2となることが理解できません。 この場合、 「男子の平均」ー「女子の平均」 の分布を考えるので自由度(自由に動ける変数の数)はm+n-1でもいい気がしてしまいます。 教科書には「2つの標本平均を使って偏差の平方和を計算するから、自由度が2失われる」と書いてあるのですがなかなかこの説明が頭に入りません。 勉強不足で申し訳ありませんが、自由度を定性的に理解できる説明を教えて下さい。 よろしくお願い致します。

  • 統計学について

    統計学の問題です。全然わからなくて困っています。解答、解説をよろしくお願いします。問題は以下です。 ある合板は量産されていて、表板と裏板の2層から成っている。表板の厚さXは平均0.4cm,標準偏差0.03cmの正規分布に従い、裏板の厚さYは平均0.6cm、標準偏差0.04cmの正規分布に従うとする。このとき、合板の厚さZ=X+Yはどのような分布に従うか。ただし、張り合わす合板の表裏は独立とする。

  • 確率統計の問題の解き方を教えてください

    正規分布N(5,24)から無作為に10個の標本をとって標本分散S^2を計算したとき、S^2>=25となる確率を求めよ。 という問題が解けません。 上記の事象は、自由度n-1のカイ二乗分布に従うとして解いた場合 10.41<=χ^2(自由度9)となり、カイ二乗分布表より具体的な数値を導くことができませんでした。 上記の解き方は間違っているでしょうか? 正しい解き方を教えてください!

  • 統計学のついて2つ質問が…

    自分で解けずに困っています。教えていただけないでしょうか? 1.標準偏差σ=40の無限母集団から大きさ400の標本を無作為抽出し、その標本平均を求めたら、x=54.1であった。これにより H0:μ=60 (帰無仮説)、H1:μ<60 (対立仮説)を有意水準を5%として検定しなさい。 2.下記のデータについて、x上のyの単純正規線形回帰模型を仮定し、   (1)β、α、rの2乗、σ、σβの値を計算せよ。   (2)βのt値を求め、βが統計的に有意な値かどうかを判定せよ。 2はExcelの「回帰分析」を使っても解けるらしいのですが今までExcelがないので分かりません。一応、インストールはされてます。 文章が分かりにくいかもしれないですが教えていただけないでしょうか?よろしくお願いします。 くだらない質問で申し訳ありません…

  • 統計学について

    「t分布の自由度が高いと標準正規分布とほぼ同じとみなせる」のは、例えば t(自由度N-1)=標準正規分布に従う変数/【(N-1)S^2/σ^2×1/(N-1)】の平方根 (S^2は不偏分散、σ^2は母分散) という式で考えた場合、自由度が高いとSとσがほぼ同じで、上記の式の分母がほぼ1になり、分子のみ残るから、という理解でよいでしょうか? また、「サンプルサイズが大きくなると標本標準偏差が母標準偏差に近づく」と本に書いてありますが、この場合の標本標準偏差は偏差平方和をNで割って求めたものと、N-1で割って求めたものの、どちらの分散から計算されたと理解したらよいでしょうか? 宜しくお願い致します。

  • カイ自乗分布の問題について質問です

    カイ自乗分布の問題について質問です 私は高校生で、経済学に興味があるので統計学を自習しております。しかし参考書にわからない問題があり困っております 統計学に詳しい方、よろしくお願いします。 1 自由度100のカイ自乗分布においてχ^2の5%点を正規分布近似により求めなさい 2 平均10 分散5 の正規母集団から抽出した大きさ4の無作為標本に基づく標本分散s^2が8より大きくなる確率は0.05より大きいか 3 平均μ 分散30の正規母集団からの大きさ16の無作為標本に基づく標本分散をs^2とする P(a<s^2<b)=0.95となるような定数a b を求めよ ただしP(s^2はa以下)=0.025とする

  • 統計の問題で

    統計の問題で (1) Xの分布が(170,25)であるとき、P(170 < X < 180)を求めよ。ただし、標準正規分布をする確率変数Zに対し、P(Z≦1)=0.841 , P(Z<2)=0.977 とする。 (2) X,Y,Zは互いに独立で、平均0、分布1である。 U=X+2Z , W=Y+2Zとする。 UとWの相関係数を求めよ。 という問題が解けません。 解き方を教えてください。お願いします。

  • 統計学の検定について

    統計の問題で以下のようなものがあります。 ある母集団から無作為に抽出した学生にテストを受けさせたところ 55 45 46 54 38 62 64 36 という標本が得られた。この母集団が正規分布している元のした時、得点の母平均が60である、という仮説を有意水準5%で検定せよ。 というものでしす。この時の検定の仕方はどうすればいいのでしょうか? またこの時の有意水準とは何の何に対する比率が5%なんでしょう? あとこの場合でなされる判断は、観測された結果をどのように考えた結果なされたものなのですか? よろしくお願いします!

  • 統計の問題の解説をおねがいします

    統計の問題ですが解説がなく詰まってしまいました。 わかる方教えて下さい。よろしくお願いします。 1,ある大学の男子学生と女子学生の身長はそれぞれ正規分布をし、男性の平均は175cm、標準偏差は10cm、女性の平均は161cm、標準偏差は9.8 cmであるという。この大学の男子学生一人と女子学生一人をランダムに選んだ場合、選ばれた男子学生の身長が女子学生の身長より高い確率はおよそいくつか。その確率を記せ。ただし、標準正規分布に関しては表を利用すること。(答えは0,84) 2,確率変数Xは自由度5のt分布をし、確率変数Yは標準正規分布をするとする。このとき、XやYがある定数zを越える確率に関して、z>0の場合に限りP(X>z)>P(Y>z)であることを示せ。