• 締切済み

統計に関する基礎的質問

(1)標準偏差や標準誤差をエラーバーとして示して、95%の信頼区間が推定できるようにすることが多いですが、これらは母集団が正規分布しているという前提のときのみ成り立つものなのですか?(お忙しい中ご回答頂くので、回答は「はい」あるいは「いいえ」のみで大丈夫です。ありがとうございます!) (2)「統計手法を選択する際の6チェックポイント」というのを見ていましたら、「正規分布」か否かという項目がありました。母集団が正規分布するか否かというのはどうやって分かるのでしょうか?

みんなの回答

  • rabbit_cat
  • ベストアンサー率40% (829/2062)
回答No.3

(1)は、Yesの場合とNoの場合と両方あります。 図を描いた人に聞かないとわかりません。というか、普通は、どういう仮定のもとでの信頼区間か図の説明に書いてあるでしょう。 (2)は、何らかの知識から正規分布に従うはずだ、と分かる場合があります。特に、中心極限定理から、対象の確率変数が非常に多数の要素に依存していると考えられるなら、正規分布に従うと考えて良いです。 正規分布に従うかはっきり分からない場合には、シャピロ検定、アンダーソンダーリング検定なとを使って、正規分布に従っているかどうかを検定できます。

noname#212058
noname#212058
回答No.2

回答No.1 です。追質問にご回答します。 ○「正規分布への適合度の検定」などはExcel統計などの統計  ソフトが計算してくれるのでしょうか?  ⇒ EXCEL統計には質問者さんが期待しているであろう、   「データを入れれば正規分布の適合度がワンタッチで出る」    ような機能はありません。カイ二乗検定などを駆使して自力    で考える必要があります。    それが嫌なら、正規分布の適合度検定ができるアドインソフト    などを探すことになります。(探すのくらいはそちらの努力で    お願いします)

noname#212058
noname#212058
回答No.1

(1) はい。 (2) だいたいは『正規分布への適合度の検定』で分析します。

nikonikogambaro
質問者

補足

「正規分布への適合度の検定」などはExcel統計などの統計ソフトが計算してくれるのでしょうか?

関連するQ&A

  • 統計学について質問です。

    統計学について質問です。 統計学が全然わかりません。 正規分布、とT分布の違いがよくわかりません。 正規分布が十分に大きいn個のサンプルを取り出す。母集団の平均、標準偏差がわかっている。 これってどういうときに使うのでしょうか? そもそも母集団平均がわかっている状況って存在するのですか?? 正規分布、T分布、F分布、ガウス分布、ポアソン分布などいろいろありますが、何が何だかわかりません。理工系の統計術として最低限知っておきたいので、わかりやすくお願いいたします。

  • ベイズ統計学の利用法について

    頻度論的な統計手法では,確率分布の推定誤差を母数の区間推定という方法で表現します. この場合,標本数が大きくなるとその区間は狭まり,無限になれば区間は限りなく狭くなります. しかし,現実の標本数は有限ですから,区間の上限と下限があります. 実務上は,上限値あるいは下限値を母数の推定値にして,安全側の判断をします. さて,ベイズ統計手法の場合,予測した確率分布の推定誤差はどのように表現するべきなのでしょうか? 実務上でベイズ統計学を利用したいのですが,この部分で悩んでおります. どなたか,よいアドバイスをお願いいたします.

  • 統計学における標準化について

    A)標準化は、次のページの https://bellcurve.jp/statistics/course/19647.html サンプルxー平均値/標準偏差 であり、これで正規分布のz値と照らし合わせて確率を求めるというのは理解できました。 B)ただ、実践において、統計量Zを求める際に、次のサイトでは、 https://bellcurve.jp/statistics/course/9317.html z=x⁻(xの平均) -μ / √σ² * √n とあります。 分母が標準誤差です。 C)一方次のページでは、 https://bellcurve.jp/statistics/course/9490.html z=X-np / √np(1-p) とあり、こちらは標準偏差で割っています。 以下質問ですが、 1)Aは何も推定しておらず、すなわち記述統計で全サンプルが分かっている、すなわち母集団での話で、あるサンプルxiの全体のうちでの発生確率を示すために標準化してZ値を求めている、という考え方で正しいですか? 2)Bは標準誤差で割っているのは、母集団σ²から抽出した標本であり、抽出した確率変数Xについて、母集団が正規分布に従うのであれば、X~N(μ、σ²/n)に従うので、この分散の√を使っている(すなわち標準誤差を使う)という認識で正しいですか? 3)Cは二項分布のnが大きいときに中心極限定理で正規分布と近似させて解くという計算の話なのかと思いますが、これは、Aと同じように、変数Xから平均を引き、標準偏差で割っています。これは抽出した標本だと思うのですが、Aと同じ方法でいいのでしょうか?かといって。正規分布から抽出していませんが……。 それぞれの用語とかも良く調べましたが、いまいち使いこなせていません。A,B,Cそれぞれ分子も違うので、標準化を基本に色々やっているのだろうと思うのですが、使い分けというか、それぞれの出てくる場面とかも教えてほしいです。 よろしくお願いいたします。

  • 統計学が全くわかりません。

    以下の問題の解答および、解法手順を教えていただけると幸いです。 1・ある生徒の集団の、ある科目の点数の偏差値は、平均50、標準偏差10の正規分布を仮定して計算している。 (1)この集団で偏差値が65以上の生徒の割合はいくらか。 (2)この集団で、偏差値が55から60までの割合はいくらか。 (3)この集団で偏差値が45以下の生徒の割合はいくらか。 2・無作為に選んだn=100人の大学生からの図書館利用率調査で、利用者をX人とするとき、学生全体の中での利用率pの90%信頼区間を求めよ。 (1)実際にⅹ=64人が利用していたとき、pの点推定値としてのp(上にちょぼっとしたマークがついています)はいくらか? (2)Xは2項分布に従うが、これを正規分布で近似するとすれば、この正規分布の平均uおよび分散oの2乗はnやpを用いてどうあらわせばよいか。 (3)p(上にちょぼっとしたマークがついています)=X/rを正規分布で近似するとすれば、この正規分布の平均uおよび標準偏差oはnやpを用いてどう表せるか。 (4)p(上にちょぼっとしたマークがついています)=X/nを標準化してZ=・・・の形で表せ。 (5)(1)のp(上にちょぼっとしたマークがついています)を用いて学生全体の利用率pの90%信頼区間を小数3位まで求めよ。

  • 社会統計について質問です。

    友人に社会統計学について、質問を受けました。 私は心理学科なので、心理統計しか分からず、困っています。 どなたか助けてください。 以下のような問題です。 体重に関して正規分布N(μ,σ二乗)に従う母集団から、無作為抽出によって以下の16の標本を得た。 62,50,60,48,62,59,36,64,64,62,87,63,75,27,65,76 (1)標本平均、不偏標本分散、不偏標本標準偏差を求めよ。 (2)母平均の最尤推定値(最尤推定量の実現値)を求めよ。 (3)母分散は既知とする。このとき標本平均の標本分布はどのような分布に従うか。「確立変数~確率分布」という形式で答えよ。 (4)母分散は未知であるとする。このとき、母平均の95%信頼区間を求めよ。 (5)母平均は未知であるとする。帰無仮説をHo:μ=52としたとき、適切な検定統計量を求め、5%水準両側検定、1%水準両側検定、5%水準右片側検定、1% 水準右片側検定をそれぞれ実施せよ。 (7)さらに、体重に関して正規分布する別の母集団から、無作為抽出して以下の16の標本を得た。2つの母集団の母分散は未知であるが、母分散は同じであると仮定して良い。「2つの母平均は等しい」を帰無仮説として、母平均の差に関する5%水準両側検定を実施せよ。(ヒント:t0.025(30)=2.042) 65,60,57,76,79,72,57,75,54,75,42,77,38,48,71,78 よろしくお願いします。

  • 統計学の基礎?

    前提 日本人の身長の真の平均値を知るためには、日本人全員の身長を測定しなければならないが、それはおそらく不可能である。 そこで、一部の人(標本)の身長を測定し、その結果から推測したい。 標本(n)の身長もばらつき(標本分散:v)を持つし、日本人全体(母集団:N)の身長もばらつき(母分散:σ^2)を持つが、これらと真実の値(母平均:μ)や標本平均(m)との関係はどうなっているだろうか? ただし、各人の測定結果(身長)はX1,X2,X3・・・XNとあらわす。 問 1)日本人の平均身長= 2)日本人の平均身長の標準偏差= 3)標本の平均身長= 4)標本の平均身長= 5)標本の平均身長の分散から推定される日本人の平均身長の標準偏差= 6)標準誤差はσ/√nで与えられるが、これを標本分散を用いて表すと次のようになる。  標準誤差= 7)標準誤差を用いると、真実の平均値(母平均)があるであろう範囲(信頼区間)を特定の有意水準で求めることができる。有意水準5%のときの範囲(95%信頼区間)を表す式を示せ。 8)160、165,170,175,180というデータの平均の95%信頼区間を求めよ また、145,165,170,175,195というデータの平均の95%信頼区間と比較せよ。 以上の問です。 7と8以外は、数値を聞いているわけではなく、求める式を問うていることはなんとなくわかるのですが、ちょっとパソコンを利用して調べて回ったところ、どれが必要な情報かさえわからないレベルで、頭が痛くなってしまいました。 よろしければ問いの回答、その回答に至る考え方の流れなどを、簡単なものでも構わないのでご教授願えないでしょうか?

  • 統計学

    統計学なのですが、標本平均の分布と母集団分布の関連性はどのようなものでしょうか?あと分布型、平均の分布の平均と標準偏差について教えてください

  • 統計の基礎なんですが…

     大学へ入って「統計の基礎」というのを習っているのですが  正規分布の特徴に 『互いに独立に作用する多数の偶然的要因があり、一つ一つ要因の全体への影響が微少であるとき、これらの諸要因がもたらす誤差の総和は正規分布する』 ってあります。 「諸要因がもたらす総和というのはいったい何?」という疑問と「誤差が正規分布するとは?」という疑問が起こりました。  インターネットで用語集を探してみてみましたが、難しくてよくわかりませんでした。具体例…みたいなものをあげていただくとわかりやすいです。 すいません。ひょっとしたらものすごく漠然としているかもしれません。ですが、解説よろしくお願いいたします

  • 統計学

    今、マセマの統計学を自習しているのですが 分散と標準偏差の説明で両方とも分布の広がり具合がわかると書いてあるのですが、これは分散と標準偏差が同じものと考えていいのでしょうか? また正規分布というもはどのように作られたのか簡単に説明をお願いします

  • 統計入門書によると、中心極限定理に関して「もし、母集団が正規分布に従っ

    統計入門書によると、中心極限定理に関して「もし、母集団が正規分布に従っているならば、標本の大きさnの大小に関わらず、その平均の分布は正規分布」という記述があります。であるならば、母平均を区間推定する場合、zの値を用いて推定してもいいのかなと思いますが、ほとんどの書籍では、標本の大きさが小さい場合、tの値を用いて推定しています。なぜでしょうか?たぶん、自分がどこかで誤解をしているのだと思いますが、宜しくお願いします。