• 締切済み

正規分布

研究を行っておりますが統計が難しくいつも悩みます。 2群間の比較を良く行いますが,基本的にはt検定を用います。 t検定を用いるには様々な条件が必要ですが,データが連続変数であり,正規分布であり,分散が等しいなどがあるようです。 そこでいつも悩む点が,正規分布はサンプルが正規分布なのか,推定母集団が正規分布なのか,本によって書き方が難解で解りません。 また,サンプルが5個とか10個程度でも正規分布を示すことがあるのでしょうか。 教えてください。

みんなの回答

  • ssmarugoo
  • ベストアンサー率47% (84/176)
回答No.3

>そこでいつも悩む点が,正規分布はサンプルが正規分布なのか,推定母集団が正規分布なのか,本によって書き方が難解で解りません。 推定母集団が正規分布していれば、ランダムにサンプリングした標本集団も正規分布します。 これを確かめるには、標本集団のデータを「コルモゴルフ・スミノルフ検定」をして確かめなければいけません。これはt検定を行う前に行う常識です。(論文提出とかするなら) >また,サンプルが5個とか10個程度でも正規分布を示すことがあるのでしょうか。 教えてください。 ありえますよ。それも上記の検定を行って確かめる必要があります。 しかし、一般的に20以下のサンプル数ならt検定は行わないほうがいいでしょう。いや、行うべきではありません。なぜなら、サンプルから分布の様子をわかることができますか。もっとサンプル数を増やす必要があるのです。しかし、それが無理のときはノンパラメトリック検定を行えばいいです。 マン・ホイットニーのU検定です。

  • sanori
  • ベストアンサー率48% (5664/11798)
回答No.2

>>> 正規分布はサンプルが正規分布なのか,推定母集団が正規分布なのか,本によって書き方が難解で解りません。 どちらも正規分布として考えます。 ・・・というか、正規分布としてよいと判断されれば正規分布として取り扱うことができます。    日本語になってなくてごめんなさい。 >>> サンプルが5個とか10個程度でも正規分布を示すことがあるのでしょうか サンプル数が十分多ければ、およそ正規分布になります。 しかし、サンプル数がそれしか確保できないのであれば、しょうがないです。 サンプル採取や測定に多大なお金がかかる場合では、よくあることです。 私も、そういう事情で、やむなく10個に満たないサンプル数の測定で標準偏差を計算したことがあります。 なお、注意点としては、 サンプル抜き取りなので、標準偏差σを求めるとき、 √の中のSの分母はサンプル数Nではなく、サンプル数から1を引いたN-1にしなくてはならない、 ということがあります。 http://kuchem.kyoto-u.ac.jp/bukka/member/yyosuke/uebung/stat06/stat06_lec01.htm

  • backs
  • ベストアンサー率50% (410/818)
回答No.1

> 正規分布はサンプルが正規分布なのか,推定母集団が正規分布なのか, 推定しようとする母集団の分布が正規分布であるかどうかということですが、そもそも母分布が正規分布であるかどうかは分からないので、それすらも仮定するしかないということになります。 > サンプルが5個とか10個程度でも正規分布を示すことがあるのでしょうか。 母分布が正規分布であるかどうかの検定もありますが、それは標本の大きさが5個とか10個とかでは難しいでしょう。ただし、ある程度の分布のズレは気にしなくても問題ありません。明らかに違う場合でも等分散を仮定しない場合のウェルチ検定を行えばよいだけです。

関連するQ&A

  • 統計学 正規分布と対数正規分布の比較方法

    統計学についての質問です。 比較使用としている群で、ひとつの群は正規分布( Shapiro-WilkのW検定、p<0.05)で、もう一つの群が対数正規分布(KolmogorovのD検定)となりました。この二群間にて数値の有意差を検定するときの検定方法は正規分布の二群間と同じようにt検定等といったパラメトリックな検定を用いて問題ないのでしょうか? また、正規分布と対数正規分布の二群を検定する検定方法はどのような方法が望ましいのでしょうか。 対数正規分布は標本数8検体で、正規分布のものは3検体~12検体となっています。

  • 統計:正規分布と正規分布でない母集団を比較すると

    正規分布である母集団(n=30)と正規分布だない母集団(n=18)の差を比較するときはどうしたらよいのでしょか?パラメトリックとノンパラメトリックで正規分布の有無で検定方法が変わりますよね。この場合どうしたらよいのでしょうか?統計学あまり覚えてませんでして。

  • 切断された正規分布

    今ある標本(Y,X)の組があって、その母集団が正規分布であることがわかっているとします。 ただ、得られた標本(Y,X)はXがある閾値以上のものに限定されている(すなわち、正規分布の尾の部分のみが観測されている)としたとき、 母集団である正規分布の統計量を推定するにはどうすればよいでしょうか?

  • 統計学 分散の加法性と正規分布の一次結合

    分散の加法性と正規分布の一次結合って矛盾していませんか? 正規分布に従う確率変数X1,X2がそれぞれ統計的に独立である場合、それぞれの母分散σ1^2,σ2^2の和σ^2を考えます。 正規分布の式に直接あてはめ一次結合を考えると以下の式が成り立ちます。 σ^2=σ1^2+σ2^2 しかし、母分散の定義式に従って計算すると以下の結果になります。 σ^2=σ1^2+σ2^2+2*σ12 ここで、σ12の共分散です。統計的に独立であっても共分散が0である保証はないので、下の式のほうが厳密であるように思います。しかし、QC(品質管理)検定の問題では無視されており、一次結合に至っては0です。なぜこのような矛盾が生じるのでしょうか?

  • 正規分布について教えてください!

    皆さん助けてください! 宿題として、 ************** ある変数xについて x~N(μ,σ^2) この時、標準化(z=x-μ/σ)後のZの分布の平均値と分散を算出せよ。なお、データはnとする ************** というものが出ました。つまり、標準正規分布のN(0,1)を導けというのです。インターネットで調べて、答えが平均値(μ)=0,分散(σ^2)=1であることは分かったのですが、それを導き出すまでの途中式が分かりません…。 統計学が得意な方どうかよろしくお願いいたします!

  • 統計入門書によると、中心極限定理に関して「もし、母集団が正規分布に従っ

    統計入門書によると、中心極限定理に関して「もし、母集団が正規分布に従っているならば、標本の大きさnの大小に関わらず、その平均の分布は正規分布」という記述があります。であるならば、母平均を区間推定する場合、zの値を用いて推定してもいいのかなと思いますが、ほとんどの書籍では、標本の大きさが小さい場合、tの値を用いて推定しています。なぜでしょうか?たぶん、自分がどこかで誤解をしているのだと思いますが、宜しくお願いします。

  • 正規分布の再帰性について

    現在大学生です。 統計学に関しての質問です。 互いに独立な2つ正規分布に従う確率変数の和の分布は正規分布になりますが、 完全に従属な2つの正規分布に従う確率変数の和の分布は正規分布になるのでしょうか。 例えば、ある正規分布に従う1つの確率変数の定数倍の分布は正規分布になるのでしょうか。 単純そうなのですが、考えれば考えるほど分からなくなるので、納得ができる説明をしていただけると幸いです。 よろしくお願いします。

  • 社会統計について質問です。

    友人に社会統計学について、質問を受けました。 私は心理学科なので、心理統計しか分からず、困っています。 どなたか助けてください。 以下のような問題です。 体重に関して正規分布N(μ,σ二乗)に従う母集団から、無作為抽出によって以下の16の標本を得た。 62,50,60,48,62,59,36,64,64,62,87,63,75,27,65,76 (1)標本平均、不偏標本分散、不偏標本標準偏差を求めよ。 (2)母平均の最尤推定値(最尤推定量の実現値)を求めよ。 (3)母分散は既知とする。このとき標本平均の標本分布はどのような分布に従うか。「確立変数~確率分布」という形式で答えよ。 (4)母分散は未知であるとする。このとき、母平均の95%信頼区間を求めよ。 (5)母平均は未知であるとする。帰無仮説をHo:μ=52としたとき、適切な検定統計量を求め、5%水準両側検定、1%水準両側検定、5%水準右片側検定、1% 水準右片側検定をそれぞれ実施せよ。 (7)さらに、体重に関して正規分布する別の母集団から、無作為抽出して以下の16の標本を得た。2つの母集団の母分散は未知であるが、母分散は同じであると仮定して良い。「2つの母平均は等しい」を帰無仮説として、母平均の差に関する5%水準両側検定を実施せよ。(ヒント:t0.025(30)=2.042) 65,60,57,76,79,72,57,75,54,75,42,77,38,48,71,78 よろしくお願いします。

  • 統計学におけるz分布とt分布の使い分け

    統計学を勉強していたのが、かなり昔なので忘れたのですが、z分布を使っていいのは、母集団に関する場合のみでしたっけ? z分布は、正規分布の標準化されたバージョンなので、とりあえず一通り万能に使えるというわけではないのでしょうか? あるいは、t分布は推測や仮説検定のときのみに使うという理解は正しいですか?

  • 2つの正規分布を合成したらどうなるのでしょうか?

    現在大学の研究の過程で統計学を学ぶ必要がでてきました。僕自身は統計学に詳しくはないので知識のある方の回答は非常に助かります。 どうかご教授よろしくおねがいします。 平均μ、分散σで表される正規分布はf(x)=1/((√2π)σ) exp-{((x-μ)^2)/2σ^2}で表されますが 例えば互いに独立で 国語の平均点、分散を(μ1,σ1)としての正規分布f(国語) 数学の平均点、分散を(μ2,σ2)としての正規分布f(数学) とした時の国語と数学の合計得点の分布f(国語+数学)はどのように表せばよいのでしょうか? もしμ3=μ1+μ2,σ3=σ1+σ2のように平均も分散も和で考えてよいのなら f(国語+数学)=1/((√2π)σ3) exp-{((x-μ3)^2)/2σ3^2} が答えだと思っているのですが、それとは別のやり方で f(国語)=1/((√2π)σ1) exp-{((x-μ1)^2)/2σ1^2}と f(数学)=1/((√2π)σ2) exp-{((x-μ2)^2)/2σ2^2}をたたみこみ積分すれば答えがでるのではないかと考えています。 しかし、僕の数学の知識ではこれができなくて困っています。ガウス積分の公式を使ったりしなければいけないのではないかとも考えいるのですが行き詰っています。 アドバイスよろしくお願いいたします。