• 締切済み

t分布とχ2分布は合わせて考えていいのか?

正規分布に従うであろう母集団から ある20個のサンプルより取ったデータの平均値と標準偏差を求め、 その平均と標準偏差より 信頼区間95%で、t分布より平均は、9.5~10.5と求められ、 信頼区間95%で、χ2分布より、偏差は、1.2-1.8と求められたとします。 この場合、母集団のデータは、下記より 最小値=平均の最小値 - 偏差の最大値 :9.5-1.8=7.7 最大値=平均の最大値 - 偏差の最大値 :10.5+1.8=12.3 7.7 ~ 12.3 の間に95%信頼区間で入ると、考えてよいのでしょうか? ダメな場合は、そもそも20個のサンプルより母集団が正規分布になるとすると、その最大値最小値は、95%信頼区間で、どのような値になると考えればよろしいのか、どなたかご存知でしたら御教授ください。 どのような文献に載っていそうかなどの情報でも構いません。

みんなの回答

  • ur2c
  • ベストアンサー率63% (264/416)
回答No.2

最大値と最小値の分布については、参考 URL の始めの 30 行くらいを読めば良いと思います。 これも参考にしてください。 http://ja.wikipedia.org/wiki/%E6%A5%B5%E5%80%A4%E5%88%86%E5%B8%83 説明は英語の方がわかりやすいかも。 http://en.wikipedia.org/wiki/Generalized_extreme_value_distribution

参考URL:
http://www.geocities.jp/ikuro_kotaro/koramu/278_max.htm
  • ur2c
  • ベストアンサー率63% (264/416)
回答No.1

確率変数 X とその実現値 x、あるいは推定「量」f(X) と推定「値」f(x) がごちゃごちゃになってませんか? > 7.7 ~ 12.3 の間に95%信頼区間で入ると、考えてよいのでしょうか? 普通は、たとえば平均の点推定「値」= 10, 標準偏差の点推定「値」= 1.5 なら、データを更にとり続ければ、10 (+|-) 2 * 1.5 = [7, 13] の範囲に約 95% が収まる、と予測します。別の筋道の考え方もありますけれど、実質的には同じ結論になります。 > そもそも20個のサンプルより母集団が正規分布になるとすると、その最大値最小値は、95%信頼区間で、どのような値になると考えればよろしいのか これはまた全く別な話で、最大値と最小値の分布を考える必要があり、その計算自体は簡単です。けれど文脈からは、知りたいことは、最大値や最小値の分布ではなさそうに見えます。 要するに、概念を整理するのが先です。そのためにはまず、何が確率変数で何がその実現値なのかをはっきり意識しないと。

kuri_novu
質問者

補足

ごちゃごちゃになっているのかも知れません。 >最大値と最小値の分布を考える必要があり、その計算自体は簡単です。 この部分を教えていただけないでしょうか? そうすると、わかるかもしれないので。

関連するQ&A

  • 最大値(最小値)の分布

    ある母集団は、平均値がAの正規分布又はポアソン分布であり、その標準偏差は√Aで表されます。その母集団から、N個サンプリングしたとします。(正規分布とポアソン分布のどちらで考えてもいいです。) N個サンプリングしたデータについて、最大値と最小値の標準偏差はどのように表されるでしょうか。平均値Aとサンプリング数Nで表されるはずなのですが、どうしても分かりません。 よろしくお願いいたします。

  • 信頼区間 正規分布しない場合

    信頼区間を求める方法として、「標準正規分布では値が1.96以上の曲線下の面積と、-1.96以下の面積を合計すると0.05である。そこで平均から標準誤差SEに1.96の値をかけ算した値を引いた値と足した値の範囲に真の値が含まれるはずと言うことになる。これを95%信頼区間という」と本に記載されていました。母集団が少なく、正規分布していないであろうと思われるサンプルであっても、この方法に従い信頼区間を算出することは適切でしょうか? 具体的には以下の2群のそれぞれについて95%信頼区間を知りたいのです。 統計については素人なので的はずれな質問かも知れません。 X 209.1 280 91 124 80.57884211 67 152.2 88.584 138.0215385 112.43 115.71 97 128 144 Y 145.035 113.2352941 143.5 117.25 62 78 58 79.5 68.49975 73.85728571 81.61222222 190.5 58 179.25 84 76.6665 168.92 76.76

  • 区間推定に使うt値

    ある母集団から10個の標本を抜取って、 標本の平均μと不偏分散σ^2、標本標準偏差σ/√10を求めました。 次に母集団の平均の区間推定を行います。 99%の信頼度で区間推定した場合、ある参考書に、 区間= μ ± t × σ/√10 と記されていました。 このtという値は信頼度とサンプル数(自由度)によって変化するとのことなので、 t分布表から選択して計算するようにと書いてあります。 自分は エクセルのNorminv(0.005,μ,σ/√10)~Norminv(0.995,μ,σ/√10) を使って求めたほうが簡単なので、こちらを使用するのですが、 上の参考書の値と異なってしまいます。 エクセルのNorminv関数にはなにか欠点があるのでしょうか? よろしくお願いいたします。 データ添付します。

  • 正規分布とヒストグラムのグラフの書き方

    エクセルで正規分布とヒストグラムをひとつのグラフとして表そうとしています。過去の質問や他のページを調べた結果、ある程度書き方を理解して、求めるグラフが書けました。 しかし、ヒストグラムのデータ区間を変えたとき、どのように対応すればよいのか分からなくなりました。 具体的に書いていきたいと思います。 正規分布になるとほぼ確信しているデータがあります。 サンプル数は50、平均7.8、標準偏差2.9のデータです。 データ区間 頻度 0       0 1       1 2       1 3       2 4       2 5       5 6       6 7       6 8       6 9       8 10      5 11      2 12      3 13      1 14      2 15      0 というデータです。 そして、データ区間に対応する正規分布の値を NORMDIST(あるデータ区間の値,平均,標準偏差,FALSE) を使用して、求めます。 そして、得られた正規分布の値をそれぞれ、サンプル数(50)倍します。 (ここでサンプル数倍するという作業は、NORMDIST(データ,平均,標準偏差,FALSE)で描かれるグラフの面積は1なので、今書きたいヒストグラムとサイズをあわせる…という理解でよろしいのでしょうか?) 上述の度数分布表から棒グラフ→データ系列の書式設定→オプションで棒の間隔を0にすることでヒストグラムを描きました。(分析ツールを用いても良かったのですが) また、同グラフに新たな系列を増やし、NORMDIST*50によって得られた値を導入し、こちらは、グラフの種類→マーカーの無い線グラフ→データ系列の書式設定→パターン→スムージングを選択することによって、正規分布のグラフを書きます。 以上の作業で、求めていたグラフは書けました。 視覚的に予想通り正規分布のグラフに近いことが分かりました。 さて、ヒストグラムを使用する際によく行われる作業ですが、上述の度数分布表みたいに、データ区間を1刻みにするより、大きくしたほうがデータの性質がより見てとれることがあります。 そのため、ここでも、データ区間を広げ、2刻みにした場合のグラフを描こうと思いました。 度数分布表は以下のようになります。 データ区間 頻度 1       1 3       3 5       7 7       12 9       14 11      7 13      4 15      2 17      0 ここから、前回同様の作業でヒストグラムは容易に描けます。 正規分布のグラフはどのように書けば良いのでしょうか? 前回同様、NORMDIST*50から得られる値を利用しても、ヒストグラムの棒の高さが前回より高いので、全く合いません。 正規分布関数は定数倍しても性質が変わることはないので、実験的に50以外の値を導入してみました。 データ区間が2倍になったから、*50を更に2倍して、*100にしてみようか、という安易な考えのもと、NORMDIST*100を使用したグラフを書いてみました。 すると、ヒストグラムと正規分布の形が視覚的に似て見える、というもっともらしいグラフは得られました。 しかし、安易にNORMDIST*100を導入したことに疑問と不安を覚えます。 このようにして得られてグラフに問題は無いでしょうか。 また、データ区間を変更したとき、NORMDISTを何倍してやると良いなどというのはあるのでしょうか。 数理統計もエクセルも初心者なので、得られたグラフに自信がないのです。 どのように考えればよいのでしょうか。 質問文が非常に長くなってしまい、申し訳無いのですが、わかる方、お教えいただけないでしょうか。 お手数をおかけしますが、よろしくお願いします。

  • 最大値分布の作成

    最大値分布の作成 最大値分布に関する質問です。ある母集団からN個サンプルをとることを永遠に繰り返した時の、その最大値の分布を導出するのはどうしたらよいですか?Nが2の時、4の時、8の時と分けて3つの異なる分布を得たいです。 例えばある母集団の分布(平均6.3、標準偏差1.3)があり、ここから4個サンプルを取り出すとします。これが(5,9,6,4)だったとするとこの中の最大値は9です。このサンプリングを無限に行う時の最大値の分布はどのように計算できますか? この最大値の分布は1回のサンプル数の大きさに比例して大きくなると考えられますが、サンプル数が2の時、4の時、8の時の最大値分布の平均と標準偏差を求めたいです。 順序統計量の最大値の確率分布を用いるのかと思い調べたのですがよくわかりません。どうか知恵をお貸しください。よろしくおねがいします。

  • 正規分布に従うときの母平均と母分散の求め方

    今、数千件のデータを解析しています。 ヒストグラムから、それぞれの時点のデータが正規分布に従うことが分かりましたので、母集団も正規分布に従う、という仮定の下で話を進めます。 各時点での平均と標準偏差をプロットしたところ、右上がりの一次関数になり、一定の値にはなりませんでした。 そこで、このような場合(標本平均も標本分散も一定の値にならない)、どうやって全体の母集団のパラメータを推定するのでしょうか。 教えてください。

  • 90%の信頼区間における区間推定

    統計学の区間推定に関する質問です。 このとき、標本平均は標準正規分布に従っているものとします。 95%の信頼区間の場合、標準正規分布から1.96のときちょうど0.9750なので、-1.96<X<1.96と割り出すことができますよね。 ところが90%の信頼区間の場合、ちょうど0.9500になる値がありません。 これに近い値では0.9495(1.64)と0.9505(1.65)とがありますが、どちらも0.9500との差は0.0005ですよね。 この場合、1.64と1.65のどちらの値を採用すればよいのですか?

  • 正規分布の問題

    大学院進学のために院試の過去問を解いています。 その中で正規分布の問題があり、私の通っていた大学ではここまでは勉強していなかったために 解き方が全く分かりません。 大学の先生に聞いてみても良いかと思いましたが、その先生とは全くといって良いほど接点がなく、また、違う大学の院試なので聞いても教えてくれません。 自分で調べるとしても他の部分の勉強のためにこの問題を解くのに時間がありません・・・ 分かる方がいれば教えてもらないでしょうか? ------------------------------------------ 平均μ(ミュー、マイクロとも)、分散σ^2(シグマ二乗)の正規分布N(μ σ^2)から独立に抽出されたn個の標本平均をXとする。 問1 母分散σ^2が既知の場合、母平均μの信頼度100(1-α)%の信頼区間を求めよ。但し、有意水準α、標準正規分布の上側確率が100(α/2)%となる点の値をZ(α/2)とする。 問2 測定値は母分散がσ^2=0.04の正規分布に従うとする。母平均μの信頼度95%での標本誤差を0.1以下にしたいとき、最小限必要な標本の大きさnを求めよ。但し、標準正規分布の上側確率が2.5%となる点の値Z(0.025)は1.96である。 ------------------------------------------- 宜しくお願いします。

  • 統計 正規分布図がなんかおかしい 

    マンホイットニーのu検定をしているのですが、 正規分布と主な信頼区間?(グラフ上に凸の2時関数みないな図です)をつくったのですが、 平均0、標準偏差1で作ると、ちゃんとそうなるのですが、 実験データの平均32、標準偏差9.522ですると貼り付けのようになります。(壊滅的な絵で申し訳ないです・・) これは、どうしたものなんでしょうか・・・? 参考にさせていただいたのはhttp://software.ssri.co.jp/statweb2/tips/tips_2.htmlです。 こちらを見て作らせていただきました。

  • 統計学の質問なんですが・・

    ある問題で 1)正規母集団N(μ.0.25)からn=25のランダムサンプルを検出し。 x*=18.26(平均の意)を得た。母平均95%信頼区間を求めよ。また、90%信頼区間を求めよ。 2)ある製品の検査の所要時間は正規分布すると言われている。大きさのランダムサンプルについて 12.4 13.5 12.7 14.1 13.8 14.1 12.0 12.87 13.1 15.4 のデータを得た。母平均95%の信頼区間を求めよ。 について分かる方がいらっしゃれば教えてください。お願いいたします。