• 締切済み

統計学について教えて下さい

統計データでのサンプリングについて 出現確率が異なるA,B,C,,,,,,Zから それぞれ同じ数のサンプルをとった場合、 確率にどういった矛盾が生じるでしょうか? ご存知の方いませんか?

みんなの回答

  • alice_44
  • ベストアンサー率44% (2109/4759)
回答No.1

別段、矛盾は生じないだろうが、ただ単に サンプルがもとの分布を近似しなくなる。 例えば、商店街の福引で、 ガラポンから各色の球を一個づつ取り出し たものを、別のガラポンにいれてみる。 こうして作ったミニガラポンを使ってみて、 そこから、福引の予算とか、客の反応とか 何か考察しようとしても、もとの福引とは 各等の当たる確率が違うから、何も解らない。 異なる分布について考察すれば、異なる結論 が得られる。そんだけの話。

関連するQ&A

  • 確率と統計 どちらが理解しやすいと思いますか。

    私は確率の方が理解しやすいと思います。具体的には, 【中学校】 1年:場合の数(小6から)と確率(中2から) 2年:データの整理(中1から) 3年:標本調査 【高等学校】 数学I(1年次必修):場合の数と確率(数Aから) 数学II(2~3年次選択)又は統計(3年次選択):データの分析(数Iから),確率分布(数Bから),統計的な推測(数Bから) です。

  • 統計学の問題について教えてください。

    統計学を独学で学んでいるのですが、コンセプトの所でつまずいています。 大学で統計学を学んだ方や、統計に詳しい方、教えてください。 {問題1} 変数の対(X,Y)ならびに(Y,Z)の両者に有意な相関が観測される場合、(X,Z)に関しては何が言えるか。以下の中から最も適当であると思われるものを選べ。 A、有意な相関がある。B、有意な相関はない。 C、どちらともいえない。 (私の答え)C、(X,Y),(Y,Z)に相関があっても、(X,Z)に相関があることは分からないと思う。 {問題2} ある無限母集団から1000個のサンプルを無作為に抽出しヒストグラムを描くと、かなり左裾が長い分布となった。その後、2000個のランダムサンプルを追加してもう一度ヒストグラムを描いた場合、その分布の形状はどうなると考えられるか。以下の中から最も可能性が高いと思われるものを選べ。 A、左右対称に近づく。B、右裾が長い分布となる。 C、左裾が長い分布となる。 (私の答え・疑問点)Nが増えるにつれてヒストグラムは左右対称に近づくと思う。しかしこの場合、無限母集団とランダムサンプリングとの違いが不明である。 {問題3} A大学の男子学生と女子学生の身長は、それぞれ正規分布をし、男性の平均は170cm、標準偏差は10cm、女性の平均は156cm、標準偏差は9.8cmであると仮定する。この大学の男子学生一人と女子学生一人をランダムに選んだ場合、選ばれた男子学生の身長が女子学生の身長より高い確率はおよそいくつか。以下の中から最も適当であると思われるものを選べ。なお、いかにPrで示した標準正規分布の下側確立を参考にせよ。 Pr(Z<0.7)=0.76 Pr(Z<1.0)=0.84  Pr(Z<1.3)=0.90 Pr(Z<1.4)=0.92 A、0.76 B、0.84 C、0.90 D、0.92 (私の疑問点)それぞれSDが分かっているが、生徒が何人いるのか分からないのでどう計算するのか分からない。

  • 統計です

    自分で適当な株を選んで、3ヶ月間分の株価のデータを統計にするという問題でとりあえずエクセルでやってみてグラフなどを書きました。 ここからが問題なのですが、 a=1/NΣ(x-m)^2、b=1/NΣ(x-m)^3、c=1/NΣ(x-m)^2 を求めよ。Nはサンプル数。mは平均値です。 各々、7057、-535018、144859695 という数字を得ました。そこで、この株価のデータは普通に分散しているか?という質問には何と答えたらいいのでしょうか? これらの数字が表してる意味がイマイチわかりません。 次の問題で漸近正規性を計算する。 Z=(N/6)(b/a^1.5)^2+(N/24)(c/a^2-3)^2 とりあえず上の数字を代入して Z=27.897607 となりました。 ここでZ~Xⅱ^2の条件下で、Xⅱ^2の分布表を使えば、この株価の分布が正常なものかがわかる! と書いてあるのですが、どうやったら、わかるんでしょうか??(>_<) 何かわかりにくくてごめんなさい!

  • 統計学における標準化について

    A)標準化は、次のページの https://bellcurve.jp/statistics/course/19647.html サンプルxー平均値/標準偏差 であり、これで正規分布のz値と照らし合わせて確率を求めるというのは理解できました。 B)ただ、実践において、統計量Zを求める際に、次のサイトでは、 https://bellcurve.jp/statistics/course/9317.html z=x⁻(xの平均) -μ / √σ² * √n とあります。 分母が標準誤差です。 C)一方次のページでは、 https://bellcurve.jp/statistics/course/9490.html z=X-np / √np(1-p) とあり、こちらは標準偏差で割っています。 以下質問ですが、 1)Aは何も推定しておらず、すなわち記述統計で全サンプルが分かっている、すなわち母集団での話で、あるサンプルxiの全体のうちでの発生確率を示すために標準化してZ値を求めている、という考え方で正しいですか? 2)Bは標準誤差で割っているのは、母集団σ²から抽出した標本であり、抽出した確率変数Xについて、母集団が正規分布に従うのであれば、X~N(μ、σ²/n)に従うので、この分散の√を使っている(すなわち標準誤差を使う)という認識で正しいですか? 3)Cは二項分布のnが大きいときに中心極限定理で正規分布と近似させて解くという計算の話なのかと思いますが、これは、Aと同じように、変数Xから平均を引き、標準偏差で割っています。これは抽出した標本だと思うのですが、Aと同じ方法でいいのでしょうか?かといって。正規分布から抽出していませんが……。 それぞれの用語とかも良く調べましたが、いまいち使いこなせていません。A,B,Cそれぞれ分子も違うので、標準化を基本に色々やっているのだろうと思うのですが、使い分けというか、それぞれの出てくる場面とかも教えてほしいです。 よろしくお願いいたします。

  • 統計手法

    ある薬Aの投与前後の血液データBの変化について統計処理を考えています。しかし血液データBは非常に個人差が大きくサンプル数10程度では正規分布には程遠くなってしまいます。このような時はWiscoxinの符号順位検定を用いて検定してよいでしょうか。また、投与前をたとえば100としてデータを標準化した場合はどのような統計処理がよいのでしょうか。

  • 統計学におけるサンプル数

    何かの統計で、属性aが30%、bが20%、cが50%とかやります。 テレビの視聴率とかもそうですよね。 そのとき、これくらいの数を調べたらこれ以上サンプルを増やしても大してかわらない、というライン(必要な調査数)はどうやって決まるのですか? あんまり難しくなく、大づかみに教えてくれるとうれしいです。

  • 統計の計算ができません・・・!!!

    至急お願いします!統計分かる方! 四苦八苦してます・・ (1) データB 13.5.7.7.9.10 最大値に対応する10の偏差値を計算しなさい (2) P(0≦Z≦0.50)=0.1915 P(0≦Z≦1.00)=0.3413 P(-∞≦Z≦∞)は何でしょう (3) N(10,16)からサンプルを40個抽出した場合 その標本平均に関する標準誤差を計算しなさい よろしくおねがいします!!!! この質問に補足する

  • 科目「確率・統計」を復活させるべきだと思いますか

    私は復活させるべきだと思います。内容は 場合の数(現数学A),確率(同),データの分析(現数学I),確率分布(現数学B),統計的な推測(同) で構成したいと考えております。

  • 統計学 二つのグループの有意差検定?

    二つのグループのサンプルについて統計的な検定をしなければならないのですが、統計学が全く分からないもので、何検定を使ってどう検定したら良いのか分かりません。下記が検定をするデータで、「A群の方が値が大きく、ABの二群には有意な差がある」と結論付けたいのですが、やり方をご教授願えませんでしょうか?A、Bでサンプル数が異なっていてどういった検定を使うのが正解なのか全く分かりません。よろしくお願い致します。 A群 B群 3  2 4  1 2  1 3  2 3 3

  • 統計

    独立した2郡の差の統計において、サンプル数の偏りで、サンプル数に極端な差がある場合、数が多い方を、減らしたほうが良いと意見されたのですが、統計の正確性に変わりが出るのでしょうか?教えてください。基本的な質問で申し訳ありませんが、よろしくお願いします。