各国の米の生産量の分散を求める方法とは?

このQ&Aのポイント
  • 各国の米の生産量の分散を求めるために考えられる方法はいくつかあります。
  • 通常の分散の計算方法では、生産量の多い国ほど分散の値が大きくなる傾向があります。
  • 一つの考え方としては、平均値からの乖離を計算し、それを二乗して合計し、標本数で割る方法があります。しかし、この方法を使っても正確な分散の値を得ることができるかは疑問です。
回答を見る
  • ベストアンサー

分散の求め方、量が多いほど分散が大きい。この解決法。

各国の米の生産量の分散を求めて乱数を発生させることを考えています。 その乱数は1を平均として(つまりパーセントで)正規分布で発生させようと考えています。 純粋に生産量の分散を計算すると生産量の多い国ほど分散の値が大きくなってしまうことに気がつきました。 通常、どのような処理の仕方をするものなのでしょうか? 私のとった処理法は (平均値との乖離/平均値)^2 を合計し、標本数で割る というものです。 これによって、生産量に関わらず分散の大きさが国ごとにでた感じがしますが、自信がありませんし、どのような考え方があるのか知りたいので教えていただけませんでしょうか? もし、良い教科書などがありましたらそれも教えてください。

質問者が選んだベストアンサー

  • ベストアンサー
  • at9_am
  • ベストアンサー率40% (1540/3760)
回答No.1

おそらく平均0、分散σ^2 の正規乱数を e として Q_{it} = (1+e_{it}) m_i という操作を行って乱数を発生させようとしたのだと思います。ただし Q_{in} は i 国のt年の生産量、m_i は i 国の平均的生産量とします。 すると、分散は m_i^2 σ^2 になります。したがって m_i が大きくなると分散も大きくなってしまいます。 実際には、畑の多い国・地域ほど安定的に大きい生産量が見込まれますが、少ない畑で多くの生産を行っている場合には不安定になるはずです。 一つの解決策としては、面積当たりの収穫量に直して、全体の収穫量はその合計であるという立場をとることです。 例えば、2つの畑からなる国を考えた場合、 Q = q_1 + q_2 = (1+e_1) m/2 + (1+e_2) m/2 = {1 + (e_1 + e_2)/2} m となりますので、分散は単位当たり収穫量 m が大きくなれば大きくなりますが、国が大きくなれば小さくなり、直感にも合います。

関連するQ&A

  • 正規母集団でないときの標本平均と標本分散の独立性

    こんにちは。 正規母集団であるとき、標本平均と標本分散の分布が独立であることは、直交変換によって証明することができますが、 非正規母集団であるときは、標本平均と標本分散の独立性は必ずしも成り立たないということでよろしいでしょうか。 また、正規分布以外の分布で、標本平均と標本分散が独立であるような母集団分布をご存知であれば教えて頂きたいのですが。 よろしくお願い致します。

  • 不偏分散の分布は?

    不偏分散の分布について混乱していますので、ご助言頂けましたら幸甚です。 例えば母集団の分布を正規分布N(μ,σ^2)とした際、 標本平均x(=1/nΣxi)を区間推定する場合、正規分布の再帰性より、標本平均の分布はN(μ,(σ/√n)^2)となることから、μの区間推定が可能と理解しています。 また、若干やり様は異なりますが、標本分散s^2=1/nΣ(x-xi)^2に対し、ns^2/σ^2がΧ2分布に従うことから、σの導出が可能と理解しています。 ここで、上記と同様に、不偏分散(=1/n-1Σ(x-xi)^2)についての分布とは、どのような分布になるのでしょうか? おそらくΧ2分布になると推察しますが、証明できてません。 また、不偏分散の導出方法は、 E[S^2]、即ちS^2の平均と理解していますが、 S^2を確率変数とした際の分布がΧ2分布なのであれば、 このΧ2分布の平均が、不偏分散になってもよさそうですが、 Χ2分布の平均=n ですので、不偏分散とは不一致です。 上記のとおり、整理がついておりませんので、教えて頂けましたら助かります。 特に上記のとおり混乱しておりますので、現在はむしろ、「不偏分散については、点推定でのみ用いるのか?」と考えております。

  • Rにおいて、中心極限定理を確認するために、乱数の標本平均のヒストグラム

    Rにおいて、中心極限定理を確認するために、乱数の標本平均のヒストグラムと正規分布のグラフを重ね合わせたいのですが、軸ラベルがおかしくなってしまいます。例えば、1000個の標本平均のヒストグラム hist(x)と平均0,分散1の正規分布のグラフを上手く重ね合わせるにはどうしたらいいですか?

  • 正規分布の発生の仕方

    正規分布の発生の仕方について悩んでいます。 正規分布に従った平均と分散が違う乱数を独立に複数発生させて、 発生させた乱数を全て合わせるとそれも正規分布に従っているというものを作りたいのですがいい方法知っている方いらっしゃるでしょうか? これがものすごく必要で困っています。。。 よろしくお願いします。

  • 任意の標準偏差で正規分布の乱数を発生させたい

    2次元の正規分布の乱数を発生させたいんですが、 調べたところ、 平均0、分散1の正規分布の乱数の発生方法アルゴリズムが以下のものになることがわかりました。 「Box-Maller法:区間(0,1)の2個の一様乱数x1,x2と2個の量y1,y2との間の変換 y1=sqrt(-2*ln(x1))*cos(2*Pi*x2) y2=sqrt(-2*ln(x1))*sin(2*Pi*x2)」 ここで、平均0、分散0.2の正規分布の乱数を発生させたいのですが、どうすればよいでしょうか? 単純にy1,y2に0.2を掛けるだけでもできますが、これは数学的に正しいのでしょうか?

  • 分散の検定

    昨年末のアクチュアリー試験での問題です。 分散の片側検定において,真の分散が帰無仮説において仮定された分散の3倍になったとき,帰無仮説が確率95%以上で棄却されるようにするには標本数が[ ]個あればよい.ただし,平均は未知とし,有意水準は0.05とする. という問題です。分布に何の仮定もないし、標本数の大きさを問うのだから正規分布近似も適当だとは思えません。とするとχ^2-testではできないように思います。こういう問題の場合、どのように解くものなのでしょうか?

  • X,Yは無作為標本で母平均をμ、母分散をσ^2(シグマの2乗)とする。

    X,Yは無作為標本で母平均をμ、母分散をσ^2(シグマの2乗)とする。 aX+bYがμの不偏推定量で、その分散を最小にするa,b の値を求めよ という問題が分かりません。 私なりに考えてみたものの、 正規母集団からの標本分布がN(aX+bY,σ^2/2)になることしか分かりません。あってますか?? どなたか分かりやすく教えて下さい。

  • 推定量

    統計の問題で 【分散の異なる正規分布 N(μ,σ1^2),N(μ,σ2^2) から2つずつ無作為標本をとる. このとき,μの有効推定量は大体幾らか?】 という問題があるのですが,よくわかりません. 分散が小さい推定量が「良い」ことは分かるのですが, 「これ以上良い推定量はない」といえるような推定量はあるのでしょうか?

  • 正規母集団の標本平均と標本分散の独立性

    X_1,…,X_nを正規母集団から取った大きさnの標本とします。 簡単のため、母集団の平均は0、分散は1と仮定します。 このとき標本平均X=(X_1+…+X_n)/nと 標本(不偏)分散s=((X_1-X)^2+…+(X_n-X)^2)/(n-1) を考えます。 Xは平均0、分散1/nの正規分布に、 (n-1)sは自由度n-1のχ^2分布に従うと思いますが、 このXとsの独立性の証明はどうやったらよいのでしょうか? 結合分布の計算にX_i^2が混じるので大変に面倒です。 非芯χ^2分布の特性関数の計算などを使うのでしょうか。 方針は立つものの、あまりに煩雑な計算になりそうで尻込みしています。 簡便な計算法をご存知であれば教えていただきたく思います。 よろしくお願いします。

  • 確率統計における確率分布の定理について

    検定を行うときの確率分布のあてはめで、 データをk個の事象に分けて統計量X^2を求め、それが自由度k-r-1のカイ2乗分布に従う、 rは期待値を求める際に母数で推定したももの個数で、標本平均と標本分散を使用したとすればr=2、 という定理を使うと思うのですが、 例えばデータを身長として検定を行う場合はそれを標準化して、 期待値の算出にサンプルの平均、標準偏差を使うのでr=2で自由度はk-3になりますよね? ここで上の定理が正しいことを確かめるためにデータを1,000個ほどの標準正規乱数として、X^2を複数回求め、 その分布が実際にカイ2乗分布に従うかどうかを調べるときは自由度はどうなるのでしょうか? 1,000個の標準正規乱数が実際に標準正規分布に従うとして平均=0、分散=1として行う場合はr=0、 また標準正規分布に従うかではなく1,000個のサンプルから新たに平均、標準偏差を求めてX^2を求める場合はr=2となると考えたのですが、これは正しいのでしょうか? わかりにくい文ですみません。 よろしくお願いします。