• ベストアンサー

分散の求め方について

分散の計算の仕方がどうしてもわかりません。 -2,-2,0,2,2 この場合は(-2)二乗+(-2)二乗+2二乗+2二乗で16ということははかるのですが以下の2つの計算の仕方が分からず困っております。 -102,-101,100,101,102 答えには49210と書いてあったのですが自分が計算すると、10になります。 -53,50,50,50,53 こちらも答えには8618と書いてあるのですが、自分が計算すると18になります。 ずっと考えているのですが、どうしてこのような値になるのか全然わからず困っております。。

  • a-Z09
  • お礼率33% (1/3)

質問者が選んだベストアンサー

  • ベストアンサー
  • Hurrypon
  • ベストアンサー率44% (12/27)
回答No.1

分散ではなく,平方和ではないでしょうか?分散は平方和をデータ数,もしくはデータ数ー1で割る必要があります。 で,平方和は(データ-平均)の2乗の総和です。 最初の例である -2,-2,0,2,2 というデータの場合,これらのデータの平均は0になります。ですから平方和は (-2-0)2乗+(-2-0)2乗+(0-0)2乗+(2-0)2乗+(2-0)2乗 =4+4+0+4+4 =16 となります。ちなみに分散は 標本分散の場合:平方和/データ数なので16/5=3.2 母分散の場合:平方和/(データ数-1)なので16/4=4 になります。 -102,-101,100,101,102のデータの場合,平均は20になります。まず,この点を質問者の方が間違っていると思います(平均が100ならば平方和は10になります)。 で,これらのデータの平方和は (-102-20)2乗+(-101-20)2乗+(100-20)2乗+(101-20)2乗+(102-20)2乗 となり,これを計算すると49210になります。 -53,50,50,50,53のデータの場合も同様です。平均は30ですから,計算すると8618になります。質問者の方は平均を50と思って計算されているのだと思います。 最後に繰り返しますが,質問者の方の計算は平方和を求めているものですから,その点も誤解されていると思います。

a-Z09
質問者

お礼

Hurryponさま 大変詳しい解説ありがとうございました!! 平均を間違っていたのですね。中央値と平均値がごちゃごちゃになっていました。。 自分の解いていた問題は、いくつかのデータがあげられていてその中で、分散の一番大きいものと2番目に大きいものを選べというようなものだったのですが、データの数がどれも同じなので偏差平方和を比較しておりました。説明不足ですいません。 ずっと分からなくて困っていたので、助かりました!! 本当にありがとうございました!!

関連するQ&A

  • この不偏分散の求め方を教えてください。

    この不偏分散の求め方を教えてください。 答えは0.812になります。 解説では、不偏分散Vyは元の直径xを10倍で変換していることと、分散は元の直径xの2乗により算出するので、変換後の分散値は元の分散値の10^2倍の値を示していることがわかる。と書いてあるのですがいまいち意味が分かりません、教えていただけないでしょうか?

  • 統計学 分散について

    今ネットのHPでハンバーガー統計学とういところで統計学を覚えようとしています。 このHPで、 データのばらつきを数値で表す という、項目があります。  ここでは、分散の式を分かりやすく説明しているのですが、 HPの説明では・・・ 平均値からのずれ(つまり個々のデータと平均値との差)を足せば、ばらつきの数値になるのではないかと考えます。つまり、 ばらつき案1=(データ-平均値)の総和 ということです。しかし、これですと、データが小さいときに(データ-平均値)はマイナスになるので、総和を求めてもゼロになってしまいます。そこで、2乗することでマイナスをプラスにします。次の案はこうなります。 ばらつき案2=((データ-平均値)の2乗)の総和 しかし、まだ問題があります。この式ですと、データの個数が大きくなるにつれてばらつきが大きくなってしまいます。個数の大小にかかわらず、ばらつきを求めたいのです。そこで、総和をデータの個数で割ることにします。式は、 ばらつき案3=((データ-平均値)の2乗)の総和÷個数 これで良さそうです。この「ばらつき3」のことを「分散」と呼びます。もう一度式を書いておきましょう。 分散=((データ-平均値)の2乗)の総和÷個数 分散は、データが平均値を中心にして、どのくらいばらついているのかを示した数値です。 と、あります。  分散は平均からのずれを出すのであれば、 分散=((データ-平均値)の2乗)の平方根の総和÷個数 が正しいような気がします。 例えば平均から+5cmの2乗は25なのに、 +0.3cmの場合2乗は0.09になってしまい、 大きくぶれたものはより大きく、 小さくぶれたものはより小さくなってしまいます。 ばらつき案1で データから平均値を引いた答えに+と-があり、 総和を求めると、この+と-のブレがお互いに干渉しあって 数値を0に近くする為、 一度2乗して+と-を無くしたのに、 何故その後、そのままなのかよく分かりません。  2乗して+と-を外したなら、次に平方根を出し数値を実態に近い値にすればいいのにと思ってしまいます。  言ってる事がいまいち伝わらないかと思いますが・・・  どなたか解説お願いします。  分散とはそういう計算式なんだ!と、 言ってしまえばそれまでですが、 どうしても納得がいきません・・・

  • 分散(2乗平均)を求めるとき

    データがあって、その分散を求めようとしています。分散=(2乗平均-平均の2乗)で計算を試みているのですが、困った点がありまして質問させていただきました。もしお時間よろしければお願いいたします。 ・分散を求めるとき、「各データを2乗したものの和÷データの個数(2乗平均)」と「各データの和÷データの個数→これを2乗(平均の2乗)」において、「データ」が無数(データの和が無限級数のようになってる)のとき計算はどうなるのでしょうか? いい例えでないですが、例えばデータが、実力伯仲の3人の力士が巴戦(先に連勝した者の勝ちで、誰かが連勝するまで延々と勝負は続く)などで複数人から一人の勝者を決まるまでの回数など。このように決まらない場合は回数は延々と増えていくような。指針、アドバイスなどあればお教えくださいm(_ _)m ・あと、上に関連する計算の一部で自分なりに出した式なのですが、 「n^2・x^n-2(ただしx^∞→0)」のn=1から∞までの和というのは求められるでしょうか?求められないでしょうか?(2つもスイマセン)

  • 分散について

    X(1,2,3,4,5) Y(1,2,6,10,1) のとき分散の値を求めるのですが、公式は分かっているのですがとき方が分かりません。また標準偏差は分散の答えにただルートをつけるだけで良いのでしょうか。

  • マイナスを含むデータの平均と分散

    例えば, {-0.0027,0.0005,-0.0006,0.0003,-0.0002,-0.0002,0.0016,-0.0017,-0.0003,-0.0004,-0.0005,-0.0007} のようなマイナスを含む誤差データがあるとします. この誤差データの平均と分散を求めたいとしますと,単純に足してデータ数で割っただけだとマイナスでキャンセルされてしまって平均とは呼べないと思います. そこで平均二乗誤差を使用してデータの平均を求めた場合,分散を計算するときに使用する平均値のデータとしては,平均二乗誤差を使用しても良いのでしょうか? このようなデータ処理の仕方について,わかりやすい本がありましたらついでに教えていただけると助かります.

  • 分散って…

    高一です。 授業でやったことは覚えているのですが、教科書に載ってないし、ノートも見つかりません。 分散=平均の二乗-二乗の平均 なのか、 分散=二乗の平均-平均の二乗 なのか。 どっちだったか分かる人、解答お願いします。

  • 平均と分散

    ある集合体Xの平均をα、分散をβとします。 Y=X+4 Z=3X  W=3X+4 V=W+Y (=4X+8) それぞれの平均と分散を求めなさい。という問題で Yの平均はα、分散はβ Zの平均は3α、分散は9β Wの平均は3α+4、分散は9β Vの平均は4α+8、分散は16β となるようなんです。 平均値の方は感覚で理解出来たのですが、分散の値が どうしてこうなるかわかりません。 分散に関して γの二乗=(aγ)の二乗という公式があるようなのですが どうしてこれが成り立つのかわかりません。 出来れば、平均値の方もうまく言葉で説明して 頂けると嬉しいです。 早く回答頂けるとほんとに助かります!

  • 統計ー分散;σの2乗ー計算

    X=1,2,3,4,5 に対して確率関数p(x)が各1/15、2/15、3/15、4/15、5/15 のとき分散:σの2乗を計算したら 平均は3/15=1/5だから σ^2=E(x^2)-(平均)^2 からσ^2=15-1/25=14.96 となりましたがあっているでしょうか。 分散が15だといわれてもイメージがわかないのですが。 (先に分散が直線にのる例なので、このような規則的な場合の分散は、計算する前に慣れていれば15くらいというのがでてきそうにおもうのですが。誰か納得いく説明をお願いいたします。

  • 統計学の不偏分散のN-1について

    統計学の授業で、 (不偏)分散=(Σ(中央値との差)^2)/N-1 と習いました。そして、教授が、なぜ、N-1で割るかについて、 「たとえば1と-1が半々の確率で出る時を考えると、 A 1→1 25% B 1→-1 25% C -1→1 25% D -1→-1 25% の場合があり、それぞれの分散が(Nで割る分散で計算すると) A:0 B:1 C:1 D:0 となるから、平均の分散は0.5になる。しかし、真の値(中央値からの平均距離の二乗)は1のはずだから、分母のNを小さくせねばならない。」 という説明をされました。 しかし、この説明では、たまたま、この一つの具体的な現象において、N-1で割るほうがよりよいと言っているだけであって、他の場合すべてにおいてもより良いことの証明になっていないと思いました。 分散の計算のときにN-1で割ったほうがよいというのは経験則なのでしょうか?それともちゃんと"証明"されていることなのでしょうか? もし"証明"されているならその証明を教えてください。

  • ヒストグラムの平均と分散について

    以下の問題の求め方がよく分かりません。どなたか助けてください・・・ (問)ある画像の平均値、分散を求めなさい。必ず具体的な式・求め方等も書き添えること。  ヒストグラムは、1の頻度が2、 2の頻度が5、3の頻度が5、4の頻度が7、5の頻度が1 (答)平均値:3、分散:1.2 はどういう計算で求められるのだろうか? よろしくお願いします。