• 締切済み

統計学の初歩的な質問です

統計学の初歩的な問題に関する質問です。 とあるデータ系列があり、その平均値を出すと割り切れないので小数点第三位を四捨五入します。 そこで偏差を求めるとその総和が0になりませんが、このまま変動の値を求めてもいいのでしょうか? 使っているテキストには「偏差の総和は常に0である」と書いてありますが、四捨五入すればどうしても0にはならないと思うのですが…。 どなたか教えて下さると助かります;;

みんなの回答

回答No.3

分散とるときに気をつけましょう。 分散の計算は σ^2=(Σ(Xi-m)^2)/n         (1) =(ΣXi^2)/n - m^2       (2) =(nΣXi^2 - (ΣXi)^2)/n^2   (3) と3種類くらいに変形できます。ただし(1)=(2)はmが真の平均値の場合成り立ちます。 (3)は平均値を直接使わないで計算式にもぐりこましてます。 mを四捨五入なりして丸めたときには、(1)または(3)を使い。(2)は使わないようにしたほうが良いです。 例 データ3点 1001,1002,1005 平均 m=1002.666・・・  これを丸めて m'=1002.7 とすると (1)の計算σ^2=2.89 (2)の計算σ^2=-63.96 マイナスででます (3)の計算σ^2=2.88・・・

  • picknic
  • ベストアンサー率25% (33/132)
回答No.2

「偏差の総和は常に0である」 これはあなたが厳密に計算した場合です。 四捨五入しましたよね? その時点で厳密な計算を放棄しているじゃないですか。 つまり計算誤差を受け入れたのです。 ゼロにならないと思う・・・というのは ゼロとその計算結果の差が計算誤差だっていうことです。

  • Willyt
  • ベストアンサー率25% (2858/11131)
回答No.1

総和がゼロにならない分は誤差です。通常の統計量は2桁の精度があればじゅうぶんでしょう。だから3桁目を四捨五入したのでしょう。ちなみに四捨五入すればどうしてもゼロにならないということはありませんよ。運がよければゼロになることもあります。 また、偏差というのは常にゼロになりますから、こんなものは計算しても何にもなりません。通常は偏差の二乗和を求め、その平方根を標準偏差と呼んでおり、これは統計では平均値とともに最も重要な意味を持つ統計量です。

m_yu_na
質問者

補足

>総和がゼロにならない分は誤差です。 >また、偏差というのは常にゼロになりますから ここは矛盾してることにはならないんですか…? つまり偏差の総和がゼロにならなくても、偏差の二乗和と標準偏差を求めてもいいってことでしょうか…。

関連するQ&A

  • 有効数字の考え

    とある物の太さ(場所によっては凸凹あり)をコンピュータが測定しました。 521.967 522.962 520.973 523.954 519.432 この場合、一の位が揺らいでいると見なすことができ、有効数字は3桁(小数第一を四捨五入)として、 522 523 521 524 519 と改め、平均を求めると、(522+523+521+524+519)/5=2609/5=521.8 有効数字は3桁としたので、小数第一を四捨五入して、平均=522としました。 一方、(不偏)分散は3.7と算出し、偏差=1.923538と求めます。 前述の通り、一の位までが意味があるので、この偏差も小数第一を四捨五入して、偏差=2としました。 以上より、この物の太さは522±2と求めました。 あるいは、生のデータでまずはそのまま処理し、平均=521.8576、分散=3.073153、偏差=1.753041 と求め、偏差を見ると、最上位は一の位であることが分かります。 従って、偏差の小数第一以下は意味が無く、小数第一を四捨五入して、偏差=2としました。 偏差は一の位のみが残ったので、平均値521.8576の一の位までが意味があり、小数第一を四捨五入して、522としました。 以上より、この物の太さは522±2と求めました。 結果的には双方の考えでも同じ結論、522±2となりましたが、 考えとしてはどちらが正しいのでしょうか?あるいは双方の考えに間違いがあるかもしれませんが。

  • 統計値に関する質問

    統計学に関する質問です。 平均が7.0、変動が6.8~7.2の間にある30個のデータがあります。新しく7.1という値が得られたとして、この値が「今までの傾向から外れ値でない」ことを示すのに適した統計指標はありますでしょうか。 宜しくお願い致します。

  • 四捨五入について

    とあるテキストに、3.848を四捨五入して小数点第一位まで求めると、3.8になる、と書いてあります。しかし、3.848の小数点第三位の8を四捨五入すると、3.85になり、これを更に四捨五入すると、3.9になるように思うのですが、いかがでしょうか?

  • 小数点の四捨五入で分からないことがあります

    例えば、0.230978という値を小数点第4位を四捨五入したら、答えは0.231ですか?それとも0.2310が答えですか? また、0.8という値を小数点第1位を四捨五入したら、答えは1.0ですか?それとも1ですか? よろしくお願いします。

  • C言語の初歩的な質問です。

    例えば、 ans = 23 / 31 というように代入したいのですが、この計算を10小数点以下10行で後は切り捨て(もしくは四捨五入)を行い、その値をansに代入するというようにするにはどうすればいいんでしょうか? pirntf("%.10f", 23.0 / 31.0); じゃだめなんです。 結構急いでいます。よろしくお願いします。

  • 数列の質問です。

    下記のような数列があります。 15, 17, 19, 22, 25, 28, 32, 36, 41.... この数列では 第2項 = (34 * 初項 / 30)を小数点以下四捨五入した数 第3項 = (34 * 第2項 / 30)を小数点以下四捨五入した数 第4項 = (34 * 第3項 / 30)を小数点以下四捨五入した数 というような法則があります。 ※ちなみに、プログラム(objective-c)にて小数点以下の四捨五入はやってくれます。 このとき項数nを用いて、各項の値を求めたいのですが、どのように求めれば良いでしょうか? 文章が拙くて申し訳御座いませんが、この数列のうちnを用いた上昇率が知りたいです。 宜しくお願い致します。

  • 割合(%)を出すとき、小数第何位まで計算すればいいか?また四捨五入について質問

    割合の計算で、86÷1337=0.0643・・・ ですが、小数点以下第二位まで四捨五入する場合、小数第四位まで求めますが、何故第四位まで求めるのでしょうか?第五位以上は求めなくて良いのでしょうか? また四捨五入についての質問なのですが、 40.45を小数点以下第一位まで四捨五入すると、40になりますが、このときに以下の疑問点があります。 四捨五入の過程で、小数第一位は4→5になりますが、この5を四捨五入すると、繰り上がると思うのですがなぜか、5が消えてしまいます。 それはなぜかと云えば、40の0は一の位で5は小数第一位だから、0のほうが位が大きい繰り上がらないと云う認識で大丈夫でしょうか?

  • 五捨五入(偶捨奇入)の数学的意義と四捨五入との関係

    四捨五入は、端数が0.5のとき常に増える方向に丸められるため、わずかに正のバイアスがある。そのときは、五捨五入が「望ましい」とされている。 バイアスがないのが特徴である(データがランダムなら)。このため、多数足し合わせても丸め誤差が累積しない。 ということが書かれてあったのですが、データの数学的意味がわかりません。四捨五入と五捨五入のそれぞれにデータによる意味合い(定義ではない)とか役立ち方の違いがあると思うのですが、その違いはどういうことなのでしょうか? また、五捨五入とは、小数点以下の端数処理を行うとき、小数点以下の値が 0.50 ピッタリの時、一番距離の近い偶数に丸めるということなのですが、それをガウス記号(floor関数)で書くとどうなるのでしょうか? ちなみにrの小数点以下の四捨五入は、[r+0.5]

  • 対数の問題 常用対数

    対数の問題で log[10]2=0.3010 log[10]3=0.4771 とするとき、次の値を求めよ log[3]5 こういう問題で割り算しますよね 小数点以下4桁出しましたが、小数点以下5桁目は切り捨てるんですか?四捨五入するんですか? 小数点以下5桁目の切り捨てか四捨五入ってどっちでもよくはないんですか? 今までは全部5桁目がたまたま0~4になったから四捨五入なんか気にしませんでしたが、先生には特に何も言われなかったですし けど教科書は 対数の値は一般には無理数で無限小数で表される。対数表には小数第5位を四捨五入した値が記載されている と書いてあります。

  • 四捨五入について質問があります

    割合0.5135を小数点以下第一位に四捨五入すると、51%になるみたいなのですが、この時小数第一位である5を四捨五入すると思うのですが、何故51%になるのでしょうか?5は繰り上がって一の位に行くと思うのですが、、