• ベストアンサー
  • すぐに回答を!

マイナスを含むデータの平均と分散

例えば, {-0.0027,0.0005,-0.0006,0.0003,-0.0002,-0.0002,0.0016,-0.0017,-0.0003,-0.0004,-0.0005,-0.0007} のようなマイナスを含む誤差データがあるとします. この誤差データの平均と分散を求めたいとしますと,単純に足してデータ数で割っただけだとマイナスでキャンセルされてしまって平均とは呼べないと思います. そこで平均二乗誤差を使用してデータの平均を求めた場合,分散を計算するときに使用する平均値のデータとしては,平均二乗誤差を使用しても良いのでしょうか? このようなデータ処理の仕方について,わかりやすい本がありましたらついでに教えていただけると助かります.

共感・応援の気持ちを伝えよう!

質問者が選んだベストアンサー

  • ベストアンサー
  • 回答No.1
  • l4330
  • ベストアンサー率22% (4373/19602)

  データの性格によって計算の方法を考えるべきでしょ。 例えば棒の直径を測って、基準の10mmからの差をデーターとした場合。 0.02 -0.01 0.01 0.01 -0.01 こんなデーターの場合は単純に合計し 0.02+-0.01+0.01+0.01+-0.01=0.02、平均は0.02/5=0.004 基準値の10に加算して、5本の棒の直径の平均は10.004mm 子の様にマイナスを含むデーターを単純に平均する時もあります。  

共感・感謝の気持ちを伝えよう!

質問者からのお礼

早速の回答ありがとうございます. データの性格としては,まさにl4330さんが例に出してくれたものと同じです. 例のように単純に合計して平均を出した場合,分散の計算方法は その算出された平均10.004mmを用いて,誤差データではなく, 元の実測値データを用いて分散を計算するといった方法でしょうか?

その他の回答 (1)

  • 回答No.2
  • l4330
  • ベストアンサー率22% (4373/19602)

  分散は偏差平方和 #1の例なら (0.004-0.02)^2 (0.004--0.01)^2 (0.004-0.01)^2 (0.004-0.01)^2 (0.004--0.01)^2 これの合計ですよネ 何か問題でも?  

共感・感謝の気持ちを伝えよう!

質問者からのお礼

確かにそうですね... つまりマイナスのデータでも通常通り 平均・分散を計算して問題ないということですね. ありがとうございました!!

関連するQ&A

  • 分散(2乗平均)を求めるとき

    データがあって、その分散を求めようとしています。分散=(2乗平均-平均の2乗)で計算を試みているのですが、困った点がありまして質問させていただきました。もしお時間よろしければお願いいたします。 ・分散を求めるとき、「各データを2乗したものの和÷データの個数(2乗平均)」と「各データの和÷データの個数→これを2乗(平均の2乗)」において、「データ」が無数(データの和が無限級数のようになってる)のとき計算はどうなるのでしょうか? いい例えでないですが、例えばデータが、実力伯仲の3人の力士が巴戦(先に連勝した者の勝ちで、誰かが連勝するまで延々と勝負は続く)などで複数人から一人の勝者を決まるまでの回数など。このように決まらない場合は回数は延々と増えていくような。指針、アドバイスなどあればお教えくださいm(_ _)m ・あと、上に関連する計算の一部で自分なりに出した式なのですが、 「n^2・x^n-2(ただしx^∞→0)」のn=1から∞までの和というのは求められるでしょうか?求められないでしょうか?(2つもスイマセン)

  • 統計学 分散について

    今ネットのHPでハンバーガー統計学とういところで統計学を覚えようとしています。 このHPで、 データのばらつきを数値で表す という、項目があります。  ここでは、分散の式を分かりやすく説明しているのですが、 HPの説明では・・・ 平均値からのずれ(つまり個々のデータと平均値との差)を足せば、ばらつきの数値になるのではないかと考えます。つまり、 ばらつき案1=(データ-平均値)の総和 ということです。しかし、これですと、データが小さいときに(データ-平均値)はマイナスになるので、総和を求めてもゼロになってしまいます。そこで、2乗することでマイナスをプラスにします。次の案はこうなります。 ばらつき案2=((データ-平均値)の2乗)の総和 しかし、まだ問題があります。この式ですと、データの個数が大きくなるにつれてばらつきが大きくなってしまいます。個数の大小にかかわらず、ばらつきを求めたいのです。そこで、総和をデータの個数で割ることにします。式は、 ばらつき案3=((データ-平均値)の2乗)の総和÷個数 これで良さそうです。この「ばらつき3」のことを「分散」と呼びます。もう一度式を書いておきましょう。 分散=((データ-平均値)の2乗)の総和÷個数 分散は、データが平均値を中心にして、どのくらいばらついているのかを示した数値です。 と、あります。  分散は平均からのずれを出すのであれば、 分散=((データ-平均値)の2乗)の平方根の総和÷個数 が正しいような気がします。 例えば平均から+5cmの2乗は25なのに、 +0.3cmの場合2乗は0.09になってしまい、 大きくぶれたものはより大きく、 小さくぶれたものはより小さくなってしまいます。 ばらつき案1で データから平均値を引いた答えに+と-があり、 総和を求めると、この+と-のブレがお互いに干渉しあって 数値を0に近くする為、 一度2乗して+と-を無くしたのに、 何故その後、そのままなのかよく分かりません。  2乗して+と-を外したなら、次に平方根を出し数値を実態に近い値にすればいいのにと思ってしまいます。  言ってる事がいまいち伝わらないかと思いますが・・・  どなたか解説お願いします。  分散とはそういう計算式なんだ!と、 言ってしまえばそれまでですが、 どうしても納得がいきません・・・

  • 2種類のデータ数が同じデータについてら平均値と分散

    2種類のデータ数が同じデータについてら平均値と分散を計算したら、同じ値でした。これらのデータはヒストグラムも同じ形状をしていると考えて良い。 ○か×か。

  • 分散分析の誤差について

    現在,心理学の統計で分散分析を行っています。 1要因に対応が無く,1要因に対応がある2要因の混合分散分析を行っています。(データ数が異なる) 現在使用しているソフトのバージョンでは混合分散分析ができないため手計算を行っています。 そこで問題が発生したのですが,参考書(心理学のためのデータ解析テクニカルブック)を見てやっているのですが, 平方和(SS)の誤差がどうしてもマイナスの値になってしまいます。 主効果の誤差は大丈夫なのですが,交互作用の誤差ででます。 良いのでしょうか? 以前,習った時にマイナスは出ないので出た場合には計算間違いだよ!と言われた気がして前に進めません。 すみませんが,よろしくお願いします。

  • 分散の求め方について

    分散の計算の仕方がどうしてもわかりません。 -2,-2,0,2,2 この場合は(-2)二乗+(-2)二乗+2二乗+2二乗で16ということははかるのですが以下の2つの計算の仕方が分からず困っております。 -102,-101,100,101,102 答えには49210と書いてあったのですが自分が計算すると、10になります。 -53,50,50,50,53 こちらも答えには8618と書いてあるのですが、自分が計算すると18になります。 ずっと考えているのですが、どうしてこのような値になるのか全然わからず困っております。。

  • 分散の計算について

    お忙しいところ失礼します。数学か生物かどちらのカテゴリーに当てはまるかわからないのですが、こちらにさせていただきました。 レポートの中で、データの平均と分散を求めなくてはいけないのですが、レポートの書き方のプリントに載っている例題の計算がどうしても合いません。        分散:V=Σ(x-xの平均)の二乗/(n-1) (わかりにくくてすみません) x=244 xの平均=9.8 n=25 という式で、V=238.6/(25-1)=9.9と書いてあるのですが、「(x-xの平均)の二乗」の計算が、どうしても「238.6」になりません。 よろしかったら回答お願いいたします。 ちなみに、これはある生物の巣穴の分布様式を求める式で、xは巣穴の数、nは測定した区画の数です。

  • 分散の平均値

    一回の測定で一定領域のデータが得られ、その平均値と分散を求めます。 5回測定した場合、分散の平均値は単純に足して5で割れば良いのでしょうか? 平均値はバラバラです。 よろしくお願いします。

  • 標本分散の求め方について

    3740、3680、3800、4100、3720 3900、3700、4500、3780、3880 このデータから標本分散はどう求められるのでしょうか? 標本平均は3880です データから標本平均を引いて2乗するという計算を地道にしていかなければいけないのですか? 因みにs^2=(251.0)^2となります

  • 分散の公式で・・

    各データと平均の差を2乗してデータ数で割る という方法と 各データと平均の差を2乗して(データ数-1)で割る という方法の2つがあるのですが、どちらが正しいのでしょうか? 普遍分散と分散と呼ばれているそうですが、何が何だかで・・ 下記に2つ式が載っています。どうかご享受願お願いいたします。 http://ja.wikipedia.org/wiki/%E6%A8%99%E6%BA%96%E5%81%8F%E5%B7%AE

  • 【統計】平均と分散を持つデータの集合を生成

    平均と分散を持つデータの集合があったとして 少ない引数でサンプルデータを作りたいと考えたのですが そうなると 1データの平均 の平均と分散 1データの分散 の平均と分散 を考えれば良いのか?という所で違和感を感じました。 何か根本的に間違っている気がします。 全体の平均と全体の分散のみを使った場合とでは結果が異なるのはわかるのですが。 これって正しいのでしょうか。 何卒よろしくお願いいたします。