• ベストアンサー

ゼロ付近の値の扱い(平均、統計学)

ある測定を3回行い、その値の平均を求めるとします。 このときに、非常にわずかな量を測定するため、ゼロ、もしくはマイナスの値が得られることもあります。 このマイナスは平均に含めるべきでしょうか? ある人に相談したところ、「存在量がマイナスは存在し得ない」という主張で、マイナスは平均に含めるべきではない といわれましたが、測定誤差としてマイナスの値がありうる場合には平均に含めるべきだと思うのですが。 たとえば、一回の測定で測定による真の測定値からのばらつきが±0.1mgあるとすると、-0.05mgという測定結果は「ありうる値」だと思うのです。つまり平均に含めるべきだと思うのです。 (これが測定のばらつきを超えた0.2mgといった値なら、この値は捨てますが。) そうでなければ、含有量がゼロのものを100回測定したときに、マイナスの値をすべて捨ててしまうと、その平均はおそらく+0.05mg(細かい値は抜きにして、ゼロでないプラスの値という意味です)になり、マイナスを含めれば0.00mgになると考えられます。 「ありうるマイナスの値は平均に含めるべきである」 という結論に対してコメントをお願いします。 (ありうる、ありえないの境がどこかの議論は今回は省略させてください。)

質問者が選んだベストアンサー

  • ベストアンサー
回答No.2

測定の基本原理は α1=X+e1 (α1は測定値,Xは真の値(未知),e1は測定誤差)ですね。この場合の前提は測定対象が質量であれば、X>=0,e1=全ての値(通常はe1はXより微少)です。もし、測定対象が、質量でなければ(温度など)α1<0でも、全く問題はありませんが、マイナスの質量というものを考えることができるでしょうか。

inorganicchemist
質問者

補足

アドバイスありがとうございます。 今の例ですと、 X :質量なので X>=0 α1 :e1がすべての値をとりうるので、原理的にはすべての値が可能 と理解しています。

その他の回答 (4)

回答No.5

No.2です。 >真の値がゼロであるものを測って、ゼロという測定結果が得られる平均処理をしたい ということです これはNo.4さんが言っているように、測定器の誤差を測定していることになりますね。 3回測定を1回のサンプリングとすれば、当然マイナスの平均値が出てきても、当然のことですね。平均値がプラスになるように、測定器を調整すべきです。(この場合は信頼区間をかなり小さくする必要があります) >α1 :e1がすべての値をとりうるので、原理的にはすべての値が可能 あくまで原理であって、e1>=Xでは測定していることにはなりませんよね。

  • takamm
  • ベストアンサー率40% (4/10)
回答No.4

 結論から言えば含めるべきだと思います。正しく測定した場合、誤差は真の値から±均等にばらつきが生じます。100回も繰り返して測定しなおしたのは、±の誤差で誤差を相殺しようとしたのではないでしょうか?質量を測るいうより、誤差を測ってるみたいなものでしょう。(これはいいすぎですが。)逆にいうと、+であろうが-であろうが、他の測定値と比べて大きく外れているものは除いたほうがいいでしょう。  さらにいえば、平均が負の数になるようであれば、再実験してはどうでしょうか?というか、実験したその場で平均を計算して-であれば+になるまで実験を続けたほうがよかったでしょう。質量が負の数となるのは、常識的に考えてありえません。  どうしても負になるようであれば、それは誤差に偏りがあるということです。誤差は真の値を中心に±均等にばらつくものですから、真の値が0であろうと、測定値の平均が負の数にしかならないというのはおかしいです。実験方法、測定機械、実験手順など再検討してみてはいかがでしょうか?

inorganicchemist
質問者

補足

No3の方への細くと共通することもありますので、こちらにまとめさせていただきます。 >誤差を測ってるみたい まさしくそのとおりです。もう少しいえば、真の値がゼロであるものを測って、ゼロという測定結果が得られる平均処理をしたい ということです。 ですので、平均した後の値がマイナスになるのはおかしいというのは十分理解できています。

  • BLUEPIXY
  • ベストアンサー率50% (3003/5914)
回答No.3

素人ですが・ 誤差の値は真値の前後(+-)にでるのが普通だと思います。 この場合、誤差の均等なばらつきの中に真値があると思われるワケですが、 仮にマイナスの値を捨ててしまうというような処理をした場合には、 ばらつきの片側を捨ててしまうことによって変移する(真値を含まないようになってしまう)のではないかと思います。 しかしながら、重さの場合、マイナスの重さというものが存在しないわけですから、マイナスの値というは正確な値と言うより、機械の誤動作と考えることができると思います。値を誤動作と捉えた場合そのような値は含めるべきではないと思います。 例えば、その平均の結果がたまたま、マイナスになってしまったとしたらそれは有意な値と言えるでしょうか?

  • ken_pe66
  • ベストアンサー率20% (53/264)
回答No.1

統計学なのか?計測関連科目(建築土木系)かによって違うとおもいます。 数学は最初の定義ありきなので、定義(最初に決めたルール)にーをふくめなければー無しで、ありならありで つまり文面を読むとーありでいいとおもうよ。 土木や建築だと、、ものありきなので公理的な部分で 慣例みたいなのがあるかもねと思うよ

関連するQ&A

  • 相対誤差の真の値について

    分子量を求める実験をしたのですが 相対誤差を求めるのに、真の値を 文献値の分子量とおくのか 実験の測定値の平均値をおくのかで 迷っています。 ご教示いただければ幸いです。

  • 統計学の正規分布、信頼区間について質問です。

    問1、ある錠剤のA成分の含有量を9回測定して標本平均6.85mg、標本標準偏差0.006mgを得た。測定値は正規分布に従うと仮定して、A成分の含有量の真の平均を95%信頼区間で推定せよ。 問2、同年齢の身長は正規分布に従っていると考えられる。15歳の男子10人を無作為抽出して測定したところ169,155,163,164,151,162,160,150,156,150の結果を得た。15歳の男子の平均身長および分散を95%信頼区間で推定せよ。 この二つの問題がいくら考えてもわからないのでわかる方居ましたら解答・解説をご教示願います。よろしくお願いします。

  • 統計学の二乗平均がわからない

    統計学を本当に初めてやり始めました。で、いきなり、二乗平均で分からなくなりました。 二乗平均はいくつかの偏差の大きさの平均を求めるために、偏差を2乗してプラスマイナスが打ち消しあわないようにしたところまでわかりました。しかし例えば、 +1、-4、-2、+3、+2という5つの偏差のばらつきの平均を求めるとき、上のような理屈なら、( |+1|+|-4|+|-2|+|+3|+|+2|)/5 =2.4と二乗平均は同じと思ったんですが、二乗平均を求めると約2.61になり、値が違いました。なぜでしょうか??二乗平均は、 “いくつかの偏差の大きさの平均を求めるために、偏差を2乗してプラスマイナスが打ち消しあわないようにした”以外になにかしたのでしょうか??教えてください…

  • 平均値の誤差の求め方は?

    平均値の誤差を見積もりたい考えています。 ただ、抽象的な話では私には難しいので具体例をあげて 質問させてください。 ========== 日本国民男性20歳の平均身長を求めたい。 条件にある人を無作為に1000人集めて身長を測定すると、 平均=170cmで、分散=10cmとなった。 日本国民男性20歳の人は100万人おり、 身長の測定誤差は、0.5cmと仮定してください。 ========== 「日本国民男性20歳の平均身長」は、170cmに であると言ってよいと思いますが、この平均身長の誤差は どのように見積もればよいでしょうか? ここでいう誤差は、10万人の人、全員を集めて、 (測定誤差がなく)測定した身長の平均を真の値として、 そのずれを見積もりたいと考えています。 例えば、信頼度99%で、平均身長は170cm±Xcmと いうときの、Xの値をどのように計算すればよいのでしょうか? ちょっとネットで調べて自分なりには以下の計算式になるのでは ないかと考えています。 X=2.58 x 0.5cm / sqrt(1000) = 0.04 cm ただ、これが正しいか少々不安です。 理由は、Xが測定誤差(0.5cm)より小さくなってしまうことと 全母集団の数値(10万)を用いていない点にあります。

  • データの整理と平均値のまとめ方

    よろしくお願いします。 現在、実験を行っており、データの整理をしているのですが、まとめ方で困っているので質問させていただきました。 9000ほどの母集団から100個取り出し、帯電量測定をします。正規分布であることを確認し、同じ実験を3回繰り返します。 このような実験を数種類行い、どのように変化したか(平均帯電量やバラつき具合など)を報告しようと思っています。 ところが、この実験はばらつきが大きく、サンプリングの計算をすると100個では平均の誤差(平均と標本平均の差)が大きくなっていしまいます。 100個以上の測定では大幅な時間がかかり実験としても成り立たず、効率が悪くなるため、また、他の数種類の実験結果との比較のために同じ100個で統一するために、100個で行いました。(100個でも誤差が大きくなる、というだけの話なので問題はないと思います) ですが、同じ実験を3回行った結果について疑問点が出てきました。 実験から得られた標本平均Xbarと標準偏差σを、 Xbar-k*√(σ^2*(N-n)/n/(N-1)) < μ < Xbar+k*√(σ^2*(N-n)/n/(N-1)) (信頼係数K、母集団N、標本数n) の式に用いて平均の範囲を出せると思います。(誤差が大きいということはこの範囲が大きくなるということですよね) 同じ実験を行って誤差の違い(平均μから近いか遠いか)はあれど、平均μの値はかならずどの実験でも範囲内に入るはずですよね。 ですが、3回行った実験のうち、範囲が重ならない結果(重複する範囲がない)が出てきました。3回すべて重ならなかったり、2個だけ重なって残り1個は重ならなかったりしました。重なれば少なくともその範囲に平均μがあると思っているのですが・・・ 最初はこの3回行った同じ実験でそれぞれ得られた平均の範囲から平均の範囲をある程度決められるかなと思っていました。(誤差が大きくても) 原因として何が考えられるか考えたのですが、 1. 3回の実験のうち、測定中に触ったり何かしてちゃんと測定を行えなかったなど何らかの影響でちゃんとしたデータではない実験があるため。 2. 実は同一条件ではなかった(異なる実験扱いで比較できない) どのようにデータをまとめていいか困っています。すべてのデータを載せるのも要領の関係で難しいので、まとめたいと思うのですが・・・ 自分の統計の勉強不足なのでしょうか。 それか、Xbar±3*σで範囲を決めようかとも迷っています。 何か「ここは間違ってるよ」とか「こういう風にしたら?」などありましたら書き込んでいただけないでしょうか? わかりづらい質問でお手数おかけしますが、ご教授いただけますでしょうか。 よろしくお願いします。

  • 統計学の基礎?

    前提 日本人の身長の真の平均値を知るためには、日本人全員の身長を測定しなければならないが、それはおそらく不可能である。 そこで、一部の人(標本)の身長を測定し、その結果から推測したい。 標本(n)の身長もばらつき(標本分散:v)を持つし、日本人全体(母集団:N)の身長もばらつき(母分散:σ^2)を持つが、これらと真実の値(母平均:μ)や標本平均(m)との関係はどうなっているだろうか? ただし、各人の測定結果(身長)はX1,X2,X3・・・XNとあらわす。 問 1)日本人の平均身長= 2)日本人の平均身長の標準偏差= 3)標本の平均身長= 4)標本の平均身長= 5)標本の平均身長の分散から推定される日本人の平均身長の標準偏差= 6)標準誤差はσ/√nで与えられるが、これを標本分散を用いて表すと次のようになる。  標準誤差= 7)標準誤差を用いると、真実の平均値(母平均)があるであろう範囲(信頼区間)を特定の有意水準で求めることができる。有意水準5%のときの範囲(95%信頼区間)を表す式を示せ。 8)160、165,170,175,180というデータの平均の95%信頼区間を求めよ また、145,165,170,175,195というデータの平均の95%信頼区間と比較せよ。 以上の問です。 7と8以外は、数値を聞いているわけではなく、求める式を問うていることはなんとなくわかるのですが、ちょっとパソコンを利用して調べて回ったところ、どれが必要な情報かさえわからないレベルで、頭が痛くなってしまいました。 よろしければ問いの回答、その回答に至る考え方の流れなどを、簡単なものでも構わないのでご教授願えないでしょうか?

  • 蛍光X線測定におけるバラツキ

    蛍光X線測定におけるバラツキ はじめまして、蛍光X線測定器の扱いでわからないことがあり質問させていただきます。 内容は、蛍光X線測定器の検量線法にて試料内のSiO2含有量を調べようと含有量1%・2%・3%と三点の試料を作成し、検量線を引きました、検量線の相関係数は0.97~0.98程度となっております。 この検量線を用い、未知試料(予想では2%含有)を測定し、規定の含有量であるかどうかの判断を行たいのですが、同じ未知試料を使いサンプルを作成しても酷い時で0.05%以上の誤差が出てしまいます。 他にもサンプルを作る人が違うだけでも同じぐらいのバラツキが発生してしまい、上記二件のバラツキが悪いほうに重なると同じ試料を測定して0.1%近い誤差が発生します。 測定器メーカー様としての回答は元素が軽いがためのバラツキは発生しうるといった内容の回答でした。 このバラツキ問題はやはり相関係数が低いのが原因なのでしょうか。 どうにかしてサンプル作成によるバラツキと作業者によるバラツキを合わせて0.05%以下に抑えたいのですがよい手段はないでしょうか。 補足ですが、検量線試料・未知試料ともに粉体のため加圧をしてペレット状にして評価をしております。 どうか、アドバイスお願いいたします。

  • ある品物を測定したところ、43、3kgという値を得た。真の値xの範囲を

    ある品物を測定したところ、43、3kgという値を得た。真の値xの範囲を不等式で表し、この測定値の誤差の限界を求めたいのですが、どのように解いたらよいのでしょうか。

  • 統計学問題【2】

    【2】統計学の問題の解答をお願いします。大学の講義で統計学を学んでいます。大体の内容は、理解出来たのですが、一部分だけわからない箇所がありました。お願いします。 2つの銘柄のタバコAとBのニコチン含有量について調べた。銘柄Aのタバコ10本について平均27.0mg、標準偏差1.7mgであり、銘柄Bのタバコ7本については平均29.3mg、標準偏差1.9mgであった。この2つの銘柄のタバコのニコチン含有量に差があるか。有意水準5%で答えよ。 もう1つ、同じような質問をお願いします。解答いただけたら幸いです。

  • 統計 ばらつきの大きなデータを平均化して扱う手法

    ご存知の方が居ましたら教えて下さい。 (伝わりにくくて申し訳ありません、エクセルでグラフにする必要があります。お手数をおかけ致しますがよろしくお願いします) 以下のようなばらついたデータがあります。 3.27 2.80 3.30 3.67 3.17 3.10 3.10 3.27 4.00 3.90 3.87 3.60 3.77 3.80 3.67 4.00 4.07 3.90 3.27 3.50 3.60 2.50 2.80 2.40 2.37 3.30 2.60 2.90 2.60 2.10 2.07 左上から1,2,3…とします。 これをグラフにするとひとつひとつがばらついて傾向がわかりにくいです。 ちなみに16番目と26番目の時にとある操作を加えた事の効果を見たいです。 そこで、前後あわせて5つのデータ平均でグラフにするとばらつきが緩和されて傾向が見て取れます。(3.27+2.8+3.3+3.67+3.17)/5=3.24の次を(2.8+3.3+3.67+3.17+3.1)/5=3.21としていきます。 3.24 3.21 3.27 3.26 3.33 3.47 3.63 3.73 3.83 3.79 3.74 3.77 3.86 3.89 3.78 3.75 3.67 3.35 3.13 2.96 2.73 2.67 2.69 2.71 2.75 2.70 2.45 これをグラフにすると16番目と26番目付近でグラフが見た目で大きく変化しているのが分かります。このように一回一回の測定では誤差が大きいが前後数日分を平均し、平均している日をずらして評価する方法に名前はついているのでしょうか?このようなデータの扱い方は統計学等で正式に認められている手法なのでしょうか?教えて下さい。 よろしくお願い致します。