• 締切済み

統計 ばらつきの大きなデータを平均化して扱う手法

ご存知の方が居ましたら教えて下さい。 (伝わりにくくて申し訳ありません、エクセルでグラフにする必要があります。お手数をおかけ致しますがよろしくお願いします) 以下のようなばらついたデータがあります。 3.27 2.80 3.30 3.67 3.17 3.10 3.10 3.27 4.00 3.90 3.87 3.60 3.77 3.80 3.67 4.00 4.07 3.90 3.27 3.50 3.60 2.50 2.80 2.40 2.37 3.30 2.60 2.90 2.60 2.10 2.07 左上から1,2,3…とします。 これをグラフにするとひとつひとつがばらついて傾向がわかりにくいです。 ちなみに16番目と26番目の時にとある操作を加えた事の効果を見たいです。 そこで、前後あわせて5つのデータ平均でグラフにするとばらつきが緩和されて傾向が見て取れます。(3.27+2.8+3.3+3.67+3.17)/5=3.24の次を(2.8+3.3+3.67+3.17+3.1)/5=3.21としていきます。 3.24 3.21 3.27 3.26 3.33 3.47 3.63 3.73 3.83 3.79 3.74 3.77 3.86 3.89 3.78 3.75 3.67 3.35 3.13 2.96 2.73 2.67 2.69 2.71 2.75 2.70 2.45 これをグラフにすると16番目と26番目付近でグラフが見た目で大きく変化しているのが分かります。このように一回一回の測定では誤差が大きいが前後数日分を平均し、平均している日をずらして評価する方法に名前はついているのでしょうか?このようなデータの扱い方は統計学等で正式に認められている手法なのでしょうか?教えて下さい。 よろしくお願い致します。

  • KWI
  • お礼率33% (1/3)

みんなの回答

  • usokoku
  • ベストアンサー率29% (744/2561)
回答No.3

移動平均として、経済関係の統計、雑音(ノイズ)の分析、オートサンプリング関係(連続測定機)、等で使われています。 自動制御関係が多いです。 移動平均は、平均期間(5点)の積分値です。ですから、位相が問題になるような場合には使えません(精度が悪くなりますが数値微分(差分)をかける)。 平均を前方にするか、後方にするか、中央にするか、の3種類があります。3点として Xi=((Xi-1)+(Xi)+(Xi+1))/3 Xi-1=((Xi-1)+(Xi)+(Xi+1))/3 Xi+1=((Xi-1)+(Xi)+(Xi+1))/3 の3種類があります。位相の解釈に注意してください。 もし、移動平均がつかえないような相手の場合には。、 X管理図 という手法があります。必要ならばこちらを使ってください。

  • rabbit_cat
  • ベストアンサー率40% (829/2062)
回答No.2

sincフィルタ なんて呼ぶときもあります。 移動平均は、周波数応答がsinc関数になるので。

  • age_momo
  • ベストアンサー率52% (327/622)
回答No.1

>平均している日をずらして評価する方法に名前はついているのでしょうか? 株価の変動などを評価するときに使われる移動平均だと思います。

参考URL:
http://ja.wikipedia.org/wiki/%E7%A7%BB%E5%8B%95%E5%B9%B3%E5%9D%87
KWI
質問者

お礼

早速の回答ありがとうございます。 移動平均をネットで調べてみます。

関連するQ&A

  • データの整理と平均値のまとめ方

    よろしくお願いします。 現在、実験を行っており、データの整理をしているのですが、まとめ方で困っているので質問させていただきました。 9000ほどの母集団から100個取り出し、帯電量測定をします。正規分布であることを確認し、同じ実験を3回繰り返します。 このような実験を数種類行い、どのように変化したか(平均帯電量やバラつき具合など)を報告しようと思っています。 ところが、この実験はばらつきが大きく、サンプリングの計算をすると100個では平均の誤差(平均と標本平均の差)が大きくなっていしまいます。 100個以上の測定では大幅な時間がかかり実験としても成り立たず、効率が悪くなるため、また、他の数種類の実験結果との比較のために同じ100個で統一するために、100個で行いました。(100個でも誤差が大きくなる、というだけの話なので問題はないと思います) ですが、同じ実験を3回行った結果について疑問点が出てきました。 実験から得られた標本平均Xbarと標準偏差σを、 Xbar-k*√(σ^2*(N-n)/n/(N-1)) < μ < Xbar+k*√(σ^2*(N-n)/n/(N-1)) (信頼係数K、母集団N、標本数n) の式に用いて平均の範囲を出せると思います。(誤差が大きいということはこの範囲が大きくなるということですよね) 同じ実験を行って誤差の違い(平均μから近いか遠いか)はあれど、平均μの値はかならずどの実験でも範囲内に入るはずですよね。 ですが、3回行った実験のうち、範囲が重ならない結果(重複する範囲がない)が出てきました。3回すべて重ならなかったり、2個だけ重なって残り1個は重ならなかったりしました。重なれば少なくともその範囲に平均μがあると思っているのですが・・・ 最初はこの3回行った同じ実験でそれぞれ得られた平均の範囲から平均の範囲をある程度決められるかなと思っていました。(誤差が大きくても) 原因として何が考えられるか考えたのですが、 1. 3回の実験のうち、測定中に触ったり何かしてちゃんと測定を行えなかったなど何らかの影響でちゃんとしたデータではない実験があるため。 2. 実は同一条件ではなかった(異なる実験扱いで比較できない) どのようにデータをまとめていいか困っています。すべてのデータを載せるのも要領の関係で難しいので、まとめたいと思うのですが・・・ 自分の統計の勉強不足なのでしょうか。 それか、Xbar±3*σで範囲を決めようかとも迷っています。 何か「ここは間違ってるよ」とか「こういう風にしたら?」などありましたら書き込んでいただけないでしょうか? わかりづらい質問でお手数おかけしますが、ご教授いただけますでしょうか。 よろしくお願いします。

  • ゼロ付近の値の扱い(平均、統計学)

    ある測定を3回行い、その値の平均を求めるとします。 このときに、非常にわずかな量を測定するため、ゼロ、もしくはマイナスの値が得られることもあります。 このマイナスは平均に含めるべきでしょうか? ある人に相談したところ、「存在量がマイナスは存在し得ない」という主張で、マイナスは平均に含めるべきではない といわれましたが、測定誤差としてマイナスの値がありうる場合には平均に含めるべきだと思うのですが。 たとえば、一回の測定で測定による真の測定値からのばらつきが±0.1mgあるとすると、-0.05mgという測定結果は「ありうる値」だと思うのです。つまり平均に含めるべきだと思うのです。 (これが測定のばらつきを超えた0.2mgといった値なら、この値は捨てますが。) そうでなければ、含有量がゼロのものを100回測定したときに、マイナスの値をすべて捨ててしまうと、その平均はおそらく+0.05mg(細かい値は抜きにして、ゼロでないプラスの値という意味です)になり、マイナスを含めれば0.00mgになると考えられます。 「ありうるマイナスの値は平均に含めるべきである」 という結論に対してコメントをお願いします。 (ありうる、ありえないの境がどこかの議論は今回は省略させてください。)

  • 統計学-母集団が少ない場合の標準偏差について-

    はじめまして。よろしくお願いします。 現在、70個ほどのデータの標準偏差と平均をグラフにしてまとめている作業をしています。(エクセルで、まず平均の棒グラフをつくり、その後、y誤差範囲に標準偏差を代入してグラフ化しています。)母集団もすくなく、データも明らかにばらつきがある、たとえて言うと、1のものもあれば、1000のものあるのに、データは70前後。 もちろん、標準偏差もものすごく大きくなります。 エクセルで作成しているのですが、STDEVPという母集団全部を考慮に入れる(標本としないで)式でやっています。 本題ですが、そのばらつきのある標準偏差をどうにかして縮めたいのです。「誤差を範囲に入れるような感じでやればもっと標準偏差のバーが小さくなるだろう。それを考えろ。」と上司は言ってきますが、私にはさっぱりわかりません・・・。 母集団がすくなく、明らかにばらつきが見て取れる場合の標準偏差の式が何か別にあるのでしょうか・・・。

  • 統計的手法について

    現在,品質保証業務をこなしているものです. 旧式測定機と比較して,新型機の方が測定精度は向上している(もしくは同等以上である) ということ言うためにデータ取りを行うところです.(検査特性:漏水量) ここで質問ですが,検査対象になるワークが嵩張るためn=10×3種類しか入手できませんでした. n数が少ないときに有効な比較方法,もしくはデータ取り-統計的手法があれば教えてください.

  • バラツキを考慮して平均を補正したい

    会社でちょっとした統計処理をしていて、 バラツキを考慮して平均を補正するという作業をしたいのでが、、、 なかなかうまくいきませなん。 例1) a1=2, a2=2, a3=2 例2) b1=-1, b2=0, b3=7 例1)a1~a3の平均と、例2)b1~b3の平均はどちらも"2"です。 しかし、例2)はb3だけが突出していて印象的には"2"よりも若干低めの、0~1ぐらいに補正したいのです。 しかし、補正をするための数学的根拠が見つけられないのです(そもそも無いのか?)。 私のつたない知識ですと、バラツキを現す手法としては標準偏差が思い当たりますが、 例1)の標準偏差=0 例2)の標準偏差=3.56 なので、これを利用して何とかならないか、、、などなど考えています。 平均値をバラツキを考慮して補正する、数学的根拠のある方法は存在するのでしょうか。

  • 統計データから平均を出して何か意味があるのでしょう

    統計データから平均を出して何か意味があるのでしょうか? 日本国民市民の平均年収は◯◯◯万◯十◯万◯◯◯◯円です。とか言われても、何の役にも立たないですよね。 1000万円の人と500万円の人がいるだけで、たった2人で誤差は250万円も実際とズレるわけです。 なぜ平均ではなく回帰分析を使わないのでしょう。 平均と回帰分析の利点と欠点を教えてください。平均は全く役に立たないと個人的に思います。 絶対的に値が低くなりますよね。

  • ばらつきとグラフの形

    1つの未知試料の濃度を3回測定し、その平均値を測定結果として 採用する仕事があるとします。 試料の濃度が高いものほど、3回の測定値のばらつきが大きくなる (ある意味当然?)気がしたので、 3回の測定値の平均値を横軸、 3回の測定値の標準偏差を縦軸にしてプロットしてみました。 予想は右肩上がりのボヤケタ棒状でしたが、 実際は右肩上がりの棒の下にもプロットが多く、 直角三角形(グラフなので右下が直角なのは当たり前ですが) をベタ塗りしたような分布図になりました。 つまり、濃度が高くてもばらつきが大きい場合も小さい場合も ある。いいかえると、濃度がたかくなるにつれ、ばらつきも 大きくばらついてくるのです。    質問は、分布図の形によって、ばらつきのモデルとか名称 とかってあるのかな?という事と、この測定系は普通なのか 悪いのか、あるいはなにか問題点が推測できるなら教えて 頂きたいのです。また参考になるサイトの紹介もあれば。  よろしくお願いします。

  • 統計学の専門家に質問です。教えてください

    最近発売された、東海大学、唐津一先生の本に以下のようなくだりがあります。 「統計を取る際に一体どれだけの数を調べればいいか。結論を言ってしまうとサンプル数は約300で十分である。「えっ、たったの300でいいの」と思われるかもしれない。日本には一億三千万の人がいる。その傾向が、たった300人の統計でわかるのか?わかるのである。300人を調べたときの誤差のバラツキは3%以下である。だからそれで十分である。「ええっ?」と思うかも知れない。しかしこれは厳密な統計学が教える理論である・・・・・・・・」 そこで教えていただきたいのですが、 (1)何故サンプル数が300で良いのか? (2)300人調べた時の誤差のバラツキが何故3%以下なのか? この2点について数学的、統計学的に分かりやすく教えていただけませんでしょうか?

  • 有意差が生じているかどうかの統計手法を教えてください。

    有意差が生じているかどうかの統計手法を教えてください。 質問事項は2点在ります。 1.Aというサイトで1年間Bという物質の日平均濃度を測定し、同サイトにおける地上5mと25mとの温位日平均値とで相関が見られた。翌年同様の測定を行ったが、同じ程度の有意性が認められるのか確認するにはどのような手法を用いればよいのか。 2.1999年度に500地点で測定されている物質Xと物質Yの日平均濃度値を用い、Y=aX^bという回帰式が求められた。10年後に再度同様の手法で回帰を求めて得られたY=AX^Bという式は10年前に求めた式と有意な差が見られるか 以上です。 数学に疎く、理解できなくても使えれば良い、という状況下におります。 ご見識のある方のアドバイス、よろしくお願い致します。

  • 統計の使用について

    統計学についての質問ですが、 あるサンプルに対して、A値、B値、C値・・・ のように複数値が出るとします。 このような測定を複数回行い、 平均値と標準誤差を算出します。 この平均値と誤差を使って、 新たなサンプルが、平均値を出した 集団と同じ集団のものであると 証明する方法はないでしょうか。 また、このような作業を行うのに、 お勧めの参考書などないでしょうか。 教えてください。 よろしくお願いします。