• ベストアンサー
  • すぐに回答を!

統計解析の平均値

お世話になります。統計学の初心者です。 あるデータの解析を実施しようと思うのですが、 例えば一週間分のカロリーの平均値を人毎に算出して、 12週間の傾向を観察したいのですが、1週間のカロリーの平均を計る際、1日食べなかった人や飲み会などに参加してしまい、平均値の変動(参考にならない数値結果)があるため、その人の平均値が大きく変動してしまいます。除外するには除外するデータが多すぎて困っています。 平均値の算出方法として食事を摂らなかった人や計算値が大きすぎる人をうまく考慮した平均値の計算方法はあるのでしょうか?

共感・応援の気持ちを伝えよう!

質問者が選んだベストアンサー

  • ベストアンサー
  • 回答No.1
  • solla
  • ベストアンサー率59% (45/76)

通常の算術平均では外れ値の影響を受けすぎてしまうという場合には、中央値(median)を使うといった事も考えられます。また外れ値に対し(推測統計的な意味で)頑健性をもつ平均として、trimmed mean や winsorized mean などがあります。 http://planetmath.org/encyclopedia/TrimmedMean.html ただ、あるデータを外れ値として扱うかどうかは、実際的な見地から判断するほうが良いように思われます。例えば1日食べなかったり、飲み会に参加したりというのが、その人にとってそれほど珍しくないのであれば、それは外れ値ではなく「正当な」データではないでしょうか。そうなれば一週毎の平均値の変動が大きくても、それが事実です。もしくは一週間という期間では統計的ばらつきを吸収するのに十分でないということかもしれません。その場合は期間を2週間にしたり、移動平均を使ったりということも考えるべきかもしれません。 その人が年に1回くらいしか飲み会に行かないのにたまたまそれが測定期間にあたってしまったという場合は外れ値かもしれません。しかし、 > 除外するには除外するデータが多すぎて困っています。 という時点で、それらを外れ値とする基準が適切ではないように思います。

共感・感謝の気持ちを伝えよう!

質問者からのお礼

ご回答ありがとうございます。確かに成人の日常生活において一食を抜いたり、週一回の飲み会など日常茶飯事ですね。平均値の算出にこだわりすぎて、データ正当性を考えなさ過ぎていたと思います。上記のご回答を考慮してもう一度考えて見ます。大変ありがとうございました。

関連するQ&A

  • 平均値の解析法について

    統計分析の初心者です。 データがあってもどの方法で解析をすればよいのか途方にくれています。 経年的に追跡しているデータで、平均値まで出しています。 平均値は低いほど良い結果です。 1年目、2年目、3年目と3回分のデータがあるのですが、1年目よりも2年目、2年目よりも3年目、1年目よりも3年目の方が良い結果が出ている(平均値が低くなっている)ことを統計的に解析したいと思っています。 どのような方法があるのか、たくさんあるかもしれませんが、教えていただけませんでしょうか? これからのためにも、なぜそれが良いのかも知りたいと思っています。 周りに相談できる方がいないので、教えてくださる方がいれば助かります。 よろしくお願いします。

  • 統計解析について

    お世話になります。 最近、統計解析のソフトを使ってデータの解析をする事がある程度の初心者の質問です。 30人分の縄跳びを連続で跳んだ回数データがあります。挑戦した回数は10回です。このデータを統計的に解析したいのですが、既存のデータでは200回以上跳んだ場合200以上と記載されています。試しにソフトを使って検定を行うとそれなりの数値が計算されるのですが、この場合200回以上のデータをどう考慮されているのでしょうか?200回以上だと500や1000となると計算に影響すると思うのですが素人考えなのでしょうか?

  • 時系列統計データの解析について

    統計は、あまり得意ではありません。  作物の生産量と気象要因(温度、日射量、降水量等)との関係性を調べるため、15年間の月別生産量のデータと、15年間の月別平均気温、月別積算日射量を使用して、月別の生産量と気象要因との関係性を調べたいのですが、その作物の生産量の統計において、トレンド傾向(緩やかに減少傾向がみられる)や季節変動(夏場は生産量が多く、冬場は少なくなる)がみられます。  そのため、そのまま原データを比較して、関係性を調べた方がいいのか。トレンドや季節変動性を除去し処理したデータを行うべきなのか。さらに気象データなども季節変動性などの除去処理を行って解析した方がいいの迷っております。 初歩的な質問とは思いますが、どなたかご教授いただけますでしょうか。

  • 平均値に関する解析

    平均値に関する解析を2種類しましたが、古い参考書を見ながらで、方法名がはっきりわかりません。(すぐわかるEXCELによる統計解析 1999 内田治 東京図書) 私がやった方法を人に説明する時、何法といったらよいでしょうか?t値とp値を出しています。 男性と女性の左右の総頚動脈径の差を調べました。 (1)「左右合計した総頚動脈径」の平均が男女で差があるか?人数に違いあり。 ⇒母平均の差に関する検定⇒Welchのt検定でよいですか? (2)右の血管と左の血管のそれぞれの平均の差を調べ、差があるか。件数は同じ。 ⇒対応のあるデータの母平均の差の検定⇒何法とかいわなくてもいいですか?

  • 統計値に関する質問

    統計学に関する質問です。 平均が7.0、変動が6.8~7.2の間にある30個のデータがあります。新しく7.1という値が得られたとして、この値が「今までの傾向から外れ値でない」ことを示すのに適した統計指標はありますでしょうか。 宜しくお願い致します。

  • 統計解析の方法を教えてください。

    品質管理に携わっているものですが、統計解析が良くわかりません。回りに聞く人もいません。 今、20ロットの液体の比重値の一覧があります。 20ロットの比重にばらつきがないことを確認したいがどのような統計解析をしたら良いのでしょうか。 1.決められた規格値の範囲に入っていることの確認→範囲内に入っている。 2.管理図の作成 ・エクセルの分析ツールで平均値(CL)、±3σを算出しCL±3σの範囲に入っている。 ここまでは確認しました。 次に20ロットの比重値にばらつきがあるのかどうかを確認したいのですが。 1.CL±3σの範囲に入っているので、する必要がない。→だったら良いのですが。 2.20ロットの比重値にばらつきが無いことを検定したほうがよい。→どのような検定・推定をしたら良いのでしょうか。 20ロットの比重値に例えば投与前後の対応があるわけでもないし、t検定(一対の標本による平均の検定)ではないですよね。どのような統計解析をすればよろしいのでしょうか。 ご教示お願いします。

  • 統計解析の方法について教えてください。

    統計解析の方法について教えてください。 2群で4項目(ノンパラのデータ)のものの出現頻度を出したいのですが、 この場合は、マンホイットニーでよいのでしょうか。 2群で2項目ではないので、フィッシャーの直接確率計算はやはり使えませんよね? どなたかご教授おねがいします。

  • 統計解析、検定手法(Cochran-Mantel-Haenszel法)について

    統計解析の素人なため、質問自体が根本的に問題かも知れませんが、 ご教授いただけますでしょうか。 ----------------------------------------------------- 7年間の観察期間で、2群に分けて特定の検査を実施しました。 それらのデータを集計して算出した例数を用いて それぞれ差を検定したいのですが、 Cochran-Mantel-Haenszel法が適していると聞きました。 ある部門で計算をしてもらい、結果を算出してもらいました。 漸近有意確率 (両側検定)にて、ある特定の検査項目のp値に 「*:p≦0.05」が出現したのですが、どのような説明ができるのか 教えていただけますでしょうか。 結果------------------------+ カイ2乗 5.621 自由度 1 漸近有意確率 (両側検定) 0.021 +---------------------------- 質問方法と、情報の提示に問題があるかもしれませんが、 ご協力お願い申し上げます。

  • 統計解析のクロスバリデーションについて

    統計解析において、クロスバリデーション法でRMSEなど算出する際、 分割数がサンプル数と等しいleave one out法であればRMSEの結果は常に同じですが そうでない場合、毎回計算結果が異なりますよね。 例えば2foldのときと3foldのときで計算結果は異なりますが、 2foldで固定した場合でもその分割の仕方をランダムにすれば当然結果はその都度異なりますが その際RMSEの値は何回か計算した場合の平均値としてよいのでしょうか? 同じ2foldでも1回目の計算ではRMSEがそれなりに小さくなるが、 2回目の計算ではかなり大きくなってしまったりすると それを平均したり、はたまた良い方の結果を採用するのは不適切ですよね? 計算結果がその都度大幅に変わってしまうときは モデルとして精度が低いということなのでしょうか。 初歩的なことですが、よろしくお願いいたします。

  • 統計・解析についてのわかりやすい参考書を・・・

    疫学研究で介入試験を行っています。 多くのデータが出てきていますが、それらを比較するときにどのような統計処理をかけたらいいのか理解ができていません。 どのようなデータにどのような統計・解析の方法を用いたらよいのかをわかりやすく教えている実践的な参考書(統計ソフトの解説書、あるいはソフトの実践書以外で)、その出てきたデータ(数値)は何を示していているのかをわかりやすく教えている参考書を探しています。 参考までに、統計学の知識はほとんどなく、数学も得意ではありません。 使用している統計ソフトはStat View5.0です。 よろしくお願いいたします。