• 締切済み

加重平均(重み付き平均)の標準偏差の求め方

あるデータを統計処理しています。 加重平均(重み付き平均)を計算し、 その標準偏差を求めようとしています。 私はあまり統計に詳しくないので、 加重平均の標準偏差の求め方が分かりません。 どなたかご存知の方がおられましたら是非教えて下さい。 よろしくお願い致します。

みんなの回答

  • Ishiwara
  • ベストアンサー率24% (462/1914)
回答No.4

#3です。 分散の具体的な求め方です。 「重み」は相対的なものですから、0.2 0.6 0.3 0.4 0.6 を 2 6 3 4 6 と読み替えても同じことです。 つまり、データが 30 30 21 21 21 21 21 21 40 40 40 25 25 25 25 18 18 18 18 18 18 の21個だと考え、ふつうの方法で平均や分散を計算します。 ただし、データはあくまで5個しかないのですから、平均値や分散の信頼度を論じるときには「データが21個もあるのだから、求めた値はそれだけ精度が高いのだ」などと考えると落とし穴にはまりますよ。

webster
質問者

お礼

ご回答ありがとうございます。 いろいろ勉強になりました。 加重平均の分散を求めるのはなかなか難しいのですね。

  • Ishiwara
  • ベストアンサー率24% (462/1914)
回答No.3

#2さんの言われるとおり、加重平均の値だけから、加重標準偏差は出せません。もとのデータまでさかのぼる必要があります。 考え方は単純です。 5という1個の値のデータに3という重みがついていたら、5というデータが3個あったとみなして標準偏差を計算してください。

webster
質問者

補足

ご回答ありがとうございます。 私が現在処理しているデータの重みは、全て1以下の数字です。 したがって、標準偏差の計算の際、nを求めますが、 これをどの様に求めればよいのか分かりません。 例えば、 データ 重み 30   0.2 21   0.6 40   0.3 25   0.4 18   0.6 の加重平均は約24となりますが、 この加重平均の標準偏差はどのようになるのでしょうか? もし、宜しければご教授下さい。 よろしくお願い致します。

回答No.2

加重平均されているということですが、加重平均から単純に標準偏差は出ません。標準偏差は、ばらつき(分散)具合ですから、データのばらつきが要ります。 どういう重み付けをするのかわかりませんが、個々のデータに重み付けをしたデータで標準偏差を出すことになると思います。 例えば、あるデータの集合に対してはそのまま使うが、あるデータ集団に対してはそのデータ数をそれぞれ3倍にするとか。

回答No.1

関連するQ&A

  • 【数学・標準偏差σ】標準偏差のσ(シグマ)は全部の

    【数学・標準偏差σ】標準偏差のσ(シグマ)は全部のデータの標準偏差とサンプル抽出データの標準偏差は等しくなるそうですが、全部のデータから平均を出すのが難しい膨大な数のデータだから標準偏差を用いると書かれていたのに、標準偏差を導き出すのに全部のデータから標準偏差を出して、さらにサンプルから標準偏差を2度出しした方が計算処理は負荷が大きいのでは? 全てのデータから標準偏差を出すなら最初から全部のデータから平均を出したらよいのでは?

  • 標準偏差について

    標準偏差について MINTABという統計処理ソフトを使って工程能力を計算すると、標準偏差の値がExcelのSTDEV関数を 使って得られた値と異なります。 MINITABの方が厳しく出るようです。 この違いについてご存じの方がいらしゃいましたらご教示下さい。 MINITABの計算式がわかると助かります。        よろしくお願いいたします。

  • 標準偏差の計算について教えてください。

    確率統計が超苦手なのですが,計算しなければなりません。よくわからないので教えてください。 例えば, 数:10 平均:1.1 標準偏差:0.05 数:5  平均:1.2 標準偏差:0.03 数:20 平均:1.05 標準偏差:0.1 が与えられたとき,どのようにして計算すれば,全体の標準偏差が算出できますか?

  • 加重平均-重みのつけ方

    加重平均の考え方についてお尋ねします。 2つのグループの身長データが次のようにあるとします。  (A)165,176,169,170(B)158,163,166 全てのデータの算術平均は、約166.7になります。 【質問1】このデータに重みをつけて計算をしたいのですが、どのように(ランクとかクラス別や男女別など)重みをつけるべきなのかがそもそも分かっておりません。次のいずれが正しい方法に該当するのでしょうか?該当しない場合もその旨を教えてください。 【質問2】また1)の考え方だけが正しい場合、そもそも加重平均をするには、AとBが同じ属性のデータ(2クラス分の男子データ)の時にのみ統計的に有効なのか?異なる属性データ(Aが男子でBが女子)でも有効なのかも教えていただけると助かります。 1)ABでわける  Aの平均=(170 x4)  Bの平均=(162 x3)  ((170x4)+(162x3))÷(4+3)≒166.7 2)度数分布1(スタージェスの公式)  階級の数n(4)階級の幅(4.5)最小値(158)最大値(176)  (162.5 x1) (167.0 x3) (171.5 x2) (176.0 x1) の4グループに分け計算。総和÷(1+3+2+1)≒168.9 3)度数分布2(単なる思いつきの6センチ間隔)  (158 x1) (164 x1) (170 x4) (176 x1) の4グループに分け計算。総和÷(1+1+4+1)≒168.2 加重計算の結果が通常の算術平均と同じ値になる場合が多く、単なる計算の簡便法なのかと混乱しつつあって、この計算方法の意義がどこにあるのかも分からなくなりつつあります。 相撲部 80kg x3と柔道部 50kg x2の加重平均は68kgで、普通の平均(80+80+80+50+50)÷5でも68Kgで同じ。 製品のボリュームごとに応じて販売単価が異なるような場合に加重平均の計算が活用されると聞いたことがあるのですがどのような表にすればよいのか皆目見当もつきません。

  • 母平均が分からないのに母標準偏差が分かるのは何故?

    今、統計学の本の「母標準偏差が既知の場合の母平均の推定」という項目を読んでいます。 その計算自体は簡単なのですが、そもそも、母平均が分からないのに母標準偏差が分かる状況ってどんな状況ですか?母標準偏差を算出する際に母平均を使うでしょう?基準(平均)が分からないのにバラツキが分かりますか?

  • 平均値と標準偏差

    10人の各被験者に対して10回以上ずつ朝と夕でデータをとりました。例えばAさんのデータは朝12回分、夕方13回分、Bさんのデータは朝15回分、夕方12回分あります。 朝と夕方の平均値と標準偏差はどうやって求めればいいのでしょうか。10人に対して一人ずつ平均値を求めてそれに対する平均と標準偏差を求めるというのでいいでしょうか。また、朝と夕方の違いというのは一人ずつの朝と夕方の平均値を使ってpaired-t で検討すればいいのでしょうか。それともなにかもっと適切なやり方があるのでしょうか。教えてください。

  • 下方標準偏差ってなんでしょうか

    下方標準偏差という用語に出くわしました。手元の統計学の本を何冊かみてみましたが、この言葉がでているものはありません。英語略ではSUBSDということだそうです。前後関係から勝手に推定すると、サンプルのうち、サンプルの平均を下回るデータだけで標準偏差を作るのかな?とも思えますが、適当なあてつけにすぎません。何を意味するのかご存知のかたはお教えねがえますでしょうか?

  • 平均値、標準偏差、幾何平均、幾何標準偏差の推定

    数学素人でさっぱり意味が分かりません。 分布なのですが、一部書き込みます。 A  累積分布  確率密度 1   0.0009329 0.0009329 2  0.0012776 0.0003447 4  0.0023306 0.0010530 6  0.0040988 0.0017682 8  0.0069518 0.0028531 10  0.0113821 0.0044303 ~   ~     ~ 28  0.4085144 0.0898605 30  0.5000000 0.0914856 32  0.5882070 0.0882027 ~   ~     ~ 68  0.9995101 0.0002532 70  0.9996741 0.0001640 80  0.9999535 0.0002795 100 0.9999989 000000453 Aを正規分布で近似した場合、平均値と標準偏差の推定 Aを対数正規分布で近似した場合、幾何平均と幾何標準偏差の推定 エクセルにデータ入れて計算しようとしてるのですが、方法が分かりません。どのように計算すれば良いのでしょうか?全く知識ないのですみませんが御教授してください。(何か計算に足りない物があれば指摘下さい)

  • 標準偏差と平均偏差の違い

    標準偏差と平均偏差は、数字としての意味は何が違うのでしょうか。(算出方法の違いなどは分かります) 換言すれば、平均偏差でもサンプルのばらつきが表現できるのに、わざわざ計算過程をややこしくして標準偏差を求めることにどのようなメリットがあるのかということです。 『数種類の検体を用いて同一行程の実験を行い、その結果の値の揺れ(ばらつき)を求めたい』 このレポートへのアプローチとして、平均偏差または標準偏差を利用するとき、両者が意味的にどのような違いをもつのか、ご教授ください。

  • 【至急】偏差値と標準偏差の求め方

    ある集団の標準偏差を求めたいです。 現在わかる情報 ・母集団の平均 ・Aさんの得点、偏差値 ・Bさんの得点、偏差値 わからない情報 ・母集団の人数 ・標準偏差 偏差値=(得点-平均)*10+50の公式にAさんの得点、偏差値を代入して 標準偏差を求め、その数値をBさんの式に当てはめて計算しましたが、 正しい偏差値が得られませんでした。 これは一体なぜ?どうしたらこの二人のデータから母集団の標準偏差を求めることが できるでしょうか。計算プロセスも含め、教えてください。