• ベストアンサー

加重平均について教えていただけないでしょうか

年代にそれぞれ値が対応したデータがあります。具体的には下のようになっています。 2008年・・・0.66 2004年・・・0.29 2000年・・・0.28 1996年・・・0.12 ・ ・ ・ データ数33個になります。 このデータの加重平均から間の年代の値を求めたいです(例えば2006年の値)。加重平均について調べた結果、値を平均するだけでなくそれぞれのデータに対応する個数を考慮するということはよく理解できました。 しかし上のようなデータの場合、年代は個数ではないですし、どうすればいいのか分かりません。どうぞご教授お願い致します。

  • Ulab
  • お礼率45% (5/11)

質問者が選んだベストアンサー

  • ベストアンサー
  • Tacosan
  • ベストアンサー率23% (3656/15482)
回答No.2

その状況なら, 普通は線形補間やスプライン補間, あるいは (なんらかの仮定のもとに) カーブフィットするんじゃないかな.

その他の回答 (5)

  • alice_44
  • ベストアンサー率44% (2109/4759)
回答No.6

しまった、私も いいまつがい。 「重みの逆数」じゃなく、「重みの逆比」でないと。 いいまつがい は、あるもんだね。 その先生も、悪気は無かったんだと思う。

Ulab
質問者

補足

加重移動平均なるものがありました。まだよく見ていないですが、もしかしたら関係するかもしれないです。

  • alice_44
  • ベストアンサー率44% (2109/4759)
回答No.5

←A No.4 だとすると、限りなく いいまつがい っぽいよね。 線形補間は、各データの重みじゃなく、 重みの逆数 が現象論的な意味を持つんだから。

Ulab
質問者

お礼

Tacosanさんのご意見同様にやはり、先生の間違いでしょうか。 ご回答ありがとうございました。

  • Tacosan
  • ベストアンサー率23% (3656/15482)
回答No.4

あ~, ひょっとして線形補間のことを「加重平均」と言ったのかなぁ....

Ulab
質問者

お礼

線形補間をやってみようと思います。 何度もご回答頂きありがとうございました。

  • KEIS050162
  • ベストアンサー率47% (890/1879)
回答No.3

データのない年代を補間するのに、加重平均を計算して埋めろ、と言われたということですよね? なので、単純に、2006年を補間するのには、 2008年の データ(平均値のこと?) × サンプル数 と 2004年の データ × サンプル数 を足して、双方のサンプル数の和で割る(⇒即ち加重平均)ということで良いのではないかと思います。

Ulab
質問者

お礼

ありがとうございます。 平均値ではなく各年代につきデータが1個しかないのです。

  • Tacosan
  • ベストアンサー率23% (3656/15482)
回答No.1

「データ数33個」ってのは, どんなデータが 33個あるんでしょうか? その 33個のデータが全て違う年のものであるなら, そもそもなんで加重平均を使おうという気になったのかってところから問題視せざるをえないんだけど....

Ulab
質問者

補足

違う年代のデータが33個あります。 先生に加重平均やってと言われまして。。。 間の年代の値はデータがないので無理やり当てはめようということなのですが、前後2点間の直線の式で出せばいいんでしょうか。

関連するQ&A

  • データの加重平均について

    加重(重み付き)平均について、これまでの類似の質問を読んでもわからないことがあるので お教え下さい。共通テストでの各小学校ごとの平均点の加重平均や平均株価などでは、重みが 生徒数や株式発行数になるのは理解できるのですが、単なる測定データの場合は重みはどうす ればよいのでしょう。例えば、理論的には同じ値になる(どんな値になるかはわからない)は ずの測定を100回したとすると、得られた値はばらつくのですが、普通に相加平均をとると、 すごく他から離れた値があったりした時に、悪い結果になってしまいます。そういう値の影響 を小さくするために相加平均ではなく加重平均を取りたい訳なんですが、その場合の重みは、 一応、相加平均を計算して、「それぞれの値と相加平均との差の絶対値の逆数」ということで 良いのでしょうか。それとも別のもっといい方法があるのでしょうか。よろしくお願いします。

  • 加重平均-重みのつけ方

    加重平均の考え方についてお尋ねします。 2つのグループの身長データが次のようにあるとします。  (A)165,176,169,170(B)158,163,166 全てのデータの算術平均は、約166.7になります。 【質問1】このデータに重みをつけて計算をしたいのですが、どのように(ランクとかクラス別や男女別など)重みをつけるべきなのかがそもそも分かっておりません。次のいずれが正しい方法に該当するのでしょうか?該当しない場合もその旨を教えてください。 【質問2】また1)の考え方だけが正しい場合、そもそも加重平均をするには、AとBが同じ属性のデータ(2クラス分の男子データ)の時にのみ統計的に有効なのか?異なる属性データ(Aが男子でBが女子)でも有効なのかも教えていただけると助かります。 1)ABでわける  Aの平均=(170 x4)  Bの平均=(162 x3)  ((170x4)+(162x3))÷(4+3)≒166.7 2)度数分布1(スタージェスの公式)  階級の数n(4)階級の幅(4.5)最小値(158)最大値(176)  (162.5 x1) (167.0 x3) (171.5 x2) (176.0 x1) の4グループに分け計算。総和÷(1+3+2+1)≒168.9 3)度数分布2(単なる思いつきの6センチ間隔)  (158 x1) (164 x1) (170 x4) (176 x1) の4グループに分け計算。総和÷(1+1+4+1)≒168.2 加重計算の結果が通常の算術平均と同じ値になる場合が多く、単なる計算の簡便法なのかと混乱しつつあって、この計算方法の意義がどこにあるのかも分からなくなりつつあります。 相撲部 80kg x3と柔道部 50kg x2の加重平均は68kgで、普通の平均(80+80+80+50+50)÷5でも68Kgで同じ。 製品のボリュームごとに応じて販売単価が異なるような場合に加重平均の計算が活用されると聞いたことがあるのですがどのような表にすればよいのか皆目見当もつきません。

  • Excelで加重平均値を求めたい(2)

    すみません、早朝、質問した内容の続きですが、「加重平均値」の考え方が違っていたようです。10月分だけのデータでは、変わる(比較)数値がありません。4月-10月で、対象店舗数(N) が、それぞれの月で、19~21 で変化してましたので、このデータで「加重平均値」を求めるべきでしょうか? 添付画像は、クリックすると拡大で見えかと。よろしくお願いします。

  • 【統計】加重平均?

    閲覧ありがとうございます。平均に関する質問です。  まず、以下のデータをご覧ください。  氏名 選挙区 得票数 選挙区全体の票数 選挙区内の得票率 選挙区内の順位  N山 S区  7,005  67,314 10.04%  8人中4位  K元 J区  5,019  35,111 14.3% 6人中4位  H野 C区  5,682  42,572 13.4% 6人中5位  K谷 N区  6,068  60,658 10.0% 8人中6位  H島 H区  5,403  4,8266 11.2% 7人中5位  W貫 W区  7,833  77,901 10.1% 11人中4位  M区 H内  6,240  71,893 8.7% 11人中6位 これはある同一政党の議員の市議会議員選での得票数と選挙区全体の投票数のデータです。党内での得票数、あるいは得票率の順位を計算したいのですが、単に個人のを「選挙区内の得票率」、「選挙区内の順位」比較しても、選挙区ごとの投票数や議員定数が異なるわけですから、一概に比較にならないと思います。  このような場合、加重平均?を使って、選挙区ごとの投票数を考慮した重み付けをする必要があるのではないかという事までは予想できるのですが、具体的な計算方法については見当が付きません。  どなたか詳しい方、ご教示願えましたら幸いです。どうぞよろしくお願いいたします。  

  • 平均の平均を使う場面が知りたい

    重みづけをせずに、平均の平均を使う場面というのは、どういった時なのでしょうか? 用語の意味は理解しても、ネット検索すると「平均の平均はせずに、加重してから平均しましょう」といったサイトがヒットします。 平均の平均を使う場面、スポーツとかの結果の出し方、公的データ、のような例や実際に公表されているものなどあれば、どなたか教えていただけませんか?

  • JIS K 6301ゴムの物性計算の加重平均とは?

    JIS K 6301 ゴムの物理的性質試験方法において、引張強さと伸びの試験結果のまとめ方において、 例えば4個の試験片の各測定値を大きい順に並べて、 S1≧S2≧S3≧S4のとき、 引張強さまたは伸び=0.5S1+0.3S2+0.1(S3+S4) とあります。 この計算を”加重平均”と聞いたことがあるのですが、どうしてこれを”加重平均”というのか? また、なぜ”0.5”、”0.3”、”0.1”を大きい順にかけていくのか?この数値の根拠は何なのでしょうか? 自分は文系のため、なかなか理解ができません。 分かりにくい質問で誠に申し訳ありませんが、ご存知の方、何卒ご教授いただけますようお願い申し上げます。

  • Excel 条件を付けて平均を求めたい

    添付画像の表のように70%~130%の平均を求めたいのですが、 120%以上の値は無視して結果への影響を無くしたい と思っています。 普通=AVERAGE(A2:G2) 結果100% ↓ =if(A2:G2>120%, 120%以上の値は無視, 120%未満の値でaverage) 的な… 結果 90% これだけの表くらいなら、指定範囲を打ち込みで変えれば良いのですが、 データ範囲が多数あり、条件分岐して、式コピーで完了したく思っています。 無視するところは100%に換算すれば影響なくなりそうですが、 かえってややこし発想でしょうか、加重平均するにもよく分からずで… お力添えを・・・・よろしくお願いします。 <(_ _)>

  • 平均値の有為

    たとえば、利用頻度の最も高いB店で購入する品物Aの価格の平均値に対し、イレギュラーのC店で1個か2個買ったとしてもこの場合、有為な結果にはならないのでしょうか? 平均をだすための計算は、(どう表現していいかわかりませんが)合計数を個数で割りますよね。その個数が多いほど有為な結果となるのでしょうか?

  • 分散分析の平均値と実際の平均値のズレ

    統計初心者です。 現在SPSSを用いてデータの解析を行っており、対応のある3要因分散分析(被験者間要因:1、被験者内要因:2)を反復測定→多重比較(Bonferroni)にて行いました。 その結果、それなりの結果が得られたのですが、気にかかる点があります。 SPSSにて反復測定→多重比較を行った結果として表示された平均値と、実際のデータをエクセル上で平均して得られた平均値とに、微妙に違い(値のズレ)があります。 分散分析を行っている以上、実際の生データの平均値との間にズレが生じてしまうのは当然なのでしょうか?それとも、このズレは解析において何か致命的なミス(データの読み込み失敗、解析方法や条件設定の選択間違い)によって生じてしまった「誤った値」なのでしょうか? また、もし今回分散分析によって得られた平均値が妥当であるならば、論文等にグラフを書く際には、分散分析の結果得られた平均値と生データの平均値のどちらを用いるべきなのでしょうか? 拙い説明で申し訳ありませんが、ご教授頂ければ幸いと存じます。 宜しくお願い申し上げます。

  • エクセル2002で、増減のあるデータの平均値を取る

    エクセル2002を使っています。 画像のように、D127からD136までに数値データが入ります。 画像のデータはふたつですが、1個から10個の範囲で他セルを参照した結果が入ります。 ご覧の通りやりたいことは個体差データを合計し、個数で割り平均値を取りたいと思います。 平均だけならもちろん出来るのですが、その数の増減が有る場合の関数はどのようなものになるでしょうか? 詳しい方、よろしくお願いいたします。