• ベストアンサー

ウェイトバック集計について

大学で統計について勉強しています。 ウェイトバック集計について一からその概念というか、方法というか、教えて下さい。 なんとなくは分かるのですが、なんとなくしか分かりません。 具体的な数字を挙げながら教えて頂けると助かります。 よろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • P3CO
  • ベストアンサー率36% (13/36)
回答No.1

アンケートなどで得られた結果を元の全体(母集団)の構成比に合わせるように重み付けして計算すれば良いと思います。 例えば、ある地域にすんでいる人、一人当たりのビールの1週間の消費本数を調べようとします。その地域は、全部で1100人住んでいて、なぜか女の人が1000人で男の人が100人ということにしましょう。 で、男の人と女の人から2人ずつ合計4人にアンケートをとったらこんな結果になりました。 1 男 ビールのむ   4本 2 男 ビールのむ  10本 3 女 ビールのまない 0本 4 女 ビールのむ   2本 この平均を計算すると一人4本ビールをのむことになります。じゃあ、その地域の一人あたりのビール消費本数が平均4本かというと、ちょっとおかしいですよね。 そこで、元の全体の比率(女:男=10:1)に合うようにウエイトバックすればいいのです。                (ウエイト値)  (乗した結果) 1 男 ビールのむ   4本    1         4 2 男 ビールのむ  10本    1        10 3 女 ビールのまない 0本   10         0 4 女 ビールのむ   2本   10        20 各々のサンプル毎にビールの本数とウエイト値を乗して、それを合計して割れば(この場合、34/22ですね)、平均1.5本となります。 ウエイト値の作り方は特にルールはなかったと思います(すいません、ここちょっと自信ないです)。 例の場合、元の母集団の合計値にあうように下記のようにしてもわかりやすいかもしれません。 この場合、乗した結果の合計の1700を1100で割って結果(1.5本)は同じですよね。                (ウエイト値)  (乗した結果) 1 男 ビールのむ   4本    50      200 2 男 ビールのむ  10本    50      500 3 女 ビールのまない 0本   500        0 4 女 ビールのむ   2本   500     1000 -- 比率の場合は、サンプルの4人だとビールをのむ人の比率は、3人/4人で75%ですが、ウエイトバックした後だと55%になります(12/22 または 600/1100)。 記憶からひっぱりだしたので完全な自信はないですが、恐らく、これでいいはず^^; 他の方間違っていたらご指摘ください。 -- ちなみに上の例だとはじめから、比率を合わせて女の人20人、男の人2人からアンケートとればウエイトバックしなくてもいいですけどね(男のサンプルが2で十分かということは別にしてですが)。 -- 勉強がんばってください。

doudesyou
質問者

お礼

すごく丁寧なご説明ありがとうございました。 参考になりました。 もっと他にも深い考え方があるようなら紹介してください。 よろしくお願いします。

その他の回答 (1)

  • Chuck_GOO
  • ベストアンサー率64% (1018/1586)
回答No.2

No.1さんの仰るとおりでよいかと思います。 若干補足しますと、 ・調査したい母集団の構成比 と、 ・実際調査できる/調査できたサンプルの構成比 とが「異なる」場合に、 この「ウェイトバック」を使う、と考えればよいかと思います。

関連するQ&A

  • ウエイト付け集計

    広島と岡山で質問紙調査を実施し,回収数が広島116,岡山154でした.「広島+岡山」のある物の所有率Xの信頼区間を計算する際に,人口構成比でウエイト付集計をしました.(広島:岡山=4.73:1.00). その結果,広島548人,岡山154人として比率Xを計算したのですが,このウエート付Xの95%信頼区間を計算するときの標本サイズは,ウエイト付の標本サイズ「702」を使えばいいのでしょうか?. それとも,回収数そのものの「270」で推定すればいいのでしょうか.統計学的には,どうするのが正しいのでしょうか?

  • ウエイト平均

    どなたか、ウエイト平均のことを教えていただけませんでしょうか? 定義について 数字を使った具体的計算方法 まで、教えていただけませんでしょうか? どうそ、宜しくお願いいたします。

  • 集計(リンク)の仕方を教えてください

    エクセル1ファイル内に複数あるシートに記された数字を集計する方法を教えてください。売上とか、出納帳とか集計したいのです。 シート間リンクの集計方法。 また複数のファイルも同様に集計する方法を教えてください。 ファイル間リンクの集計方法。

  • 一行おきの集計

    エクセルで一行おきの数字を集計する方法は?

  • エクセルのデータ集計

    エクセルのデータ集計で色づけした数字だけを集計する方法を教えてください。

  • アンケート分析の仕方について学びたい

    こんにちは。 仕事でアンケートを取る機会があるのですが、どうもその結果をうまく反映できていないので、もっと勉強をしたいと思っています。 集計をして、数字を出して、どれが一番多いか、ぐらいにまとめる程度で終わらせてしまうのですが、もったいないと思うのです。 いろいろと調べて、統計学の一部にアンケート分析があることがわかりました。 統計学を勉強しようと本を借りてみたのですが、文系な私にはさっぱりで・・・。 どこかセミナーやビジネススクール、または大学に入って、など考えていますが、「統計学、大学」で検索をしてもなかなか出てこなくて。 どなたか、統計学(アンケート分析の仕方)を学ぶにはどうすればいいかお分かりの人がいたらぜひ教えてください。 現在、ハンバーガー統計学というHPを見つけたので、読んでいるところです。途中からわからないことだらけで???という感じです。 誰かに教わりながら、入門ぐらいはマスターしたいと思っています。 よろしくお願いします。

  • エクセルの集計について

    エクセルについて質問です。 日付ごとに各項目1~100に数字が入っている一覧表があります。 各項目数個ずつを日付ごとに集計したい場合よい方法はありますでしょうか? 例 項   4/1   4/2   4/3   4/4   4/5 目 (1)   10    10     20   15    10 (2)    4     3     1     7      6 (3)   11    12     13    14     15 ・ ・ ・ 4/1の項目1、10、50を集計したい。など。 よろしくお願い致します。

  • エクセルで集計したいのですが・・・

    関数は少しわかりますが、マクロは分かりません。 今回は集計シートの集計数字を元シートに入力して、更に元シートにない項目を元シートの項目行に項目名を入れて集計数字を入れたいのです。 ただ、集計だけであれば「sumif」関数を使えば出来るのですが、元シートにない項目名を探し出して入力する方法がわかりません。教えてください。よろしくお願いします。 元シート  A  B       1 aaa 2 bbb 3 ccc 4 ddd 5 6 7 集計シート 項目 数量 1 bbb 1 2 aaa 2 3 ddd 1 4 eee 1 5 fff 1 6 ccc 2

  • コロナ集計のジョンズ・ホプキスンス大学とは?

    武漢ウイルスの世界の感染者数をアメリカのジョンズ・ホプキンス大学が中心となって集計していますが、 ○本来、こういう業務はWHOが行うべきと思いますが、何故、この大学が行っているのでしょうか? ○この大学は、WHOから集計の依頼をされてるのか、あるいは、集計に関しての何らかの権限があるのでしょうか? ○また、日報のように毎日の集計数字を発表してますが、こういう集計のネットワークはどのようになっているのでしょうか。特に、低位開発国からの感染者数字も、正確に把握してるのでしょうか? ○現在は、武漢ウイルスの感染者の集計ですが、過去に、同じような感染症(例:SARS)の数の集計も行っていたのでしょうか? ○こうした集計結果をマスコミに公表のほか、どんなことに活用してるのでしょうか? いろいろ疑問がわきますが、断片的なことでもいいですから、知っていたら教えてください。

  • Excelでクロス集計の検定

    アンケート調査を実施しました。 結果をクロス集計し、カイ二乗検定で検定したいのですが・・・ エクセルや、統計・解析に関わる書籍を買ったり、借りたりして勉強しているのですが、 今ひとつ理解できません。 簡単に検定することはできないのでしょうか? 自分で計算しなくてはいけませんか? 二変数以上の相関関係を調べたいのですが、 簡単な方法はありませんでしょうか?

専門家に質問してみよう