• ベストアンサー

A市と全国の比較。どんな統計手法を使ったらよい?

統計はまったく素人です。 どんな統計手法を使ったらよいか教えてください。 仮の問題です。全国とA市での数字の比較です。 以下の場合,A市は全国に比較して うわさ好きが多いと表現しても良いのでしょうか。 けんか好きについてはどうでしょうか。       A市  全国 うわさ好き 10万 200万 早耳    6万 600万 嘘つき   5万 500万 大食家   4万 400万 けち    3万 300万 けんか好き 3万 100万 内気    2万 200万

質問者が選んだベストアンサー

  • ベストアンサー
  • sesekatsu
  • ベストアンサー率36% (21/58)
回答No.1

こうした比較をする場合、項目毎の割合を比較する必要があります。 A市と全国との割合は うわさ好き:20分の1 早耳   :100分の1 嘘つき  :100分の1 大食家  :100分の1 けち   :100分の1 けんか好き:33分の1 内気   :100分の1 になります。 うわさ好きとけんか好きは、他の項目と比べて比率が高いですね。 ですから、全国の分布と比較して、うわさ好きとけんか好きは比率が高いと判断できます。 でも、A市と全国の人口が判らないので、あくまでも分布としての比較です。 A市と全国の人口の比率が、1:100であれば、うわさ好きとけんか好きは、全国平均より多いと言えますが、1:100以下であれば、すべての項目が全国平均より多くなります。

zorozoro2100
質問者

補足

分かりやすい解答ありがとうございます。こうすると確かに比較しやすいですね。ただし,この場合は他に比べてうわさ好き,けんか好きがはっきり多いとわかるのですが,わずかに多いぐらいのときは,有意差の有無といった検討が可能なのでしょうか。それともこうした比較では統計的な処理は無理なのでしょうか。A市と全国の人口が判らない場合と,わかる場合で教えてほしいのですが。

全文を見る
すると、全ての回答が全文表示されます。

その他の回答 (2)

  • sesekatsu
  • ベストアンサー率36% (21/58)
回答No.3

>わずかに多いぐらいのときは,有意差の有無といった検討が可能なのでしょうか。 今、与えられている情報だけでは検討できません。 まず、うわさ好き、早耳、嘘つき、大食家、けち、けんか好き、内気のデータ(標本データと言います)をどうやって得たのか?この方法が重要になります。 統計で重要なのは、 (1)データがある (2)統計を行なう (3)結果を得る と思っているかも知れませんが実は違います。 (1)得たい情報を良く検討する (2)どうゆう統計手法を用いれば良いか検討する (3)その為に必要なデータを検討する (4)調査を行いデータ分析する (5)得られた分析結果が妥当か検証する と言った順番になります。 うわさ好き、早耳、嘘つき、大食家、けち、けんか好き、内気といったデータは、「定性的」なデータです。そもそも、判断することが難しいデータです。(身長や体重は「定量的」なデータになります。) うわさ好き、早耳、嘘つき、大食家、けち、けんか好き、内気か否かを判断するのは、そもそも難しいです。従って、「定性的」なデータを「定量化」する際に誤差が入ります。 また、調査の対象を絞らないといけません。 全ての年齢層で調べる事は不可能です。まず赤ちゃんや子供は、質問の意味が判らないでしょう。 当然、全員調べる事は不可能ですから、サンプリングと言う手法を用います。年齢層の人口比率や、性別、職業、年収など、全体を代表出来るサンプリング方法が重要で、実は、このサプリング方法で統計の善し悪しが決まると言って良いでしょう。 テレビの視聴率調査を思い浮かべてください。母数に対してどれぐらいサンプリングしたかで、その結果の誤差が決まってきます。 詳しくは、ビデオリサーチのHPに出ています。 ですので、既に得られた結果から、有為な差を検定することはあまり意味を持ちません。 逆に言えば、どのような調査、分析を行うかを決めだ段階で、誤差がどの程度入るのかが予測され、それ以下の微小な差異は、意味が無くなります。 視聴率の例だと、2~3%程度の違いは誤差範囲なのですね。 新薬の効果があるか否かなどの有為検定は、とても難しです。 新薬を投与するグループと、ダミーの薬を投薬するグループに分けて、効果を見ますが、個々の患者さんの症状は同じではないので、とても難しいです。良く帰無仮説という手法を用います。 色々な統計的な考え方があるので、頑張って勉強してください。

参考URL:
http://www.videor.co.jp/rating/wh/tvrating.pdf
zorozoro2100
質問者

お礼

ありがとうございます。 >既に得られた結果から、有為な差を検定することはあまり意味を持ちません> という部分は耳の痛い指摘です。 統計処理をしたいのなら,事前準備が必要ということですね。

全文を見る
すると、全ての回答が全文表示されます。
  • 180915
  • ベストアンサー率16% (3/18)
回答No.2

基本的には前の人の答えですが、全国の人口とA市の人口がわかればうわさ好きだけが突飛して多いのか、ほかの者も多いのかがわかりますよ。

zorozoro2100
質問者

補足

回答ありがとうございます。 前の人にも質問したのですが,この場合は他に比べてうわさ好き,けんか好きがはっきり多いとわかるのですが,わずかに多いぐらいのときは,有意差の有無といった検討が可能なのでしょうか。それともこうした比較では統計的な処理は無理なのでしょうか。A市と全国の人口が判らない場合と,わかる場合で教えてほしいのですが。

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • 統計手法の選択と変更

    統計の初心者ですが,よろしくお願いいたします。 ある薬剤を投与した時(A群)とある薬剤を別な飲み物で投与した時(B群)においての尿中成分を経時的に採取し,時間毎(1時間・3時間・6時間・12時間)に有意な差があるか・・,というのを行いました(個体は同じなので対応有り。n=10)。 1~6時間におけるA群とB群の比較はKolmogorov-Smirnov検定・等分散のF検定により正規性・分散が等しいと言えたので,パラメトリックを使いました(paired-t test)。 しかし,12時間の時だけが正規性はあるのに,分散が異なってしまいました(F検定により有意水準5%で母分散が等しいと言えなかった)。 わからないことは 1) 対応のある場合で,分散が異なる場合に用いる統計手法は?   (対応が無ければWelch's t-testだと思うのですが。ノンパラのWilcoxonの符号付順位和検定を使うべき?全てpaired-t testは使わず、別な統計手法で統一すべき?) 2) 論文に統計手法を記述する際の適切な表現方法は?   (統計解析にはpaired-t testを用い,12時間値のみ分散が異なるので**検定を用いた)と細かく書いた方が良いか?? 3) n数が極端に少ない場合(例えばn=4),ノンパラが適切でしょうか。KS検定・F検定では正規性と等分散がいえるのですが、あくまで例数が少ないので、。。 宜しくお願い致します。

  • 統計の問題? 割合を比較する問題

    都市Aは人口10万人(60歳以上は2万人)で1年間の死亡者数が2000人だった。 同じ年に、全国平均では60歳以下の死亡者数は1000人当たり5人、60歳以上は1000人あたり80人だった。 都市Aは全国平均と死亡者数を比較すると、都市Aは全国平均の ○ 倍になる。 という問題があったのですが、どういう風に考えて答えを出すのかまるっきりわかりません。 (統計の問題かどうかもよくわかってません。すいません。。。) 解き方と答えを教えてください。

  • 統計手法の選び方

    実験のデータ分析で用いる検定の手法がよく分からず,質問をさせていただきました. 統計解析についての知識に乏しく,ご指導いただければ幸いです. 人間のある関節角度の,角度変化率を時系列で見たデータを扱っています. なお,動作の開始時を0%,終了時を100%として,動作を等しい20区間に分割し,標準時間の5%ずつ,角度変化率を算出するという方法をとっています.(グラフは,横軸に標準時間をとり,縦軸に角度の変化率をとるというものになります) 被験者をA群とB群の2群に分けており,A群とB群の間で角度変化率に差がないかを検定しようとしています.(例えば,標準時間15%と20%の時点で群間に差がある,といった具合です) 2群間での比較ですので,“独立したサンプルのt検定”を用いて,それぞれの区間で一回ずつ(計20回)検定するという方法かな,と思ったのですが,確証も持てません…. 適切な検定方法がありましたら,どなたか教えていただけますでしょうか. 説明が分かりにくいようでしたら,なんなりとお申し付けください. よろしくお願いいたします.

  • 予測を行うのに適した手法がありましたらおしえてくだ

    以下の様な例の場合に使いやすい統計手法等がありましたら 教えてください。 例) イ ロ ハ 二 という食品があり AさんとBさんがこの食品の甘さを5段階で評価したとします (数字が大きいほど甘い) Aさんは以下の用に評価し イ=1 ロ=2 ハ=3 ニ=4 Bさんは以下の用に評価した場合 イ=2 ロ=3 ハ=4 Bさんが 二 の甘さをどう評価するか予測したい

  • 一元配置分散分析の多重比較の手法

    統計解析ソフトSPSSを使用して、解析の勉強をしている初心者です。 一元配置分散分析の多重比較について、どの手法を用いるべきなのか、ぜひご教示お願い致します。 例えば、ダイエットをしているA群(20名)において、ダイエット前、4週間後、8週間後の体重を測定し、「ダイエット前と4週間後」「ダイエット前と8週間後」「4週間後と8週間後」で検定する場合です。 パラメトリックにおける対応ありの多重比較として何の手法を用いるのがいいのでしょうか? また、Tukey法は対応なしの場合、対応ありの場合、どちらで用いるのでしょうか?頭が混乱しています。。。 宜しくお願い致します。

  • 統計処理方法の選択

    培養細胞にある薬剤を入れ、IC50曲線を描くとき、AのIC50がそれぞれ条件の違うコントロールB、C、Dに比較して数倍のIC50値となることがわかりました。実験は3回繰り返しました。 このような場合、Aの条件が他と比べて統計学的有意差を持っているかどうかを調べるとき、どのような手法が適当なのでしょうか? ぜひ教えてください。宜しくお願いします。

  • 医学統計解析について

    初めまして、統計解析の手法で分からないところがあります。ある検査の値(仮にA)から、一定以上の値なら悪性、以下なら良性となる指標を求めたいです。この場合は、2x2クロス集計表でフィッシャーの直接確率計算法でAを1回ずつ指定して計算していくしかないのでしょうか。何か他にも良い方法がありそうな気がするのですが・・・。

  • 統計に関する質問 2つの値を反映させる方法

    統計に関する質問です。 「能力A」という尺度があるとして、この尺度と他の「能力B」「能力C」との関連性を見たいと思っています。 「能力A」は2つの要素によって決定されます。それを仮に「要素A」「要素B」とします。 それらは5段階で評価されます(順序尺度 5段階)。 いくら「要素A」が高い点数であっても「要素B」が低ければ、「能力A」は高くなりません。 一番良いのは「要素A」も「要素B」も満点の場合となります。 この場合「要素A」と「要素B」を反映させ「能力A」を判断する方法はあるのでしょうか? 25通り?の組み合わせがあると思うのですが、それらが個別に点数化されるような統計的な手法というのがあるのでしょうか? 統計が苦手なのでめちゃくちゃな質問なのかもしれませんが、何卒よろしくお願いします。

  • 次のような場合に適した統計手法を教えてください

    統計初級者?ぐらいの者です。 基礎的な回帰、重回帰分析ぐらいまでならいちおう(クリック統計学レベルで…)理解しているのですが、いろいろと実作業をやっていて、わからなくなったので質問させていただきます。 さて、 調査の中身自体は全く違いますが、実際に次のような分布のデータがとれました。 -------------------------------- 【取得できたデータの概要】 -------------------------------- 家族の人数と、現在の生活に対する平均満足度に対するアンケートを5000人に行ったとして、 ■A. 生活満足度×家族の人数の相関  まず、家族の人数と、生活満足度を、シンプルにピアソンの相関係数で測った場合、-0.16程度しか出てきませんでした。5000人で、-0.16であれば、弱い相関は確実にあり、p値も、0.001以下になりました。  ただ、調整済み決定係数は、0.1未満…。正直、かなり弱い相関で、今ひとつインパクトに欠けるデータです。 ■B. 平均生活満足度×家族の人数の相関  また、少しデータの見方を変えて、家族人数が1人の時、2人の時、でそれぞれ、生活満足度の平均をとってやったとします。(この場合の「平均」はシンプルに算術平均をとりました。) 1人の時の平均生活満足度:4.5 (n=1500) 2人の時:4.4 (n=1000) 3人の時:4.3 (n=1400) 4人の時:4.2 (n=600) 5人の時:4.1 (n=300) 6人の時:4.0 (n=200) 7人の時:3.9 (n=100) というようなことが、わかりました。 このとき、 「平均生活満足度」と、「家族の人数」で、 相関をとればキレイに「-1」になるかと思います。 回帰曲線も、キレイな線が引けます。 ---------------------------- 【質問の本題】 ---------------------------- 質問の本題は、B.平均生活満足度×家族 の分析のほうになります。 B.の分析で、確かにキレイな数字は出てくるのですが、 こういった形で、分析をしてしまうと、 実際には、5000人のデータを取得しているにも関わらず、 300人ぐらいのデータでも、同じ平均が出てきたら同じ結果になってしまうかと思います。 それぞれのサンプル数が、500人いる場合とで、 サンプル数が10人いる場合とで、行うべき検定等の手法が異なってくるのではないかと思うのですが、 この場合、どのような処理を行うのが適切なのでしょうか。 ご指導お願い出きましたら幸いです。 よろしくお願いいたします。

  • 少ない母数に対するアンケート調査の統計的意義

    論文作成の中で非常に特殊な職業の方を対象としたアンケート調査を検討しております。 この職業の方は全国に60名程しか存在せず、そのうちアンケート調査できそうな人数は30名です(最悪20人)。 疑問点は (1)このような非常に母数の少ないアンケート調査による場合、統計的に有意なデータが得られるのでしょうか? (2)個々のデータの処理方法はどうしたら良いのでしょうか。例えば、年収400万前後が10人、600万円台が5人、一千万円台が15人というデータが出た場合に、一般の職業の年収と比較して高額であると主張するには、どのような手法でデータ処理をすれば良いのでしょうか。 私は統計学を体系的に学んだことはありませんが、どうか御指導よろしくお願いします。

アクセスLEDの点灯について
このQ&Aのポイント
  • 昨日、電気店で購入したSGD-MY040UBKという商品をJ:COMのチューナー(XA401)に接続したところ、J:COMの電源を切ってもアクセスLEDなどのランプが点灯し続けています。この状態に問題はあるのでしょうか?
  • 購入したエレコムのSGD-MY040UBKをJ:COMのチューナー(XA401)に接続したところ、アクセスLEDが点灯し続けています。J:COMの電源を切ってもランプが消えません。この状態についてご意見をいただきたいです。
  • 商品名SGD-MY040UBKを購入して、J:COMのチューナー(XA401)に接続しましたが、アクセスLEDが点灯したままです。J:COMの電源を切っても点灯し続けるのは正常な状態なのでしょうか?アドバイスをお願いします。
回答を見る