• ベストアンサー

アンケートの統計をどうするか

zinchanの回答

  • ベストアンサー
  • zinchan
  • ベストアンサー率49% (97/197)
回答No.1

 kimeruloveさんは、アルバイト先の繁盛を図るため、仮説として改築・修繕を行い、設備の充実をもって客を増やせるのではないかと考えておられます。  しかし、それをプレゼンして認めさせるためには、個人の思いつきではなく第三者が納得できるデータが必要で、そのためには統計を取って説明する必要があるとお考えですね。  ここまでの考え方はとてもよろしいかと思います。  しかし、仮説を検証するためのアンケート設問の例や調査規模、調査手法等が残念ながら仮説を実証するためのレベルになっておりません。  まず、目的は婚礼数を増やすための方策であり、バイト先の上司に説明できるためのデータを取る必要があることから、アンケートという手法でデータを取るのであれば、あなたの仮説に対する設問を設定する必要があるでしょう。また、婚礼数を増やすための方策でもあるので、対象者は婚礼を控えるカップルを対象にすることで説得力のある統計がとれるでしょう。さらに重要な点としてアンケートを取る期間と費用は、データ採取数の限界を生じますからそれらについても考慮する必要があります。  例えば、仮説として「婚礼数を増やすためには設備を整える必要がある」とした場合、設問項目として、 Q1 婚礼を考えるカップルにお伺いします。結婚式は行いたいですか? 1 Yes 2 No 3 考えていない。わからない(結婚式を行う必要性を考えているかどうか) Q2 Q1で1と回答した方に伺います。結婚式はどのような形式で行いたいですか? 1 挙式と披露宴および新婚旅行 2 挙式のみ行い披露宴は行わない 3 挙式は行わず、新婚旅行を行う。 4 特におおがかりに行わず、小規模のパーティーを行う 5 特に何も行わない(どのような規模を考えているか) Q3 披露宴はどのくらいの人数を呼びたいですか? 1 10人未満 2 30人未満 3 50人未満 4 100人未満 5 100人以上 Q4 Q2で5以外の回答をした方に伺います。それらを行うとしたらどこで行いたいですか。 1 国内のシティーホテル 2 海外のホテルもしくは教会等 3 結婚式専門会場 4 レストラン 5その他(どのような場所を想定しているか) Q5 結婚式場・披露宴会場はどのような設備があるといいと思いますか?具体的にお書き下さい。 (Q4,Q5が仮説にかかる質問になると思いますがもっと答えやすくて分析しやすい、いい質問方法をご自分でお考え下さい) Q6 上記の会場の場合、どのくらいの費用がかかると思いますか? 1 10万円未満 2 50万未満 3 100万未満 4200万未満 5 200万以上(予算規模はどのくらいと考えているか) Q7 挙式・披露宴、新婚旅行のための貯蓄はありますか?いかほどありますか? 1 10万円未満 2 50万未満 3 100万未満 4200万未満 5 200万以上(本人による費用の捻出は可能か) Q8 予算は本人の他、援助してくれる方はいますか? 1 両親 2親族 3友人 4その他 5いない(本人以外に費用捻出してくれる人がいるか) Q9 Q7で5以外の回答をされた方に伺います。どのくらい費用を出してくれそうですか。 1 10万円未満 2 50万未満 3 100万未満 4200万未満 5 200万以上(援助額はいくらか) Q10 新婚旅行はどこに行きたいですか。 1 国内旅行 2 海外旅行 3 特に予定無し Q11 新婚旅行費用はどれくらいを考えていますか。 1 10万円未満 2 50万未満 3 100万未満 4200万未満 5 200万以上  等、対象者が具体的にイメージを浮かべることができ、対象者が順序立てて考えられるような質問と質問の並べ方(順序)を設定する必要があります。質問として、披露宴の料理予算はいくらくらいまで出せるか、引き出物予算はなど、具体的に考えられるような質問を並べられれば親切でしょう。また、ほとんどの対象者をカバーできるような回答選択の構成にすることも重要です。質問を対象者本人が考える規模・レベルや予算、予算の出所、挙式・披露宴・新婚旅行・新生活の費用等、項目分けをそれぞれ行い、分析しやすいように設営することが重要です。ホテルの立地条件や知名度についても場合により必要な設問項目になるかもしれません。さらに、回答を分析できる設問構成でなければ、分析できません。あなたが例として挙げてある質問は、設問構成が披露宴と新婚旅行の選択・予算の捻出先等が多重化してしまい、どのような理由でそれを選択したかいろいろな理由が考えられるため分析しようがありません。また予算額が不明なため、どのような対策を取ればいいかこれまた分析できません。  アンケート対象者はカップル(男女別)に取り、回答で援助者が多い場合は援助者となる対象者(結婚適齢期を迎える子を持つ年齢層)にも対象を広げる必要が出るかもしれません。  次に、分析手法ですが、アンケートの設問構成により、また異なる質問に対する回答どうしの組み合わせ方により異なります。  例えばQ1ではYESかNOかを問う質問ですので、アンケートデータを集計して1標本2類別の二項分布による比率検定を行うのが適しています。期待値はY・Nとも50%ずつと仮説を立て、統計分析ソフトで95%有意水準を取れば、どのような分布になるかを見ることはできます。また、Q3やQ6の質問は、規模を順序化してますので、集計データをグラフ化し、ピークとなる分布域を把握し、最多域を知ることに使えます。  Q7とQ9は、合計額で考える必要があるでしょうから合算したりそれぞれ集計したりして表やグラフにして傾向をみて分析する必要があるでしょう。統計処理は質問と回答の種類、選択数により自ずと決まってきます。回答数は選択数が多くなると統計で有意差が出にくくなりますのでできるだけシンプルに、少なくすることが重要です。  ご質問からにわかに例を立ててみましたので上記の回答は適切でないものも多分に含まれていると思いますが、あなたがこうしたいという目標と、目標を達成するための仮説を立てる、仮説が正しいかどうかが反映されるようなアンケート質問を全て揃え、大学の先生や友人に見てもらい、検討・再構成をし、調査期間と費用算出見積もりを行い、また同時に統計処理が可能な最小人数を見積もり(一概に言えませんが、重要な質問では20~30人くらい取れば統計にかけることはできます。有意差が出るかどうかは回答の分布によるのでわかりません。すくなくとも10人くらいの回答がないと統計にかける意味がないと思います)、調査する必要があります。ここまでできれば仕事として6割片付いたと考えてもいいでしょう。アンケート質問はいつ、どこで、誰を対象に、どのように調査するかをきちんと設定しないと無意味になってしまいます。特にどこで、誰を対象にという項目は無作為化するためにまんべんなく調査しなければいけないので抽出がとても難しいのです。  心理学科であれば、統計の講座や統計学の講師がいる可能性がありますので、アンケートの基礎から統計手法の選択、集計方法・分析の見方等についてアドバイスをくれる人がいると思います。なるべく具体的な構想を話してみた方がいいかと思います。  これをとっかかりに、いろいろと勉強してみてください。

kimerulove
質問者

お礼

ありがとうございます。 大変参考になりました。 全ての問を、全て同じ方法で解析は出来ないということですね。 それを見定めた問を作らなければいけないと感じました。

関連するQ&A

  • 多元配置の分散分析?

     3種類の音楽をそれぞれ数十人ずつ、それぞれ別々の音楽を一定時間鑑賞してもらい、4回採血(鑑賞前、3H後、6h後、12H後)しデータの音楽による効果や差を見たいと思っています。(同じ人での音楽の比較のデータはとれませんでした。音楽なしの群のデータはとれています) この場合はどのような順序で分析をすすめていったらいいのでしょうか? SPSSのソフトを使い、本を何冊か見ながらやっていましたが、ほんの例と当てはまらずに、自分の解釈で進めようとしてもさっぱり分からず、指導していただる予定の上司が病に倒れどうしようもなくなっていした。お忙しいところをすみませんが、ご指導をよろしくお願いいたします。

  • t検定

     よろしくお願いします。  ある製品に対する調査をしたところ,平均3.19(標準偏差0.71) この製品にある改良を加えたところ,平均3.50(標準偏差0.76)になりました。(標本数36)  t値は,(3.5-3.19)/(0.76/36の平方根)と本に載っていました。((0.76/36の平方根)は標準誤差ですね。)この計算をすると2.45になります。  有意水準を5%とすると,Excelで=TINV(0.05,35)という計算により,2.03を得ました。得られたt値2.45は有意水準の2.03より大きいので,有意差有りと考えました。  そこで質問です。 1 以上の計算はあっているでしょうか。 2 SPSSというソフトで計算をしたらt値が2.93になったと言われたのですが,SPSSというソフトはどのような計算をしているのでしょうか。(私はSPSSを使ったことがありません。) 3 私が参考にした本によれば,標準偏差は改良後のものを使えばよいことになっていましたが,改良前のものを使うと数学的な意味がどのように変わるのでしょうか。(もっとも同じ集団の改良前,改良後ですから,標準偏差が大きく変化することはないのでしょうが…) 4 改良前の平均-自由度35のt値×標準誤差~改良前の平均+自由度35のt値×標準誤差 改良後の平均がこの範囲にないから有意差があるという考え方は,数学的に問題があるでしょうか。  以上,要領を得ないかも知れませんが,よろしくお願いいたします。   以上3点よろしくお願いいたします。

  • 統計物理に関する質問

    統計物理の問題でどうしてもわからない問題があります。 非常に初歩的な問題かもしれませんが、ご指摘よろしくお願いします。 問題は、『スピン1/2のN個の粒子を考える。スピンが上を向く確率をpとするとき、磁気モーメントのゆらぎ<(ΔM)**2>はいくらになるか。ただし、N個の粒子は統計的に独立であるとし、1粒子の磁気モーメントの大きさをmとする。』というものです。 私のやり方は以下の通りです。 (1)簡単のため、1粒子系を考えました。 確率pが与えられているので、磁気モーメントの平均値を <M>= mp + (-m)(1-p) <M**2> = (mp)**2 + {(-m)(1-p)}**2 と求め、ゆらぎを <(ΔM)**2> = <M**2> - <M>**2 = 2p(1-p)m**2 と求めました。 しかし、これをN粒子系に拡張することがどうしてもできません。 (2)キッテルの「熱物理学」の第1章では、 N数を、アップスピンの数とダウンスピンの数に分けて、両者の差(スピン差)を2sとおいて、状態数(ガウス分布になる)を計算し、'<(2s)**2>=N'と求めていました。正味の磁気モーメントは2smなので、 <(ΔM)**2> = <(2sm)**2> - <2sm>**2 = Nm**2  ??? これでは、確率pが一切考慮されていません。 ◆ちなみに、解答は4Np(1-p)m**2です。 ここでお願いです。私のやり方の誤りは何なのか、 どのような対処をするべきなのか、ご指摘をお願いします。

  • リフォーム見積もり金額、同じ条件なのに70万近い差があるのは…?

    何社かにリフォームの見積もりをしていただきました。 リフォーム内容は、主に 1)4.5畳+押入れの和室→1坪ユニットバス&洗面・脱衣所に改築 2)汲み取りトイレ→水洗トイレに(壁・床・ドア等全面的にリフォーム) 3)台所の床下の補強 で、ユニットバス(定価115万)やトイレ(定価20万)、洗面台(定価21万)の型式はこちらで指定しました。 一応予算は300万ということでお願いしてあるのですが、見積もり金額に一方は290万、一方は358万と、70万近い差があって驚きです。 一体どこにそんな差が…?と思って見積もり内容を見比べたのですが、どうやらユニットバス等が定価からいくらくらい割り引かれているか…で30万位の差は出ているようなのです。 他には“仮設トイレ”や“養生費??”“大工手間”“現場片付け・清掃費”“工務店経費”などもあり、安い方にそれらは書かれていませんでした。 また、床下の補強に関しては、安い方は“サービス”で、高い方は“5万”でした。(これは内容に差があるかもしれませんね。) こうも違うと安い方は素人には分かりにくい部分で手を抜いている?(基礎がしっかりしていない等)考えてしまいます…。 しかし問題ないのならもちろん安い方が良いですし…。 70万も違いますと(^^; 何か、上手な見積もり内容の比べ方とかあるのでしょうか。アドバイスいただけましたら幸いです。よろしくお願いします。

  • 統計学的なアンケートの取り方

    統計学的なアンケートの取り方 キーボードのタイプ方法をいくつか用意してタイプミス率を計測する実験をしています。 その際どの程度の人数に調査を行えば信頼できるデータとなるか悩んでいます。 統計学的な上手い手法があれば教えてください。 出来ればそのアンケート方が詳しく書かれている論文等の文献も添えていただけると助かります。 どうかよろしくお願いいたします。

  • アンケート統計学

    統計学になると思うのですが、 アンケートを実施した結果。 例として、 駅からの距離100m では満足度が 3       駅からの距離300m では満足度が 4       駅からの距離500m では満足度が 2 となるようなアンケートの結果から、満足度が高いと想定される距離○mは、どういった解析手法で求めたら良いのでしょうか。

  • モンテカルロとノンパラメトリック検定

    こんにちは、いつもお世話になっています。 今回はモンテカルロ推定について質問させていただきたいと思います。 SPSSを使って統計処理をしています。対応のない2群の検定でノンパラ(mann-whitney / wilcoxon検定)で計算したら有意差が出ました。オプションで、モンテカルロや正確確率推定ができるのですが、これは何のためですか?いろいろ調べてみましたが、モンテカルロは乱数を発生させて母集団の数を水増し(?)する方法のように感じました。例数が足りない場合はそれでやるということなのかもしれませんが、普通にやって差が出たものに対して、さらにモンテカルロを使うのはあまり意味がないでしょうか? あえて使いたいと思っているわけではないのですが、妥当な推定方法を使用したいと思っている者です。仔細にわたる数式には疎いですが、多少の統計の経験ありです。よろしくお願いします。

  • 結婚式会場が決まらない(名古屋・長文)

    生まれも育ちも兵庫で仕事で名古屋に来て、名古屋で結婚することになりました 親や妹を呼ぶため、便利なようにホテルでの結婚式を考えています (家族のみの挙式・披露宴です) 生粋の名古屋人でしたら、親戚の結婚式などでご家族や親戚が利用されてホテルなどの話を聞くことが多いと思います 私は、ほとんど知らないため、口コミの情報で探してますが、なかなか難しいです(企業の口コミサイトはあまり悪い意見を載せないように感じました) 決まらない理由としては、家族のみ挙式・結婚式なので、どこで見積もりをとってもらっても変わらないということです 衣装の値段をそろえて、見積もりを計算すると以下のようになります ・マリオット120万 ・ウエスティン110万 ・ヒルトン100万 ・東急ホテル100万 ・観光ホテル80万 親たちの宿泊費や留袖、モーニングの衣装代や挙式中のスナップなどこれ以上は要らないという項目を見積もりに盛り込みました 安くて色々込みで48000円で挙式があげれるところで見積もりを取ると、やっぱりオプションがかかるそうで、普通の式にして宿泊代や食事会のセッティングをして見積もりをとると80万くらいかかりました それで、二人とも萎えて、安くできそうなところを探すのをやめてしまいました コレぐらいの差ならいいじゃないか、私の気に入ったところであげたらいいよと彼は言ってくれましたが、どこがいい?といわれてもピンときません(強いていえば、ウエスティンかなぁくらいですがその選択にも自信がないです) 名古屋っ子や、名古屋に詳しい人ならどこにしますか? これ以外にもおすすめのホテルがあれば教えて下さい

  • 数学で次の問題の解答方法を教えて下さい。

    3つの正の整数があり、小さい方から順にA,B,Cとします。 これらの中からあらゆる2つの整数の組を選んで和と差(大きい方の数から小さい数を引いた差) を計算すると次の通りになりました。 2,25,26,27,51,53 これについて次の問いに答えなさい。 (1)A+Cはいくらですか? (2)A,B,Cの値をそれぞれ求めなさい。

  • 統計解析 相場分析 T-検定 エクセル SPSS

    2つの母集団の平均差に有意差があるかを調べるためエクセルでT検定をしましたところ、ある異変に気づきました。 メニューの「ツール>分析ツール」で等分散を仮定した2標本による検定を選ぶと、"配列1"と"配列2"に各々の集団を入れることになります。ところが、それぞれの欄に入れる集団の順番を入れ替えると両側有意確率が.05以下だったものが、.05以上になってしまい、有意差の有無の結果が間逆になってしまいます。 分析の概要は以下のとおりです。 (F検定で等分散は確認済み) 標本1: 火曜日を除外した某先物の寄値-引値の価格差(デイトレードの成績) サンプル数→489個 (期間'00-'07年。母集団のサンプルは1970個) 平均値:647 標本2: 火曜日だけのデイトレ成績 サンプル数→88個 (期間'00-'07年。母集団のサンプルは1970個) 平均値:3215 2つの集団の平均差:2568 ****************************** 分析結果にみられる矛盾 >>>>>>>[標本1]を配列1にすえた場合<<<<<<< t-検定 : 等分散を仮定した2標本による検定 かよう以外 かよう 平均 646.8844483 3214.899617 分散 201365586.2 157505681.3 観測数 489 88 プールされた分散 194729391.9 仮説平均との差異 2568 自由度 575 t -3.178472095 P(T<=t) 片側 0.000780042 t 境界値 片側 1.647508725 P(T<=t) 両側 0.001560084 t 境界値 両側 1.964099283 >>>>>>>>[標本2]を配列1にすえた場合<<<<<<< t-検定 : 等分散を仮定した2標本による検定 かよう かよう以外 平均 3214.899617 646.8844483 分散 157505681.3 201365586.2 観測数 88 489 プールされた分散 194729391.9 仮説平均との差異 2568 自由度 575 t 9.38710200484845E-06(質問者が換算→0.00094%) P(T<=t) 片側 0.499996257 t 境界値 片側 1.647508725 P(T<=t) 両側 0.999992514 t 境界値 両側 1.964099283 ************************  以上のようにT値のあたい自体もかわってしまうのです。本で計算式を調べても違いは出ないはずなのに(統計初心者です。まちがってたらゴメンナサイ)どうしてでしょうか。サンプル数もしくは平均値の大きさによって、配列1,2に入れる順番を変えるべきなんでしょうか。おそらく右側検定とか、左側検定とかの概念と関係しているのかもしれませんが、本やネットで調べても判然としません。  ちなみに月、火、水、木、金と曜日別に成績をわけ、SPSSで一元配置の分散分析(ANOVA)、Welch検定, Brown-Forsythe検定, ボンフェローニの多重比較表でも確認したところ、曜日間に有意差はみられませんでした。  どうしてエクセルでは、配列の順番により結果が変化するのか、どなたさまかぜひ教えてください。統計初学者なので、珍妙なことを申し上げてるかもしれませんが寛大なご教示のほどよろしくお願いいたします。