- ベストアンサー
標準偏差の出し方
アンケート結果のデータ分析をしているんですが、回答のばらつきを標準偏差(数値が高いほどばらつきが高い)で表すことができるようなんですが、出し方がよくわかりません。 以下のような場合、どのように標準偏差を出したらいいのでしょうか。 エクセルでの出し方をご存知の方がいらっしゃいましたら、ご教示ください。 よろしくお願いします。 例) アンケートの回答の仕方:1番~5番で回答。 1と回答した人:9名 2と回答した人:17名 3と回答した人:3名 4と回答した人:2名 5と回答した人:2名
- みんなの回答 (8)
- 専門家の回答
質問者が選んだベストアンサー
1.まず、このように回答を集計してしまっては駄目です。元データそのものを使って分析をする習慣を付けてください。 33人分のデータですから、A列に氏名をいれ、B列に回答を入力します。 A列 B列(アンケートの回答) 太郎 1 次郎 2 三郎 4 花子 2 ・ ・ 以下33番目の人まで。 で、後は、stdev関数を使うだけです。上記の場合で言うと、 STDEV(B1:b33) と入力すれば、標準偏差は出ます。同様に、 c列に別のアンケートの集計を入力してやれば、個々の アンケートの標準偏差は出ます。 2.さて、このような質問を出すということは学部生ですね。 一応、忠告をしておきますが、この種のアンケート の回答(これを順序尺度または質的変数と言います) に標準偏差を適用することは意味がありません。 間違いとは言いませんが、無意味です。 アンケート回答データの分散を「敢えて」調べる場合は KirkのDを使います >回答のばらつきを数値化して示すために、よく使われている手法 まぁ、確かにそういう論文が(私の分野でも)あることは事実です。 統計手法は、よく誤用されます。書く方も読む方も統計の 素人ですから(私は、教育関係の研究者)、よく分から ないまま、何となく納得してしまうのです。 これは、私達の分野でもよくある話で、専門の統計学の 先生から笑われたりします。 例えば、t検定をやっているのに、分布の正規性を 確認していない、とかね。 3.どんな本でも良いですから、統計の基本が書いてある本を まず読んでください。どんな本でも、こうした順序尺度 に、「標準偏差を用いることが普通」、などと書いてあるはずが ありません。 最初の方に書いてあるはずですから、立ち読みでも結構。 利用する手法は 基本統計量 クロス集計 χ2乗検定 その上で、モデル化をして、乖離係数を出すのが普通でしょう。
その他の回答 (7)
- hukuponlog
- ベストアンサー率52% (791/1499)
ついでですが、一言。 まともな論文を書くつもりなら、せめてR程度は使いましょう。 統計解析をエクセルでやる、なんてのは素人かよほどの達人が することです。 さもなければ、SPSSなどのソフトを購入するように研究室の 先生にお願いすることです。
- masudaya
- ベストアンサー率47% (250/524)
まずは,先ほども回答しましたとおり,集計することを考えてアンケートは作るべきです.と前置きして例えばアンケート自体を数値化しておく,"点数を付けてください."としておけば,そのまま処理が可能です.実際には個人の点数の付け方には辛い,甘いがあるので人数をかなり増やす必要がある.また各人の平均点をあわせるように各人の点数をスライドさせる.(平均点が一定と考えられるようにアンケートの設計が必要:つまり集計には直接使わない設問を設けるということ)具体的にはアンケート全体の平均点を求め,各人の平均点もこの点数に等しいと考えて,各人の答えに点数を加減算をして,新たな点数として標準偏差を求める.という方法が考えられます. この手の,話は意味微分(SD)法などが関係あるかもしれません.この辺は詳しくは無いので,キーワードで検索されてはいかがでしょうか.
このようなアンケート結果で標準偏差は使わないと思います。 1~5の回答があるわけですが、それは数字ではなくA~Eの回答だったとします。 そうすると標準偏差を求める意味がないことがわかると思います。 ただYESを1、NOを0とすることで 1~5までの各々の標準偏差を計算することができるとは思います。 例:1を選んだ人についてYes;9人、No;残りの24人 1が9、0が24として計算して0.4522・・・となります。 ですがこの標準偏差にあまり意味がないように思います。
お礼
回答ありがとうございます。 このようなアンケートで回答のばらつきを数値化して示すために、よく使われている手法です。 以下、私がしているアンケートと同様のアンケート分析です。 http://www.jpf.go.jp/j/japan_j/publish/bulletin/02/pdf/04.pdf ここでも、アンケートの質問、一問ずつについて標準偏差を出していますが、その計算方法がわかりません。
- masudaya
- ベストアンサー率47% (250/524)
回答がどのようなものでしょうか. 例えば 1.赤 2.黄色 3.青 4.緑 5.紫 という回答アンケートの場合どうにも集計できないのではないでしょうか.それよりも,アンケートはどのように集計するかも決めて作るものです.アンケートをとったあとでどう集計しようか考えるのは,大切な情報を聞き落としている可能性があるため,本来やってはいけないことです. そういうだけではなんなので,何とかして各回答項目を点数化にしてください.そうすれば,前に述べた方法で算出可能です.回答を数値化しないで集計結果を数値化するのはかなり難しいと思います. 回答になっているでしょうか.
お礼
質問内容が伝わりにくいようですので、似ている分析をしているものを例にさせていただきます。 http://www.mext.go.jp/b_menu/houdou/18/07/06071911/001/009.htm 3-1.の2の文章にありますが、(以下) 『次に、「たいへん」との回答を4点、「少し」を3点、「あまり」を2点、「まったく」を1点として平均値を算出した。したがって、平均値が2.5点以上であれば、プラスの評価であることを示している。また、回答のばらつきを示すために標準偏差も計算して示している。』 ここでも標準偏差を出していますが、エクセルでの標準偏差(STDEP)のセル範囲が何になっているのかがわかりません。 このような分析例と同様に 1.強く同意する 2.同意する 3.どちらでもない 4.あまり同意しない 5.まったく同意しない という回答選択肢があり、1~5をそれぞれ1~5点として計算し、平均値と標準偏差を求めたいのですが、その方法がわかりません。 このような分析方法(回答のばらつきを標準偏差で表す)は、よく使われているんですが・・・。
- masudaya
- ベストアンサー率47% (250/524)
標準偏差の出し方自体は難しくなく. 各値xiから値の平均値mを引いたものの二乗を足し合わせて 値の個数nで割り,平方根を取ったものです. (不偏分散とか細かいことを言うと割り数がn-1とかになりますが,nが大きければnもn-1も大差ないです.) 式で書くと ((x1-m)^2+(x2-m)^2+(x3-m)^2+・・+(xn-m)^2)/n の平方根をとれば良いわけです. ただ,質問のようなアンケート回答の場合, 答えの1から5が連続性のある回答の場合は問題ないですが (1.すごく良い 2.良い 3.普通 4.悪い 5.すごく悪い などの答え) そうでない場合は,何を集計しているのか分からなくなる場合があります.なのでご注意ください.
お礼
回答ありがとうございます。 実は、ご指摘いただいたような回答の場合のばらつきを調べたいんですが、そのような場合どうしたら数値として出るのでしょうか。
- abyss-sym
- ベストアンサー率40% (77/190)
参考URLを見てください。
例) アンケートの回答の仕方:1番~5番で回答。 1と回答した人 9 名 2と回答した人 17 名 3と回答した人 3 名 4と回答した人 2 名 5と回答した人 2 名 =STDEV(B4:B8) 6.503845017 ・・・データはB4:B8でやってみました 引数を標本と見なし、標本に基づいて母集団の標準偏差の推定値を返します
お礼
回答、ありがとうございます。 ご説明、よくわかりました。