• ベストアンサー

標準偏差を求める際のデータ数について

統計初心者ですが、この度アンケート調査を行い、その結果報告書を作成しなければならないのですが、データ数9の場合、平均、最小、最大に加え、標準偏差も記載しようと思っていますが問題はないでしょうか? 標準偏差は、データが30、50以上ないと意味がないということを聞いたことがあるので戸惑っています。 また問題ない場合、「データ数が少ない場合は補正係数を掛ける」という説明を見かけたのですが、これは単に算出した標準偏差に補正係数を掛けて、記載すればいいのでしょうか? この場合の記載の仕方などについても教えていただけないでしょうか。

質問者が選んだベストアンサー

  • ベストアンサー
回答No.1

標準偏差を求めることは,特に問題はありません。 ただ,データ数が少ないとばらつき具合が正しいかどうかの判断に困るというだけです。 補正係数については,条件によって変化する場合,例えばアンケートだと男女差や年代等による差異を軽減するためには使えますが,質問を見る限りは補正をする必要はないと思います。 標準偏差の意味を知る意味でも,正規分布について調べてみることをおすすめします。

casino30
質問者

お礼

ありがとうございます。 あくまで「参考として標準偏差を記載」という形で位置づけでよろしいのですね。 補正係数についても理解が深まりました。 あらためてありがとうございました。

その他の回答 (2)

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.3

 標準偏差は、バラツキを示すので、小さいほど有りがたい。  小さくするには、データ数を増やすのが一番。 9例で、目的を果たせるのなら、十分です。  標準偏差で、補正係数、なんぞの単語は経験していません。補正係数の違った意味があり、私が単に不勉強かもしれません(白々しく謙虚に書いておきます)。  気になるのは、アンケート。1は大変良い、・・・、5は大変悪い、なんぞの数値の平均、標準偏差でない、すなわち、このような順序尺度ではなく、間隔尺度か比例尺度なら、問題はありません。  順序尺度の場合は、統計学的な代表値として、中央値が適切。平均値は、不適切です。老婆心(ジジイですが)まで。統計は、習うより慣れろ、イロイロ突っ込まれて慣れて下さい。

casino30
質問者

お礼

ありがとうございます。 これを機会に勉強させていただきます。 ごていねいにありがとうございました。

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.2

 標準偏差は、2例でも出せますが、現実には3例あれば、意味を持ちます。学術論文も3例で通っています。 >「データ数が少ない場合は補正係数を掛ける」  全てのデータなら、単に標準偏差で、誰が計算しても同じになります。  しかし、全てのデータが利用できない場合、例えばクラス全員の標準偏差を求めたいときに、欠席者がいた、だと、欠けたデータを考慮した推定値で代替するしかありません。それを補正係数と、紛らわしい表現を使っていると考えます。  ここで、明確に意識して欲しいのは、統計ではクラス全員の標準偏差(この場合の母標準偏差)が必要だということ。誰かが休むたびに狂ってくる標準偏差なんぞは、知りたい人はいないでしょう。  しかし、欠席者がいるので、データが欠けている、計算できない、困った、で考えだされたのが、不偏標準偏差です。これば、あくまでも欠席者のデータに配慮した母標準偏差の推定値。n(データ数)で割らずに、n-1で割ることにより、幅が広くなるので、母標準偏差はこの範囲に入っているハズ、なんだそうです。  なぜn-1が適切であって、n-2でも、n-3でないのかは、数学的に証明できるそうですが、私の理解力を超えています。  標準偏差については、対象者(=母集団)全てのデータがあるなら母標準偏差、欠けているなら不偏標準偏差(=推定値)で代替し、表示します。ただし、海外の論文などは、不偏標準偏差ではなく標準誤差で表現する場合が多いので、要注意。

casino30
質問者

お礼

ありがとうございました。 >標準偏差は、2例でも出せますが、現実には3例あれば、意味を持ちます。学術論文も3例で通っています。 ということは、今回の場合、9例なので十分ということでしょうか? 度々の質問で恐縮ですがよろしくお願いします。 また、補正係数について、詳しくご説明して頂きありがとうございます。 より理解が深まりました。

関連するQ&A

  • 標準偏差の計算について教えてください。

    確率統計が超苦手なのですが,計算しなければなりません。よくわからないので教えてください。 例えば, 数:10 平均:1.1 標準偏差:0.05 数:5  平均:1.2 標準偏差:0.03 数:20 平均:1.05 標準偏差:0.1 が与えられたとき,どのようにして計算すれば,全体の標準偏差が算出できますか?

  • 標準偏差の幅の算出法を教えて下さい

    統計については素人です。 標準偏差の幅の算出法がわかりません。 算術平均から求める標準偏差と、幾何標準偏差の2種について、簡単に教えて頂けませんか。 また、エクセルでの算出法も教えて下さい。 データの見方がわからなくて、困っています。

  • 標準偏差の出し方を教えてください

    レポート(アンケート分析)を提出したら、 標準偏差も出すように言われたのですが、 出し方がわからなくて困っています。 以下の場合、エクセルで標準偏差を出すには どうしたらいいでしょうか。教えてください。 アンケート: 30の質問に対して、50人にアンケートを実施。 「1非常にあてはまる 2あてはまる 3どちらでもない 4あまりあてはまらない 5全くあてはまらない」の5件法で答えてもらった。 現段階: エクセルで次の2つの表を作りました。 1.縦軸回答者番号、横軸質問番号でデータを1~5で入力。 2.各質問の回答(1~5)数を集計。 平均値を出した。((C3*1+D3*2+E3*3+F3*4+G3*5)/50) 2.を使って、標準偏差を求める場合、 どういう計算式を出せばいいのでしょうか。

  • 標準偏差とデータ数から平均値が求まるか

    子供の通っている塾の模試で、子供の得点、順位、受験者数、偏差値はわかっています。 塾内での位置を把握するために、講師から標準偏差の値をもらいました。しかし、平均値を聞くのを忘れました。 直接聞けばよいのですが、平均値、標準偏差とも公表しておらず、特別にもらったので頼みづらいのです。 上記データから平均値を求めることは出来ますか。 過去ログを検索したところ、順位及び受験者数から正規分布にのっとり、(1-順位/受験者数)の確立を標準偏差とし偏差値を求める方法がありました。 これを利用すれば出来るのですが、これ以外の方法はないのでしょうか。

  • 支持率およびその標準偏差の求め方が分からず困っています。

    統計の問題です。 有権者3785人について支持政党に対する世論調査を行った結果、 A、B、C、Dの各政党を「支持する」と答えた人がそれぞれ、 1578人・1061人・454人・267人であった場合の各政党の支持率及びその標準偏差を求めなさいという問題があるのですが、どのように算出すればよいのか分かりません。特に標準偏差が・・・。

  • 母標準偏差について教えてください

    統計をあまりよくわかっていないので教えてください。 標本の平均、サンプル数、標準偏差 母集団の平均はわかっています。 この状態で母標準偏差を出す方法を教えてください。 よろしくお願いします。

  • 標準偏差について

    最近、統計の勉強を始めたのですが、分からない問題があります。 試験の得点xの平均をx-、標準偏差をSxとすると 変量u=(x-x-)/Sxについて、uの平均と標準偏差Suを求めよ。 答えは、uの平均が0、標準偏差が1になるようです。 ぜひ教えてください!

  • 【数学・標準偏差σ】標準偏差のσ(シグマ)は全部の

    【数学・標準偏差σ】標準偏差のσ(シグマ)は全部のデータの標準偏差とサンプル抽出データの標準偏差は等しくなるそうですが、全部のデータから平均を出すのが難しい膨大な数のデータだから標準偏差を用いると書かれていたのに、標準偏差を導き出すのに全部のデータから標準偏差を出して、さらにサンプルから標準偏差を2度出しした方が計算処理は負荷が大きいのでは? 全てのデータから標準偏差を出すなら最初から全部のデータから平均を出したらよいのでは?

  • 標準偏差について確認してください。

    あるデータについて検証しているのですが、標準偏差の項目がわかりません。 実データ (x1、y1)=(0.4 、 0.987923349) (x2、y2)=(0.2 、 0.489910377) (x3、y3)=(0.1 、 0.24074934) (x4、y4)=(0.05 、 0.124348729) (x5、y5)=(0.025 、 0.060968171) (x6、y6)=(0.0125 、 0.029057754) 相関係数 0.9999842835 式(最小二乗法) y=ax + b(原点(0、0)を含む)     a=2.469160646     b=-0.001643755 標準偏差 0.00280 となってます。 相関係数とか式はエクセルで確認できたのですが、標準偏差のみ確認できません。たぶん実データyと最小二乗法でもとめた計算数の差をもとめているのだと思うのですが・・・(xのデータはこちらの方で調整してあるのでyのみ実験で測定しました) 質問がたりずに申し訳ないです。補足をつけますので不足データなどあったら申しつけてください。

  • 標準偏差について

    標準偏差について調べていたところ、↓のような説明がありました。 「標準偏差とは、バラツキをあらわす目安です。例えば、製品の長さを測定した結果、40、50、60、70、80cmだったとします。 バラツキを見るために、個々のデータから平均値60を引きます(偏差)。 40-60=-20 50-60=-10 60-60=0 70-60=10 80-60=20 -----  計 0 全体的なバラツキを見たいのですが、このまま加えたのでは、ゼロです。そこで、偏差を2乗します。 (40-60)^2=400 (50-60)^2=100 (60-60)^2=0 (70-60)^2=100 (80-60)^2=400 -----  計 1000 このままでは、データ1個あたりのバラツキがわかりませんから、データ数で割って、平方根を取ります。これを標準偏差といいます。 標準偏差=ルート(1000/5)=14.1 この製品は14.1cmのバラツキがあるということです。」 この説明を読んで、なぜ偏差を2乗してから平方根を取ってデータ数で割っているのかがわかりませんでした。そんなことをしなくても、データ1個あたりのバラツキを求めるのであれば、各偏差の絶対値を足してデータ数で割ればいいのでは?と考えてしまいます。その場合の値は12となり、上記説明の方法で求めた14.1とは異なりますが、この2者間にはどのような関係があるのでしょうか?よろしくお願いします。