• ベストアンサー

変動係数は正規分布を前提?

変動係数の式にはSDが出てくることから、やはりその適用には正規分布を前提としているのでしょうか? 仮にそうだとしたら、正規分布以外の分布形の場合、変動係数に類似した指標はあるのでしょうか? どなたか教えてください。

質問者が選んだベストアンサー

  • ベストアンサー
  • solla
  • ベストアンサー率59% (45/76)
回答No.2

#1です。 > 不適当であると書かれています。 それは使い方によります。例えば非対称な分布で平均±SDのような書き方をしてもたいして意味を成さないのは明らかですし、先の回答にも書きましたが正規分布に従っているとは言えないような分布で平均±SDの範囲に約68%のデータが存在するような意味で用いれば、それは明らかに誤りです。要は正規分布を仮定した場合に成り立つことを仮定できない場合に適用するのが不適当なのです。 また、裾の重い分布で極端に大きいまたは小さい値が出やすい場合には、平均値やSDは中央値や四分位偏差に比べてその影響を受けやすくなりますがが、それが正常なデータ(つまり測定ミスとか記録ミス、他のデータと異質である等の理由で外れ値とはみなせない)である限り平均が位置の指標、SDがばらつきの指標としての意味を持つことに変わりはありません。データの数値が大きいところと小さいところで単純にそのばらつきの大きさだけを比較してよいのか?というところから出てきている変動係数も同様です。 誤解の無いように補足しておくと、これはどんな場合でも平均とSD(あるいは変動係数)だけを参照すれば済むと申している訳ではありません。必要に応じて中央値など他の指標も参照する必要はありますし、これらは何れか一つという択一的なものではなく、互いに不足している情報を補う関係のものであるとご理解ください。正規分布を仮定できないからといって平均とSD(あるいは変動係数)が使えなくなる訳ではないということです。

その他の回答 (1)

  • solla
  • ベストアンサー率59% (45/76)
回答No.1

関係ありません。SDは(平均も)別に正規分布を前提とした概念ではありません。したがって変動係数も同様です。単に正規分布に従うならそれらの意味が他の分布に比べて少し明確になるというだけです。ですから、変数が正規分布から外れている時に正規分布に従う時と同様の意味(例えば平均±SDに約68%のデータが存在するといった)で考えると誤りを犯しますが、それさえ間違わなければ別に正規分布に従っていなくても構いません。

mottocafe
質問者

お礼

ご回答ありがとうございます。 しかし統計の本を読むと、SDや平均は正規分布とかけ離れた分布形の場合、不適当であると書かれています。中央値やパーセンタイルでの表現の方が適当な分布形の場合でも、SDや平均を改めて算出し、変動係数を求めるなどということをしてもよいのでしょうか? たびたびすみません。。

関連するQ&A

  • 正規分布でないときピアソンの相関係数を使いたいのですが。

    文献には、ピアソンの相関係数は ・連続変数 ・正規分布に従う。 時に使い、それ以外はスピアマンの順位相関係数を使うとありますが、正規分布をとらないときピアソンの相関係数を使うと問題がありますか?心理学では正規分布の条件は無視した論文もあると聞いたことがあるのですが。どうしてもピアソンで行いたいので、もし、無視できるくぐりぬけかたがあれば教えてください。 都市の「汚染物質排出量」と「イオン濃度」のあいだで相関係数を調べました。 サンプル数は29で「イオン濃度」はおおまかに正規分布をとるのですが「汚染物質排出量」では中央が少なく正規分布をとりませんでした。 相関係数はそれぞれ、ピアソンは、0.67で、スピアマンでは0.56です。 ともにp<0.01水準で有意でした。 どうか、分かる方がいましたら教えてください。お願いします。

  • 正規分布=ランダムな現象?

    正規分布=ランダムな現象? ある実験における粒子の拡散係数のヒストグラムが正規分布になった場合、この粒子はランダムに運動しているといえるのでしょうか? 正規分布は実験自体の精度を示していると聞いたことがあるのですが、こういう解釈もできるのでしょうか? お詳しい方がいましたら、お教えください。

  • 正規分布によるもの

    「需要変動が正規分布に従う」というのはどのように考えればいいのか分かりません。 例えば 注文 需要量 納期 1  15  10/3 2  10  10/7 3  25  10/11 4  40  10/15 5  10  10/19 とあると、 平均μ=20、標準偏差σ=11.4 ですが、 これをどのように需要変動に応用すればいいのですか? もし注文3の需要量が変動するならば、どのように変動するのですか? よろしくお願い致します。

  • 変動係数について

    基礎統計量 変数名 平 均 最 大 最 小 標準偏差 変動係数 歪 度 尖 度 検体数 前日比 -0.001 0.043 -0.056 0.015 -22.181 -0.367 1.153 337 上記の場合変動係数はどのように解釈すればよろしいでしょうか? 度数分布表(前日比) 級 級下限値 級上限値 級中央値 度数 理論度数 差 累積度数 1 -0.06 -0.047 -0.054 3 0.396 2.604 3 2 -0.047 -0.034 -0.041 5 4.431 0.569 8 3 -0.034 -0.021 -0.028 22 25.854 -3.854 30 4 -0.021 -0.008 -0.015 59 75.63 -16.63 89 5 -0.008 0.005 -0.001 134 111.263 22.737 223 6 0.005 0.018 0.012 83 82.415 0.585 306 7 0.018 0.031 0.025 27 30.709 -3.709 333 8 0.031 0.044 0.038 4 5.74 -1.74 337

  • 標準偏差と正規分布との関係

     各サンプル値から平均値を引き算して,2乗して全て合計して,サンプル数で割ってルートして計算される標準偏差(σ)の式が成立する条件は,元となるサンプル値が正規分布に従うことが条件となるのでしょうか? 正規分布とσとの関係の説明はよく見るのですが,σを計算する上での前提が正規分布でないといけないかどうかという内容については,いろいろ検索しましたが見つけることができませんでした。  また,例えば対数正規分布に従う場合にはσの式が別途ありますが,どの分布にも当てはまらないランダムなサンプルの場合の標準偏差というのはどのように計算するのでしょうか?あくまでもある分布に近似的にあてはめて,その分布に対応する標準偏差の式を用いて計算するということが確率統計上常識なのでしょうか? 上記2点,超基本的なことが理解できていません。よろしくお願いします。

  • 正規分布による分析

    すみません、質問が複数あるので長文になります。 また当方、統計学については素人のため初歩的すぎる質問であったら失礼します。 前提:卒研でアンケート調査を行い結果を統計で分析することになりました。アンケート内容は「ある事項につき賛成~反対までを無段階で聞く」とうもので、その結果を正規分布にかけて5段階にわけ、各段階の割合を求める。というものです。 1:アンケート調査を行い結果を分析するにあたりそのアンケート結果が正規分布なのか検定する手段として、尖度、歪度は学んだのですが、この二つの検定方法はそれ以外の検定方法(カイ二乗検定など)に比べ信頼性に足るのでしょうか? 2:アンケート結果が正規分布にのっとらない場合、片端に偏ったり、中心が最少で両端に偏ったりした場合に、正規分布による分析をした時は信頼に足る結果は出ないという事になるのでしょうか? 3:上記のようなアンケート調査の場合に、正規分布にのっとらない場合に用いられる分布などがあれば教えていただきたいです。 以上、長文失礼しました。m(_ _)m

  • p値-正規分布

    以前の質問に付けたしができなかったので、こちらで聞かせてください。 p値を求める場合、対象の各群の母集団は正規分布をしているという前提でないといけないのですか。

  • N数が異なるデータの正規分布への適合度

    正規分布への適合度の指標を探しています。 N=100~200の複数のデータセットを正規分布等にあてはめた場合、異なるn数のサンプル同士で単純比較できる適合度の指標はありますか? なお、各種の適合度検定ではn数が変わると結果も変わってしまうので、今回探している指標とは違うと考えています。

  • 正規分布ではない分布について

    確率・統計の質問です。 正規分布を仮定すると平均値-2σくらいで 物理的にはありえない負の数をとる場合 (例えば含有率や面積率など) どういった分布を仮定すれば良いのでしょうか? なにか良い方法があれば教えてください。 β分布やΓ分布を使うのでしょうか?

  • 標準正規分布の使い方

    標準正規分布の使い方 「あるデータが正規分布に従うと仮定できる場合、このデータを標準化することで標準正規分布表を用いて確率を求めることができる」とのことですが、あるデータが正規分布に従うかどうか?はどのように判断するのでしょうか? よろしくお願いします。 統計