• ベストアンサー

平均偏差MDと標準偏差SDの理想と現実

平均値からの「偏差の絶対値の総和」を平均偏差 平均値からの「偏差の2乗和」を標準偏差と定義します。 この「偏差の2乗和」を最小にする定数は平均値で、 「偏差の絶対値の総和」を最小にする定数は中央値です。 まず一つ、このことを感覚的に理解できるのですが、証明することが出来ません。 どなたか出来る方はいらっしゃいますか? そして、 正規分布では中心に平均値がくるいう前提よりも、 中心に中央値がくるという前提の方が、正しいと思います。 度数的に中央に来るべきは平均値ではないからです。 たしかに、正規分布は理想の分布であり、平均値=中央値が前提ですが、 実際の有限サンプルを元に検定する際に、 その平均を中心に持っていくよりも、中央値を中心に持っていき、 標準偏差SDではなく、平均偏差MDを使用した方が、より理想的になると感じます。 この考えは間違っているでしょうか。

質問者が選んだベストアンサー

  • ベストアンサー
回答No.1

(1)二乗和の方は、S=Σ(xi-k)^2(i=1~n)として、kで偏微分して、∂S/∂k=-Σ2(xi-k)=0でΣxi=Σkなのでk=Σxi/nとなり、平均値が最小の条件です。(2)絶対値の和の方は、S=Σ|xi-k|ですが、ここで、xt<=k<=x(t+1)とすると、S=(2t-n)k-Σxi(i=1~t)+Σxi(=t+1~n)で、kで偏微分して、∂S/∂k=2t-n=0でt=n/2なので中央値が最小の条件に成ります。

thisis2wakei
質問者

お礼

有難うございます。 同じようなところまでは考えられたのですが、 (質問してからもずっと考えてました) (2)絶対値編で、偏微分する際に、 t(正確にはXt)を定数のように扱ってますが、 これは、kの動きによって変化するので、 tをkで表す必要があるように感じました。 Xt<=k<=X(t+1)なので、 XiをN次変数だと仮定し、積分するといった動作が必要な気がするのですが。。。 定数と置いていいものでしょうか。 ご返答有難うございます。

thisis2wakei
質問者

補足

tをkの関数で表さねばならないという考えは誤りでしょうか?

その他の回答 (1)

回答No.2

私も以前、同じような悩みを持ったことがあります。 当時、学生で、教授に聞いたりもしたものですが、 初めに使った人がそうであったから、という答えでした。 ですが、No1さんの回答が正解だとすれば、 理論的にSDを使わなければならないということになりますよね。 偏微分をする際に、下で言うkの値とtの値を考慮しなければならないとしても、 xの変動そのものがN次式だとは限らないわけですし、 お二人ともアプローチはいいのでしょうが、どこか違っている気がします。 かといって、どうすればいいかはわかりません。(すみません) 非常に気になります。。。

thisis2wakei
質問者

お礼

有難うございます。 もう少し、回答頂けるのを待とうかと思います。 出版されている教科書等も読んで見たのですが、 やはり、視点が少しずれているためか、これといった解答が見当たりません。

関連するQ&A

  • 標準誤差と標準偏差の違いは何?

    誤っているのはどれか? 1. 算術平均値とは対象群のすべての変量の総和をその対象群の総数で徐したものをいう 2. 2集団の平均値が同じであっても2集団を構成する標本の分布が等しいとはいえない 3. 集団の標本が正規分布している場合、平均値±標準偏差の範囲には標本中の約68.27%が抱合される 4. 集団における平均誤差の絶対値は常に標準誤差の絶対値より大きい 5. 正規分布する標本数の等しい2集団において、標準偏差の絶対値が等しければ平均誤差の絶対値も等しい ――――-―――――――------------------------------------- このような問題を考えています。 自分なりに答えを出すと・・・・・・ 1. 算術平均値とは対象群のすべての変量の総和をその対象群の総数で徐したものをいう →(○)正しい。  定義どおりだと思います。 小学校で習った平均値ですね。 2. 2集団の平均値が同じであっても2集団を構成する標本の分布が等しいとはいえない →(○)正しい。 極端な例が混ざれば平均値は同じでも、バラツキがちがう 3. 集団の標本が正規分布している場合、平均値±標準偏差の範囲には標本中の約68.27%が抱合される   →(○)正しい。 そのとおり標準偏差(SD)のSD±1は68.27%である。 SD±2はたいか95%くらいでしたっけ。 SD±3は99.9%くらいだね。 つまりバラツキの度合いに占めるパーセンテージだと。 4. 集団における平均誤差の絶対値は常に標準誤差の絶対値より大きい →(○)正しい。 これがうさんくさい。 でも、私の持論によると・・・・・ ■SEχ(標準偏差の平均値)=σ/ √n     σは標準偏差です。 ■SDχ(標準誤差の平均値)=s/ √n      sは限られたサンプルより抽出した標準偏差の「予想値」です。                          そしてnはサンプルのサイズ(数)です。 つまり、標準偏差(SD)は国勢調査などで「全員」の数が把握できている場合であり、標準誤差(SE)は、大阪のミナミの繁華街の商店街の「全員」ということで つまり、 ■SEχ(標準偏差の平均値)=σ/ √n          →σ/ √日本の総人口 ■SDχ(標準誤差の平均値)=s/ √n          →s/ √大阪ミナミの商店街の人口 ・・・・ということで分母が小さくなりますから、 1/1000 と 1/10 では、1/10がおおきいですね。 つまり、調査の数が少ないと、誤差も大きくなるとそういうわけで、 誤差の絶対値は標準偏差よりも高くなるというわけです。 ですから一見この選択肢が誤りに見えますが、実は正しいのだと思います。 間違っていればどこがまちがっているか教えてください! 5. 正規分布する標本数の等しい2集団において、標準偏差の絶対値が等しければ平均誤差の絶対値も等しい →(○)正しい。 そのとおり。 本物と同じだから誤差も無い

  • 標準偏差について

    ある正規分布(標準偏差a)に従う集団からある正規分布(標準偏差b)に従う集団を引いたもの(または足したもの)の正規分布の標準偏差cは、aとbを用いてどのように表せるのでしょうか? 確か数式があったと思うのですが、ど忘れしました。 平均はただ足しただけだったと思うのですが、 標準偏差は足してルートとったりとかしてたような気が… ネットで調べてもうまく見つからないので、 覚えている方がいればお願いします。 稚拙な説明で申し訳ありません。

  • 標準偏差について

    下記、アドバイスをお願いします。 前提:標準偏差=データの各観測値と平均との差の2乗の平均を取って、その平方根を取った値。正規化された形で表されたデータのばらつきを示す数値。 1.0.86 2.4.4 3.-0.72 4.0.44 5.1.57 6.1.13 7.-1.70 8.-0.58 上記の平均は、0.86←これは、理解できます。 上記の標準偏差は、1.86←これが、分かりません。 上記の標準偏差に対する比率0.36←これも、分かりません。 標準偏差・標準偏差に対する比率の出し方の指南をお願いします。 宜しくお願いします。

  • 平均値、標準偏差、幾何平均、幾何標準偏差の推定

    数学素人でさっぱり意味が分かりません。 分布なのですが、一部書き込みます。 A  累積分布  確率密度 1   0.0009329 0.0009329 2  0.0012776 0.0003447 4  0.0023306 0.0010530 6  0.0040988 0.0017682 8  0.0069518 0.0028531 10  0.0113821 0.0044303 ~   ~     ~ 28  0.4085144 0.0898605 30  0.5000000 0.0914856 32  0.5882070 0.0882027 ~   ~     ~ 68  0.9995101 0.0002532 70  0.9996741 0.0001640 80  0.9999535 0.0002795 100 0.9999989 000000453 Aを正規分布で近似した場合、平均値と標準偏差の推定 Aを対数正規分布で近似した場合、幾何平均と幾何標準偏差の推定 エクセルにデータ入れて計算しようとしてるのですが、方法が分かりません。どのように計算すれば良いのでしょうか?全く知識ないのですみませんが御教授してください。(何か計算に足りない物があれば指摘下さい)

  • 標準偏差と正規分布との関係

     各サンプル値から平均値を引き算して,2乗して全て合計して,サンプル数で割ってルートして計算される標準偏差(σ)の式が成立する条件は,元となるサンプル値が正規分布に従うことが条件となるのでしょうか? 正規分布とσとの関係の説明はよく見るのですが,σを計算する上での前提が正規分布でないといけないかどうかという内容については,いろいろ検索しましたが見つけることができませんでした。  また,例えば対数正規分布に従う場合にはσの式が別途ありますが,どの分布にも当てはまらないランダムなサンプルの場合の標準偏差というのはどのように計算するのでしょうか?あくまでもある分布に近似的にあてはめて,その分布に対応する標準偏差の式を用いて計算するということが確率統計上常識なのでしょうか? 上記2点,超基本的なことが理解できていません。よろしくお願いします。

  • 分布からみた 標準偏差、標準誤差について

    はじめまして。よろしくお願いします。 さまざまな標準偏差、標準誤差についての投稿をみましたが、 分布から見た場合標準偏差と標準誤差とはどのようになるのでしょうか? データのサンプルをとり、それを正規化し、分布にあらわすと正規分布に限りなく近づいてくると思います。(これには中心極限定理がかかわっていると思います) そこでその分布の山の幅(というのでしょうか?)が標準偏差になっていると思うのですが、標準誤差とはどこを表すものなのでしょうか? また標準誤差をあらわすにあたって、中心極限定理を使ってあらわすことはできるのでしょうか?

  • 平均値の標準偏差

    とある画像処理に関する論文を読んでいて次のような記述があったのですが分からない点があったのでどなたか教えてください。(簡単にまとめてあります。) 「ノイズのある画像を複数回撮影し、その平均値をとることでノイズ成分を小さくすることができる。ノイズ成分が正規分布の場合、標準偏差σと測定回数n回の平均値の標準偏差σ1は以下で記述される。 σ1=σ/√n 」 この記述に関して、 1.ノイズ成分が正規分布の場合しか、上記式は適用できないのでしょうか。ランダムノイズの場合でも平均化できるような気がするのですが・・・。 2.またなぜ、測定回数の平方根に反比例するのでしょうか。 3.上記式では測定回数nを多くすれば平均値の標準偏差σ1は0に近づきますが、この数値はいくつくらいならいいのでしょうか。0に近いほど母集団の平均値を推定できているということまでは分かったのですが、どのくらいの数だったらいいという閾値や評価基準みたいなものはあるのでしょうか。 以上、どなたかご回答お願いします。

  • 標準偏差の問題です

    平均値U=10、標準偏差α=2となる正規分布で、任意に取り出した1つが8と16 との間に入る確率を標準正規分布表より求めなさい。

  • 平均値で求めた標準偏差と最小二乗法で求めた標準偏差

    10個のデータの平均値から求めた標準偏差と、グラフを用いた最小二乗法から求めた標準偏差の2パターンで対象の不確かさを求めたのですが、求めた2つの値は大きく異なりました。 この2つの値の違いの原因は何なのでしょうか? よろしくお願いします。

  • 幾何平均と幾何標準偏差について

    科学で質問した者ですが、統計学的な疑義なので、こちらで質問させていただきます。 ある施設を50箇所拭取り検査を行い、一般細菌数を算出し、評価を行います。 一般細菌数の対数は正規分布に近似します。 そこで、分布を調べる為に幾何平均値と幾何標準偏差を求めるまでは、理解できたのですが、 評価機関から示された「幾何平均値×幾何標準偏差」の意味がわかりません。 いわゆる正規分布では、期待値±標準偏差の範囲に68%入ってくると習いましたが、幾何平均値の 場合はどうなのでしょうか。 御教示よろしくお願いします。