• ベストアンサー

算術平均に対する標準偏差は、幾何平均に対する?

度々お世話になります。よろしくお願いいたします。 さて現在、ある課題を10回繰り返し、それに要した時間について 3つほどのグループで比較するグラフを作成しようとしています。 (例えば、ABCと3つのグループで、それぞれに属する人が  同じテストを10回行い、その所要時間を測定します) 図中の横軸にはグループの別を、縦軸には所用時間をプロットします。 このとき、所用時間は個人差が大きいので、各人の中央値を取って、 その幾何平均を示したいと思っています。 ここで、ひとつ困ったことが発生しました。 私は、算術平均を用いるのであればグループ内のばらつきを示すために 標準偏差を添えて図示しているのですが、今回は記述の通り幾何平均を 用いたため、何を添えれば良いのかを知りません。 自分で調べてみたところ「幾何標準偏差」なる用語を見つけたのですが この正体もわからず、上述の用途に使えるものか判別できませんでした。 また、下記URLの説明文中には、 「誤差は正負ともにつけるべきです。なぜかというと血中濃度の個体差は対数席分布すると言われているため、幾何平均を用いる人もいます。その場合対数プロットした際のSDは正負同じ長さです。算術平均で求めたSDは正負で長さが異なります。つまりSDの長さで、幾何平均か算術平均か図をみればわかるのです。」 というコメントがあります。 http://www.geocities.co.jp/Technopolis-Jupiter/2752/geobook.html 標準偏差を算術平均で求める場合と幾何平均で求める場合というのは、 私の質問と関係があるのでしょうか。 あるいは対数プロットする場合の話であって、関係ないのでしょうか。 すこし質問が長くなりましたので、まとめます。 まず 1. 幾何平均した際に示す「ばらつき」の指標は何が適当か という点についてご存知であれば、ご教授いただければと思います。 また、 2.標準偏差を幾何平均で出す場合は、算術平均の場合と何が違うのか ということにつきましても、ご教授いただければ大変有難いです。 些細な情報でも結構ですので、よろしくお願いいたします。

質問者が選んだベストアンサー

  • ベストアンサー
  • age_momo
  • ベストアンサー率52% (327/622)
回答No.3

#2です。書き足りませんでしたね。すみません。 >この文中のsは、標準偏差(standard deviation)でよろしいでしょうか。 >また、mは平均(mean)、eは自然対数lnの底(2.7182818) >でよろしいでしょうか。 はい、その通りです。 なお、e^m=Gm,e^s=s'とすると e^(m+s)=e^m*e^s=s'Gm e^(m-s)=e^m/e^s=Gm/s' となります。

Caryo_t
質問者

お礼

ご返事が半月も遅くなってしまいました。申し訳ございません。 ご回答、ありがとうございました。 また、 >e^(m+s)=e^m*e^s=s'Gm >e^(m-s)=e^m/e^s=Gm/s' > 追加のご教授、ありがとうございました。 大変勉強になりました。 今後、また質問させていただくことがあるかと存じますが、 その節にも何卒よろしくお願いいたします。

その他の回答 (3)

  • Ishiwara
  • ベストアンサー率24% (462/1914)
回答No.4

#1さんのコメントで、すべて十分だと思います。 計算尺ってご存知ですよね。大きい数になるほど目が詰まっているモノサシです。実は、片方の軸だけそうなっているグラフ用紙が市販されています(片対数方眼紙という)。それを使っデータをプロットしてみます。そのとき、ヒストグラムが大きくゆがんでいるようでしたら、幾何平均でもあまりお勧めできません。がまんできる程度のゆがみなら幾何平均を使ってください。

Caryo_t
質問者

お礼

ご回答ありがとうございます。 お礼を申し上げるのが遅くなり、申し訳ございません。 対数グラフで表したところ、やや歪んでいましたが、何とか許容 できるものと思われましたので、幾何平均を使うことにいたしました。 システムの都合上、ポイントに反映させることができませんが、 大変感謝しております。 ご教授、ありがとうございました。

  • age_momo
  • ベストアンサー率52% (327/622)
回答No.2

正規分布についてはいいですかね。 度数分布をとれば平均値を中心にして左右対称に釣鐘状になる分布です。 対数正規分布は各値の対数をとって度数分布をとれば正規分布になる 分布のことです。生データは左右対称ではなく、片方に広く伸びていきます。 データをとって幾何平均を取ったということは普通に算術平均を とったら数は少ないけど極端に大きなデータに足を引っ張られて 最頻度データあたりに算術平均が来なかったのでしょうかね。 で、幾何平均を取ったということでしょうか。 では、幾何平均はどういう値か考えて見ましょう。 Gm=(a_1*a_2*・・・・*a_n)^(1/n) 両辺の対数をとれば lnGm=ln(a_1*a_2*・・・・*a_n)^(1/n)=1/n*ln(a_1*a_2*・・・・*a_n) =1/n*(lna_1+lna_2+・・・・+lna_n)              ln:自然対数 要は各データの対数をとって算術平均したものにほかなりません。 幾何平均をとったということは『何となく』対数正規分布に従っていると 仮定されたのでしょう。 標準偏差もこの対数をとった値で求めればいいです。 ただし、得られたsに対して元のデータに戻してバラツキを表すときは e^(m+s),e^(m-s)を計算してください。計算して見れば分かりますが、 e^mつまりGmに対して上下は等しい大きさにはなりません。 リンクされているURLもこのことを言っています。 これらはあくまでもとったデータが対数正規分布に従っていると思われる 場合だけですが。。。

Caryo_t
質問者

お礼

ご回答ありがとうございます。 非常に明快にご教授いただきましたので、 対数の算術平均が幾何平均になるという原理がわかりました。 また、標準偏差を幾何平均で取ると、上下が等しくならない ということにについても、解決の端緒を得ることができました。 しかし、このような質問をさせていただいた事にも現れておりますが 私は数学的な基礎が疎かとなっておりますので、 略記号の理解に自信がありません。 そこで、いくつかの記号につきまして確認をさせていただけますよう お願いいたします。 さて、ご回答の文中には、 >ただし、得られたsに対して元のデータに戻してバラツキを表すときは >e^(m+s),e^(m-s)を計算してください。計算して見れば分かりますが、 > という部分がございますが、 この文中のsは、標準偏差(standard deviation)でよろしいでしょうか。 また、mは平均(mean)、eは自然対数lnの底(2.7182818) でよろしいでしょうか。 ご多用中、瑣末なことをお伺いして恐縮ですが、 何卒ご回答いただけますよう、お願い申し上げます。   

noname#44733
noname#44733
回答No.1

よくは知らないですが、私が思うには、対数をとればその算術平均によって幾何平均の意義をもたせることができるので、対数をとって普通に処理するのがいいと思います。

Caryo_t
質問者

お礼

ご回答ありがとうございます。 対数の算術平均が幾何平均になるということが解っていませんでした。 元データを対数に変換して、その標準偏差を取るのですね。 勉強になりました。ありがとうございました。

関連するQ&A

  • 幾何平均と幾何標準偏差について

    科学で質問した者ですが、統計学的な疑義なので、こちらで質問させていただきます。 ある施設を50箇所拭取り検査を行い、一般細菌数を算出し、評価を行います。 一般細菌数の対数は正規分布に近似します。 そこで、分布を調べる為に幾何平均値と幾何標準偏差を求めるまでは、理解できたのですが、 評価機関から示された「幾何平均値×幾何標準偏差」の意味がわかりません。 いわゆる正規分布では、期待値±標準偏差の範囲に68%入ってくると習いましたが、幾何平均値の 場合はどうなのでしょうか。 御教示よろしくお願いします。

  • 平均値、標準偏差、幾何平均、幾何標準偏差の推定

    数学素人でさっぱり意味が分かりません。 分布なのですが、一部書き込みます。 A  累積分布  確率密度 1   0.0009329 0.0009329 2  0.0012776 0.0003447 4  0.0023306 0.0010530 6  0.0040988 0.0017682 8  0.0069518 0.0028531 10  0.0113821 0.0044303 ~   ~     ~ 28  0.4085144 0.0898605 30  0.5000000 0.0914856 32  0.5882070 0.0882027 ~   ~     ~ 68  0.9995101 0.0002532 70  0.9996741 0.0001640 80  0.9999535 0.0002795 100 0.9999989 000000453 Aを正規分布で近似した場合、平均値と標準偏差の推定 Aを対数正規分布で近似した場合、幾何平均と幾何標準偏差の推定 エクセルにデータ入れて計算しようとしてるのですが、方法が分かりません。どのように計算すれば良いのでしょうか?全く知識ないのですみませんが御教授してください。(何か計算に足りない物があれば指摘下さい)

  • 幾何標準偏差の求め方

    6つの数値 23,30,34,14,11,18 の、幾何平均と幾何標準偏差をExcelで算出したいのです。幾何平均はGEOMEAN関数で算出することが出来ましたが、幾何標準偏差はどのような関数を用いれば良いのでしょうか?

  • 関数電卓で幾何平均と幾何標準偏差

    作業環境測定士の講習で関数電卓を使用する問題が試験に出るのですが、 関数電卓をふだん使わないので打ち方がわかりません。 関数電卓 カシオ fx-JP900で、次のデータで幾何平均と幾何標準偏差を求めるには どう打てばよいでしょうか。 データ  23, 30, 34, 14, 11, 18 幾何平均  20.1 幾何標準偏差 1.55

  • 関数電卓での幾何平均・幾何標準偏差の求め方。

    こんにちは。関数電卓を用いた幾何平均・幾何標準偏差の求め方が全然わかりません。ご存知の方、アドバイスをください。使用電卓はCASIOのfx-912MSです。よろしくお願いします。ちなみに、標準偏差は求められます。

  • 標準誤差と標準偏差の違いは何?

    誤っているのはどれか? 1. 算術平均値とは対象群のすべての変量の総和をその対象群の総数で徐したものをいう 2. 2集団の平均値が同じであっても2集団を構成する標本の分布が等しいとはいえない 3. 集団の標本が正規分布している場合、平均値±標準偏差の範囲には標本中の約68.27%が抱合される 4. 集団における平均誤差の絶対値は常に標準誤差の絶対値より大きい 5. 正規分布する標本数の等しい2集団において、標準偏差の絶対値が等しければ平均誤差の絶対値も等しい ――――-―――――――------------------------------------- このような問題を考えています。 自分なりに答えを出すと・・・・・・ 1. 算術平均値とは対象群のすべての変量の総和をその対象群の総数で徐したものをいう →(○)正しい。  定義どおりだと思います。 小学校で習った平均値ですね。 2. 2集団の平均値が同じであっても2集団を構成する標本の分布が等しいとはいえない →(○)正しい。 極端な例が混ざれば平均値は同じでも、バラツキがちがう 3. 集団の標本が正規分布している場合、平均値±標準偏差の範囲には標本中の約68.27%が抱合される   →(○)正しい。 そのとおり標準偏差(SD)のSD±1は68.27%である。 SD±2はたいか95%くらいでしたっけ。 SD±3は99.9%くらいだね。 つまりバラツキの度合いに占めるパーセンテージだと。 4. 集団における平均誤差の絶対値は常に標準誤差の絶対値より大きい →(○)正しい。 これがうさんくさい。 でも、私の持論によると・・・・・ ■SEχ(標準偏差の平均値)=σ/ √n     σは標準偏差です。 ■SDχ(標準誤差の平均値)=s/ √n      sは限られたサンプルより抽出した標準偏差の「予想値」です。                          そしてnはサンプルのサイズ(数)です。 つまり、標準偏差(SD)は国勢調査などで「全員」の数が把握できている場合であり、標準誤差(SE)は、大阪のミナミの繁華街の商店街の「全員」ということで つまり、 ■SEχ(標準偏差の平均値)=σ/ √n          →σ/ √日本の総人口 ■SDχ(標準誤差の平均値)=s/ √n          →s/ √大阪ミナミの商店街の人口 ・・・・ということで分母が小さくなりますから、 1/1000 と 1/10 では、1/10がおおきいですね。 つまり、調査の数が少ないと、誤差も大きくなるとそういうわけで、 誤差の絶対値は標準偏差よりも高くなるというわけです。 ですから一見この選択肢が誤りに見えますが、実は正しいのだと思います。 間違っていればどこがまちがっているか教えてください! 5. 正規分布する標本数の等しい2集団において、標準偏差の絶対値が等しければ平均誤差の絶対値も等しい →(○)正しい。 そのとおり。 本物と同じだから誤差も無い

  • 標準偏差の幅の算出法を教えて下さい

    統計については素人です。 標準偏差の幅の算出法がわかりません。 算術平均から求める標準偏差と、幾何標準偏差の2種について、簡単に教えて頂けませんか。 また、エクセルでの算出法も教えて下さい。 データの見方がわからなくて、困っています。

  • 標準偏差と平均偏差の違い

    標準偏差と平均偏差は、数字としての意味は何が違うのでしょうか。(算出方法の違いなどは分かります) 換言すれば、平均偏差でもサンプルのばらつきが表現できるのに、わざわざ計算過程をややこしくして標準偏差を求めることにどのようなメリットがあるのかということです。 『数種類の検体を用いて同一行程の実験を行い、その結果の値の揺れ(ばらつき)を求めたい』 このレポートへのアプローチとして、平均偏差または標準偏差を利用するとき、両者が意味的にどのような違いをもつのか、ご教授ください。

  • 比率(%) の平均値を算出する場合、算術平均値、幾何平均値、調和平均値のいずれが適切でしょうか。

    比率(%) の平均値を算出する場合、 算術平均値、幾何平均値、調和平均値の いずれが適切でしょうか。 例えば次のデータがある場合、エクセルで各々の 種類の平均値を算出すると求められる答えが 変わってきます。明日までに上司に提出する レポートで、比率の平均値を記載しなくては、 ならないのですが、いろいろなサイトを調べて もいまいち自信が持てません。助けて下さい。 ちなみに数値(%)は物流諸掛(ある貿易取引中の 最終確定金額中において、どれくらいの割合、 搬送費用が占めているのか) を表しています。 宜しくお願い致します。 (例) 1.222 % 1.210 % 1.204 % 1.159 % 3.232 % 1.762 % 1.112 % 1.299 % 1.122 % 1.611 % 1.284 % 算術平均 1.474 % 幾何平均 1.396 % 調和平均 1.346 %

  • 標準偏差について

    標準偏差について調べていたところ、↓のような説明がありました。 「標準偏差とは、バラツキをあらわす目安です。例えば、製品の長さを測定した結果、40、50、60、70、80cmだったとします。 バラツキを見るために、個々のデータから平均値60を引きます(偏差)。 40-60=-20 50-60=-10 60-60=0 70-60=10 80-60=20 -----  計 0 全体的なバラツキを見たいのですが、このまま加えたのでは、ゼロです。そこで、偏差を2乗します。 (40-60)^2=400 (50-60)^2=100 (60-60)^2=0 (70-60)^2=100 (80-60)^2=400 -----  計 1000 このままでは、データ1個あたりのバラツキがわかりませんから、データ数で割って、平方根を取ります。これを標準偏差といいます。 標準偏差=ルート(1000/5)=14.1 この製品は14.1cmのバラツキがあるということです。」 この説明を読んで、なぜ偏差を2乗してから平方根を取ってデータ数で割っているのかがわかりませんでした。そんなことをしなくても、データ1個あたりのバラツキを求めるのであれば、各偏差の絶対値を足してデータ数で割ればいいのでは?と考えてしまいます。その場合の値は12となり、上記説明の方法で求めた14.1とは異なりますが、この2者間にはどのような関係があるのでしょうか?よろしくお願いします。