• ベストアンサー

統計の定義

ややこしい質問ですが、分る方、お答え下さい。よろしくお願いします。 A君=35点、B君=40点、C君=25点、D君=30点、E君=25点、F君=85点 の場合平均点は40点ですが、F君を除く5人の平均点は31点となります。 解釈として、難しい問題だったが6人中1人高得点を取るものも居る。と私は考えます。 併しいつも同じ様に勉強しているF君が、85点、90点、90点、25点、75点、80点 と来た場合の25点は、偶然的な要素高く、統計から除外する。同様に同じ工場から同じ条件で製作された製品のうち6個に一つは跳びぬけて、性能が良い(悪い)場合などは統計から除外する。 この様な統計的な考え方を発表されているような方はおられないのでしょうか。 実際、Aグループは生の状態、Bグループにある事を施し、効果を計るという実験をしております。で本来同じ様な結果が出なければ行けない筈のAグループにそういう何個かに一個、極端に違う数値が出、困っております。 どんな些細なことでもかまいませんので、ご意見をお答え下さい。よろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
回答No.1

hachienokuさん、こんにちは 御存じであったら申し訳ありませんが、グループ内での極端に違う値(外れ値)が、本当に外れ値であるかを確かめる方法として、箱ヒゲ図があります。参考URLを参照して下さい! しかしながら、 A君=35点、B君=40点、C君=25点、D君=30点、E君=25点、F君=85点 という生データ(コントール)に、 例えば、この人たちに、ある訓練を行ったところ、 A君=75点、B君=65点、C君=71点、D君=82点、E君=61点、F君=93点という結果が得られたとすると、 それをそのまま、tー検定を行ってみたら、コントロールと試験後の結果の間に統計上有意な結果となりました。つまり、その効果は、グループ内のばらつきが問題とならないような効果がある事を示しています。 で、でも、もう、それはやってそうですね。。。 あとは、連数(試験する人の数)を増やす(ばらつきを薄める)のも、よいかと思いますが。。。 ではでは!

参考URL:
http://web.enshu-net.or.jp/w3/kobayashi/box-plot.htm
hachienoku
質問者

お礼

有難うございます。 私、ど素人なんです。すぐ調べさせて頂きます。

その他の回答 (3)

  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.4

 Aグループの中の飛び抜けた値を示すものってのは、考慮していないノイズ要因の影響を受けていると考えます。ノイズとは、要するにコントロールしていないもの、のことで、ホントにどうしようもない偶然もあるでしょうけど、あるヒトが測ると時々間違えるとか、特定の時刻、特定の器具、振動、取り扱い手順、汚染、なんか見過ごしている要因があるのかもしれない。  で、これは当面の検討とは別の問題と考えるのが良い。計算したいのはA群とB群それぞれの平均と分散です。その平均・分散を計算する際に、飛び抜けたのは「異常値」として捨てちゃうのです。物理実験などでしばしば行うのは、測定結果が例えば100個得られたとして、これらを大きい順に並べておいて、上位5%と下位5%を有無を言わさず異常値とみなして捨てる。残った90個のデータの平均・分散を使うんです。これが一つの処方です。もうちょっときちんとやるには、A群、B群の分布を調べて、検定で判断する。これはNo.3のご回答に触れてあるとおりです。(ただしもちろん、「A群・B群それぞれどのぐらいばらつきがあるか」を知りたいときにこの手を使ったのでは間違ってしまいます。)  さて、「当面の検討とは別の問題」の方ですけれど、放置しちゃいけません。取り扱いや計測方法やデータ処理のミスによる異常値ではないことが確かめられたとすると、「A群ではときどき生じる異常値が、『ある事を施』すことによって生じなくなる」ってことを意味しているかも知れない。例えば、A群:生卵を食べたときの人体の発熱量がまれに非常に高い。んでもB群:茹で卵にするとこのような異常は生じない、ということですと、サルモネラ菌がまれに付いてるけれど茹でれば大丈夫、という「発見」をしているのかもしれない訳です。

hachienoku
質問者

お礼

有難うございます。参考にさせていただきます。

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.3

 統計の問題というより、実際にどう処理するかだと、想います。学会に発表されるとかなら別ですが。  各群5例で、A群は10±8、B群は20±8なら、おそらく有意差はないでしょう。A群は10±1、B群は11±1なら、おそらく有意差はあるでしょう。これが、癌を宣告されてからの生存年数なら、有意差の無い前者の方法を選びます。  統計には、例数がおおければ、棄却検定によって、飛び離れた数字を棄却する根拠を得ることができます。   さて、極端に違う数字がでるのは、原因があるはずですから、その原因を探究するのが本筋ではないでしようか。飛び外れて良いのならば、全てそのものを目指し、悪いのならそのような不良品を出さないようにするのが現実的でしよう。  機械式の時計の組立ての工員で、凄い精度を出すことがいたそうです。その人は、汗が出ない人だったとか。たしか、セイコー社の話だったような気が。

hachienoku
質問者

お礼

参考になりました。有難うございます。 でも”癌”とは余程の専門家の方なんでしょうね。

  • bonnnou
  • ベストアンサー率36% (146/395)
回答No.2

統計の集計の方法には、いろいろあるようです。  たとえば、夏場に良く売れる製品を通年で、比較する時、夏場の数字だけが突出していると感じられれば、「季節調整」を行って、その毎月の数字の平板化を計ろうとします。  本当は、対前年比何ポイント増減とすれば、ある程度はカバーできるのですが、 やはり、通年毎月の数字の比較を行いたいときに、「季節調整」という手法は、使われて、います。  この「季節調整」の理論は、通産省(現経済産業省)が、MITI法(?)、 アメリカのセンサス局も、独自の理論を持っていたと記憶しています。  この「季節調整」を用いて発表している統計が、「鉱工業指数」だったと思います。  さて、あなたの方の問題ですが、「Aグループ」の平均値と、「Bグループ」の平均値で、比較すればよいと思います。  通常、他の平均的な数字とかけ離れた結果が発生する確率は、通常、両方のグループにおいて、同じであるからです。  もし、どうしても、片方のグループにだけ問題が発生するなら、それは、被検者(物)の抽出の方法に問題がある事が考えられます。  無作為に、被検物(者)を選び直す事と、  被検物(者)を変えて、幾度も行い、  数多くの、実験結果での平均値を比べるべきものだと判断します。

hachienoku
質問者

お礼

ありがとうございました。参考にさせていただきます。

関連するQ&A

専門家に質問してみよう