• ベストアンサー

統計の定義

ややこしい質問ですが、分る方、お答え下さい。よろしくお願いします。 A君=35点、B君=40点、C君=25点、D君=30点、E君=25点、F君=85点 の場合平均点は40点ですが、F君を除く5人の平均点は31点となります。 解釈として、難しい問題だったが6人中1人高得点を取るものも居る。と私は考えます。 併しいつも同じ様に勉強しているF君が、85点、90点、90点、25点、75点、80点 と来た場合の25点は、偶然的な要素高く、統計から除外する。同様に同じ工場から同じ条件で製作された製品のうち6個に一つは跳びぬけて、性能が良い(悪い)場合などは統計から除外する。 この様な統計的な考え方を発表されているような方はおられないのでしょうか。 実際、Aグループは生の状態、Bグループにある事を施し、効果を計るという実験をしております。で本来同じ様な結果が出なければ行けない筈のAグループにそういう何個かに一個、極端に違う数値が出、困っております。 どんな些細なことでもかまいませんので、ご意見をお答え下さい。よろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
回答No.1

hachienokuさん、こんにちは 御存じであったら申し訳ありませんが、グループ内での極端に違う値(外れ値)が、本当に外れ値であるかを確かめる方法として、箱ヒゲ図があります。参考URLを参照して下さい! しかしながら、 A君=35点、B君=40点、C君=25点、D君=30点、E君=25点、F君=85点 という生データ(コントール)に、 例えば、この人たちに、ある訓練を行ったところ、 A君=75点、B君=65点、C君=71点、D君=82点、E君=61点、F君=93点という結果が得られたとすると、 それをそのまま、tー検定を行ってみたら、コントロールと試験後の結果の間に統計上有意な結果となりました。つまり、その効果は、グループ内のばらつきが問題とならないような効果がある事を示しています。 で、でも、もう、それはやってそうですね。。。 あとは、連数(試験する人の数)を増やす(ばらつきを薄める)のも、よいかと思いますが。。。 ではでは!

参考URL:
http://web.enshu-net.or.jp/w3/kobayashi/box-plot.htm
hachienoku
質問者

お礼

有難うございます。 私、ど素人なんです。すぐ調べさせて頂きます。

その他の回答 (3)

  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.4

 Aグループの中の飛び抜けた値を示すものってのは、考慮していないノイズ要因の影響を受けていると考えます。ノイズとは、要するにコントロールしていないもの、のことで、ホントにどうしようもない偶然もあるでしょうけど、あるヒトが測ると時々間違えるとか、特定の時刻、特定の器具、振動、取り扱い手順、汚染、なんか見過ごしている要因があるのかもしれない。  で、これは当面の検討とは別の問題と考えるのが良い。計算したいのはA群とB群それぞれの平均と分散です。その平均・分散を計算する際に、飛び抜けたのは「異常値」として捨てちゃうのです。物理実験などでしばしば行うのは、測定結果が例えば100個得られたとして、これらを大きい順に並べておいて、上位5%と下位5%を有無を言わさず異常値とみなして捨てる。残った90個のデータの平均・分散を使うんです。これが一つの処方です。もうちょっときちんとやるには、A群、B群の分布を調べて、検定で判断する。これはNo.3のご回答に触れてあるとおりです。(ただしもちろん、「A群・B群それぞれどのぐらいばらつきがあるか」を知りたいときにこの手を使ったのでは間違ってしまいます。)  さて、「当面の検討とは別の問題」の方ですけれど、放置しちゃいけません。取り扱いや計測方法やデータ処理のミスによる異常値ではないことが確かめられたとすると、「A群ではときどき生じる異常値が、『ある事を施』すことによって生じなくなる」ってことを意味しているかも知れない。例えば、A群:生卵を食べたときの人体の発熱量がまれに非常に高い。んでもB群:茹で卵にするとこのような異常は生じない、ということですと、サルモネラ菌がまれに付いてるけれど茹でれば大丈夫、という「発見」をしているのかもしれない訳です。

hachienoku
質問者

お礼

有難うございます。参考にさせていただきます。

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.3

 統計の問題というより、実際にどう処理するかだと、想います。学会に発表されるとかなら別ですが。  各群5例で、A群は10±8、B群は20±8なら、おそらく有意差はないでしょう。A群は10±1、B群は11±1なら、おそらく有意差はあるでしょう。これが、癌を宣告されてからの生存年数なら、有意差の無い前者の方法を選びます。  統計には、例数がおおければ、棄却検定によって、飛び離れた数字を棄却する根拠を得ることができます。   さて、極端に違う数字がでるのは、原因があるはずですから、その原因を探究するのが本筋ではないでしようか。飛び外れて良いのならば、全てそのものを目指し、悪いのならそのような不良品を出さないようにするのが現実的でしよう。  機械式の時計の組立ての工員で、凄い精度を出すことがいたそうです。その人は、汗が出ない人だったとか。たしか、セイコー社の話だったような気が。

hachienoku
質問者

お礼

参考になりました。有難うございます。 でも”癌”とは余程の専門家の方なんでしょうね。

  • bonnnou
  • ベストアンサー率36% (146/395)
回答No.2

統計の集計の方法には、いろいろあるようです。  たとえば、夏場に良く売れる製品を通年で、比較する時、夏場の数字だけが突出していると感じられれば、「季節調整」を行って、その毎月の数字の平板化を計ろうとします。  本当は、対前年比何ポイント増減とすれば、ある程度はカバーできるのですが、 やはり、通年毎月の数字の比較を行いたいときに、「季節調整」という手法は、使われて、います。  この「季節調整」の理論は、通産省(現経済産業省)が、MITI法(?)、 アメリカのセンサス局も、独自の理論を持っていたと記憶しています。  この「季節調整」を用いて発表している統計が、「鉱工業指数」だったと思います。  さて、あなたの方の問題ですが、「Aグループ」の平均値と、「Bグループ」の平均値で、比較すればよいと思います。  通常、他の平均的な数字とかけ離れた結果が発生する確率は、通常、両方のグループにおいて、同じであるからです。  もし、どうしても、片方のグループにだけ問題が発生するなら、それは、被検者(物)の抽出の方法に問題がある事が考えられます。  無作為に、被検物(者)を選び直す事と、  被検物(者)を変えて、幾度も行い、  数多くの、実験結果での平均値を比べるべきものだと判断します。

hachienoku
質問者

お礼

ありがとうございました。参考にさせていただきます。

関連するQ&A

  • どう検定すればよいか(具体的な統計データ有り)

    統計素人です。 論文作成にあたり、下記のとおりのデータがあります。 1,ある経験をしていないグループAと、したグループBでは、対象物Cに対する理解度は違うのか?を、ある態度尺度を用いて得点化しました。 2,Aの人数 13人    平均得点 59.38    分散 86.26 標準偏差 9.29 Bの人数 32人 平均得点 68.47    分散 55,61 標準偏差 7,46      です。 これら2つのグループ間に、統計的に理解度の有意な差があるのか検定するには、どのような方法をとればよろしいのでしょうか? まったくの素人で本当に申し訳御座いませんが、ご教授よろしくお願いいたします。

  • 2つのグループの得点上昇量について

    クラスを2つに分けて指導し(グループAとグループB)、それぞれの漢字テストの得点上昇を観察しました。 すると、 グループA(11名)の平均点は、プリテスト80点→ポストテスト90点 グループB(12名)の平均点は、プリテスト30点→ポストテスト60点 でした。 上昇得点がAは10点、Bは30点なので、Bのほうが指導効果があった、と言ってもよいものでしょうか? 高い得点になるほど、それ以上の得点に上昇させにくくなる、と聞いたこともありますし、AとBを単純に比較しても良いものでしょうか? 統計にお詳しいかたにご教示いただければ助かりますm_ _m

  • 統計?について

    こんばんは。 今度、10個ほどの作品に対して、20人ほどで品評をするのですが、 審査の結果の得点に隔たりが出てしまうことを懸念しています。 たとえば10点満点だとすると、Aさんは平均が5になるように得点を付けるが、Bさんは平均が8になるように得点を付ける、といったことが起きるのではないかと思うのです。 自分の作品に対しては自分自身は審査をしないというルールなので、 Bさんが審査をする場合としない場合とでは、総合得点に影響が 出てしまいます。 これを修正するためには、すべての人の得点に対して標準化を行えばいいと思っているのですが、間違いないでしょうか? また、それが正しいのだとして、 どのようにすればそれを手早く処理できるでしょうか? エクセルでもできると思うのですが、よくわかりません… あまり詳しく説明できていないかもしれません、すみません。 よろしくお願いします。

  • 【統計】2つデータが似ているか調べたいのですが

    私の手元に1グループ10人の構成員がいる2つのクラスA、Bに、各々同じ試験を行った得点データがあります。私の現場の感覚としてはAクラスとBクラスの実力は同じくらいだろうと感じていますが、それを統計の手法で数学的に示してみたいと思っています。Excelは持っているので使えます。 ちなみに、私の統計の基礎知識としては昔F分布、t分布など習ったが計算ばかりでどういうときに使ってどんな結果から何が言えるかなどは理解できていないレベルです。 お力添えいただきたく存じます。

  • 統計学の問題の解き方について教えてください

    大学で統計学を学んでいる者なのですが、以下の問題の解き方が わかりません。どなたかお教え頂けないでしょうか? 特に、こういった各得点が分からず、平均点が変化した場合の標準偏差 を求める問題が分かりません。 【問題】今回の期末テストの総合点は平均値700点、標準偏差 50点であった。 すべての生徒の得点が 25 点増えたとした場合、この総合点の(1)平均値と (2)標準偏差はいくらになるか? また、すべての生徒の得点が 10%増えたとした場合、この総合点の(3)平均値と(4)標準偏差は いくらになるか?

  • 満点の異なるテストの相関分析

    統計初心者です。ご教授をお願いいたします。 満点の異なる三つのテストの相関関係を見たいと 思っています。(例えば, テストA・・・30点満点で平均得点は25点, テストB・・・50点満点で平均得点は30点, テストC・・・70点満点で平均得点は65点) このような場合,以下の内のどの方法で相関分析を することが望ましいのでしょうか。 (1)テスト得点をパーセンテージ化して分析 (2)テスト得点をz得点化して分析 (3)テスト得点のまま分析 望ましいのは,(1)か(2)かと思っているのですが…。 なお,分析に使用する統計ソフトは,SPSS(Ver.17)です。 どうぞよろしくお願いいたします。

  • 統計に関する質問 2つの値を反映させる方法

    統計に関する質問です。 「能力A」という尺度があるとして、この尺度と他の「能力B」「能力C」との関連性を見たいと思っています。 「能力A」は2つの要素によって決定されます。それを仮に「要素A」「要素B」とします。 それらは5段階で評価されます(順序尺度 5段階)。 いくら「要素A」が高い点数であっても「要素B」が低ければ、「能力A」は高くなりません。 一番良いのは「要素A」も「要素B」も満点の場合となります。 この場合「要素A」と「要素B」を反映させ「能力A」を判断する方法はあるのでしょうか? 25通り?の組み合わせがあると思うのですが、それらが個別に点数化されるような統計的な手法というのがあるのでしょうか? 統計が苦手なのでめちゃくちゃな質問なのかもしれませんが、何卒よろしくお願いします。

  • 統計学の問題の解き方について教えてください

    大学で統計学を学んでいる者です。 以下の問題の解き方が分かりません。どなたかお教え頂けないでしょうか? やはりこういった各得点が分からず、平均点が変化した場合の標準偏差 を求める問題が特に苦手で、この問題も考えても分かりませんでしたので、 何卒お願いします。 20名の学生に対する試験(100点満点)を採点したところ、その平均値が60点、標準偏差が8.5点と計算された。しかし、採点された答案を見直したところ、1名のデータのミスが見つかり、実際は65点であるのに85点として記録集計されたことが分かった。 (1) 正しい平均値と標準偏差を求めなさい。 (2) 正しい平均値に対する95%信頼区間を求めなさい。

  • 統計学についての質問です。

    統計学に興味を持ち、簡単な統計の本を見ながら独学で勉強しています。 現在、「標本平均の差の信頼区間」ちょっと躓いております。 標本平均の差の信頼区間の式の中に、 (標本平均Aー標本平均B) が含まれていますが、 (標本平均Bー標本平均A)ではダメなんでしょうか? 入れ替えた場合、当然符号が変わり、信頼区間の符号も変わってしまうのはわかるんですが、なぜAーBなんでしょうか? 何に注目して、引かれる数と引く数を決めればいいのでしょうか? 以上、回答いただきければ幸いです。

  • 確率統計の問題が分かりません。問題を教えてください

    確率統計の問題でどうしても解けない問題があり、質問させていただきます。どなたかご教授していただくと非常に助かります。 [問題] 定員150名のある体育大学の入試に500人が応募した。入試では体育の実技と国語のテストがあり,応募者 の得点分布は,実技が200点満点で平均150点、標準偏差20点,国語が100点満点で,平均45点、標準偏差 15点であった。実技の得点と国語の得点はそれそれ独立な正規分布とするとき ⑴ 実技の得点と国語の得点の合計点の平均,および,標準偏差を求めよ。 ⑵ 合計得点200点の受験生は,上から何番くらいの順位か。 ⑶ 合否のボーダーラインは,ほぼ何点か。