• 締切済み

実験結果の統計のしかた

仕事で行った実験の結果に有意に差があるのか見たいのですが、どのような統計処理を行えばよいのかわかりません。 それぞれ条件の違う状態でサンプルの変化量を見たところ下記のようなデータが得られました。 その場合、どれが有意に差があるといえるのでしょうか? 数学的なことが苦手なため、よろしくお願いいたします。 (1)2.86 (2)2.57 (3)2.50 (4)2.32 (5)2.3 (6)2.25 (7)2.0 (8)2.14 (9)2.08 (10)2.06 (11)1.73

みんなの回答

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.4

>(1)と(2)であっても(1)の方が、優れているのか?  検定は、できます。データが正規分布をしていることが想定できるのなら、t検定。でなければ、F検定が標準的な手順です。  手前味噌ですが、 http://oshiete1.goo.ne.jp/qa3516234.html  ただ、検定では、「有意差はある」と主張はできても、どの程度の差なのかは、論及できません。もちろん、差が無いことも。検定とは、その程度の代物です。書き込まれた内容からすると、論文を書くことが目的とは思えません。論文を書くには、検定をして「有意差有り」を示さないと、審査に通りません。しかし、これまでに何度か書き込んだように、実用的な価値は、ほとんどありません。  温度や圧力がどのように影響するかについては、回帰分析が適切な方法です。上記:手前味噌の回答URLの下の手順でしてください。  温度であれば、 1) 温度のみを変えて行う。他の条件は同じにすること。温度の幅は、できるだけ大きくする。3つの平均値を取る手間があるのなら、10℃、50℃、150℃などの3つで行う。温度設定は、少なくとも5段階は必要で、てきるだけ等間隔に。 2) 回帰分析を行う 3) 回帰式に代入すると、温度によってどのようになるか、予想ができる。  結果の説明が必要なら、設定した温度、データの数、回帰式、決定係数を書き込んでください。  温度と圧力、その他を同時に変えて、なんぞも重回帰分析を行えば、予想可能です。しかし、まず、何が影響しそうか、を把握するために、重回帰分析は、次の段階かと。免許を取って、いきなり新車のベンツに乗る人は、まずいないと想うので。

参考URL:
http://oshiete1.goo.ne.jp/qa3516234.html
almond-tam
質問者

お礼

kgu-2様 ありがとうございます。 統計の意味が分かっていなかったようです。 すみません。 ご指導いただいたとおりに再度 行ってみたいと思います。

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.3

>どのような統計処理を行えばよいのかわかりません。 私も初心者ですが、これは初心者の最初の誤りです。結果があるので、なんとかしてくれ、というのは、東京から列車に乗り、どこかへ着いた、そこの駅員に「私は何をしたらいいのでしよう」と訊くようなものです。返事が困難です。  検定の基本は、2つの集団にわけ、それを比較し、その集団の間の差は偶然とは考えられない、すなわち差が有る、という手順を踏みます。  何度か検定を経験すると、「差が無い」ことを証明したい、という不可能な誘惑にかられます。  ご質問では、集団がわかりません。集団というのは、1年生とか、牛乳好きとか特定の基準でわけます。比較するのは2年生とか他の学校、牛乳の場合は好きの反対の嫌いな集団と比較するのが手順です。  というわけで、理解できる日本語で書いて下さい(=集団に分けてください)。  もしも、これが学生・院生の研究なら、先生に聞くのがマナーです。  職場など、一人でやっていてアドバイスを受けられない、という場合にのみ、回答します。この場合、そのデータはどのようにして得たのも書いて下さい。というのは、統計でデータを得るには、ランダムサンプリングが前提になります。その判断ができないからです。

almond-tam
質問者

お礼

kgu-2様 回答いただきありがとうございます。 また返信が遅くなり申し訳ございません。 上記に書いてある11個の集団は、それぞれに実験条件が違う11個のサンプルの平均値です。 それぞれに温度が違ったり、圧力が違ったりしています。 現在 父と二人で仕事をしています。 上記のデータの平均値を見ると(1)と(11)では、大きく値が異なり(1)の方が非常に優れているように見えます(変化量を見ているため値の大きなものの方が優れている)が、本当に優れているのか? (1)と(2)であっても(1)の方が、優れているのか? それともほぼ差がないと判断されるのか? 上記のようなところで悩んでいます。 まだ漠然としていたら申し訳ございません。 よろしくお願いいたします。

  • outerlimit
  • ベストアンサー率26% (993/3718)
回答No.2

標準偏差は 統計・品質管理の基礎です  Excelにも関数があります 書店で品質管理手法の書籍を購入してお読みください 標準偏差のこの意味が判らない等具体的な事ならばワンポイントアドバスで可能ですが・・・・・ 余談ですが  教育関係者が忌み嫌っている 偏差値も 標準偏差を変換して表示しただけのものです

almond-tam
質問者

お礼

outerlimit様 ありがとうございます。 返信が遅くなり申し訳ございません。 標準偏差とは、平均と個々の値との差。というような理解であっていますでしょうか? Excelにもありましたよね。 学生の時にやったような気がします。 本などでExcelでの出し方も確認しているのですが、なかなか理解が出来ず苦労しています。 偏差値・・・・。私も偏差値と言う言葉で学校が決まりました。

  • outerlimit
  • ベストアンサー率26% (993/3718)
回答No.1

一番簡単な方法は 条件ごとにグループ化し その平均と標準偏差を求めます その上で 平均と標準偏差から 各グループに有意差が有るかを検定します 例えば Aグループは サンプル数4 平均 2.73 標準偏差 0.15 Bグループは サンプル数5 平均 2.36 標準偏差 0.21 Cグループは サンプル数4 平均 2.05 標準偏差 0.25 サンプル数による標準偏差の信頼度の検定も必要です イメージとして捉えるならば上記の正規分布曲線を描き、各グループの重なり具合を見ます(重なる部分が σ以内、2σ以内、3σ以内等) 複数の条件が有る場合には 条件ごとに試行して 明確にグループ化できる条件とそうではない条件を区分けし 実プロセスとの関係を推定します

almond-tam
質問者

お礼

outerlimit様 ありがとうございます。 まったく知識がないもので当たり前のことまで分からず申し訳ないのですが、標準偏差はどのように求めればよいのでしょうか? また標準偏差の信頼度の検定とは、具体的にはどのようなことになるのでしょうか? 初歩的な質問で誠に申し訳ございませんが、教えていただけますと幸いです。 よろしくお願いいたします。

関連するQ&A

  • パソコンによる2要素を含む統計について

    こんにちは。 論文作成のために統計処理を行っているところなのですが、苦戦しています。 授業で多少は習ったはずなのですが、お世辞にも理解しているとはいえず、実際に使用するとなると全くどうにもなりませんでした。 安易に質問せず自力で調べるべきとは思ったのですが、専門書を見てもあまりの難解さに理解が追いつかず、さらにその本に書かれていることを実際にパソコンで計算するとなると、用語が異なっていたり知識不足から結果が読み取れなかったりと、もはやさっぱりです。 数学が苦手だった私からすると、今から理解をし直すにはかなり厳しい状況ではないかと思います。 皆様のお力をお貸し願えたらと思います。 大学は農学系なのですが、実際に私が検定を行いたい内容は、 とある農作物の品種A~Cの3種に対し、肥料を与える方法を4パターン作りました。 つまり総合パターンは3×4=12パターンです。 この組み合わせの結果、得られた収穫量がデータとなります。 この収穫量について、『品種』『肥料』のそれぞれによってそれぞれ有意差があるかどうかを知りたいのです。 例えば、 ・品種Aは品種Bに比べ有意に収穫量が高い ・肥料Aは肥料Cに比べ有意に収穫量を高める などといった結果を出したいのです。 (品種・肥料の組み合わせによる効果については今はそこまで重要としていません。 あくまで品種、あるいは肥料単品による変化のみです。) すなわち、『どの肥料を使用しても品種AがBより収獲量が高い』『どの品種でも肥料AがCより収穫量を高める』といった結果を知りたいわけです。 そこで、統計ソフト『JSTAT for Windows』を使用して統計を試みておりました。 怪しい知識でなんとか、恐らく『JSTAT』で示されている『2因子』の統計を行えばいいのだろう、と判断し、データ設定をしました。 すなわち、収穫量をJSTATに入力し、2因子のデータ設定欄で同じ品種を縦列、同じ肥料を横列のように並べて、統計処理を試みました。 この際、『2元配置 繰り返しなし』にて統計を進め、結果を表示させましたが、求めていた品種と品種での間の有意差および肥料と肥料の間での有意差が出ず、品種A・肥料Aと品種A・肥料Bの間の有意差、品種B・肥料Aと品種C・肥料Cの間、など、個別に有意差が計算されてしまいました。 私が知りたいのは、品種のみ、あるいは肥料のみの間の差ですので、これは望んでいたものではありません。 そこで、 ・私の知りたい品種のみの間での有意差・肥料のみの間での有意差については、出す方法はありますでしょうか? ・ある場合、もしよろしければJSTATでそれが可能かどうか、また可能ならやり方を、不可能なら可能なソフトなどを教えていただけたらなお助かります。 ・また、私は上記の検定の際、『2元配置 繰り返しあり』と『なし』の差が良く理解できませんでしたので、もし説明できる方がいらっしゃいましたらご教授願えませんでしょうか。 また、このデータで検定をしようとした際、『繰り返しあり』が何故か使用できませんでしたので、もし理由が分かりましたら是非。 当方、多少は統計を習ってはおりますが上記の通り理解は素人以下かと思われます。 あつかましい願いかと思いますが、なるべくなら噛み砕いて教えていただけましたら幸いです。 全部ではなく、一部分についてでもヒント、あるいは回答をいただけましたらとても助かります。 よろしくお願いします。

  • 実験精度の検定について

    熱電対温度計というものを用いて液体の沸点を測定する、という実験を行っているのですが、測定条件や環境を変化させた際に温度計の精度が変化します。温度計の精度が良くなった、または悪くなったということを論理的に言うために統計的な処理をしなければならないのですが、各測定条件におけるデータ群のどういった点を比較すればよいのでしょうか?標準偏差や平均値、有意差検定をどうのこうの・・・とするらしいのですがいまいちピンと来ません。誰かアドバイスお願いします。

  • 統計検定について

    統計で有意差があるか検定しようと思っていますが、どの検定を使えばよいかわかりません。 例えば、塾に行っている群と塾に行っていない群で合格・不合格に有意な差があるか検定するにはどうすればよいのでしょうか。また、サンプル数はどのくらいあれば統計的に信頼性があると言えるのでしょうか。 統計処理初心者のためよくわかりません。よろしくお願いいたします。

  • pHの平均値は出せない?統計処理はできない?

     ある実験をして(A処理、B処理)pH値データを得ました。それぞれ平均値を出してさらに有意差検定をおこないました。ところが、指導者から対数表現しているpHは単純に算術平均や統計処理をしてはならないと言われました。例えば、A処理:5.5~6.2、B処理:5.3~7.4と表現するのが適当で、統計処理もしない方がいいとのことでした。  では、pHで平均値を得たいときにはどうしたらよいのでしょうか?逆算して計算すべきなのでしょうか。また、本実験の場合、A処理の方が低い(と思われる)データを得たので、「有意に」低いと言いたいのですが、統計処理をするにはどうしたらよいのでしょうか。ご存知の方、お教え下さい。

  • 統計について初心者です.始めての動物実験で結果をまとめることになりまし

    統計について初心者です.始めての動物実験で結果をまとめることになりました.今回,行動実験(マウス各群n=10)で,4群(1)コントロール(2)投与A(3)投与B低濃度(4)投与B高濃度とし,行動試験を連続5日間行いました.この場合,どのような検定方法で行えば有意差があると言えるのでしょうか?(日にちごとのコントロールに対して(2)(3)(4)を検定?または.1日目から5日目を順に各群で検定?)また,元のデータから平均,標準偏差,標準,標準誤差を求めたところです.基本的なところからお聞きしたいです.よろしくお願いします.

  • 実験データの統計と検定でかなり困っています。

    植物の生長量を調べる実験を計画しています。 AとBの二つの処理区での生体重の変化を見る項目があります。播種して二週間後に、任意で20本を切り取り、生体重を測り、平均値を計算し、処理開始前の生体重とします。 (質問1.この20本のばらつきは標準偏差で表すべきですか、標準誤差で表すべきですか。) その後に、50本づつ条件が違うA区とB区に分けて栽培実験を行います。実験終了後に、この二つの区での生体重を測って、平均値を計算し、処理前の生体重と処理A区とB区での生体重がどのように異なるかを比べる実験です。 (質問2.両区それぞれのばらつきを見るには標準偏差を用いるべきですか、標準誤差を用いるべきですか。) (質問3.エクセルのツールバーを用いて、両区での結果が有意差があるかどうかを見るには、まず二標本を使った分散の検定を行い、分散が等しいかどうか見た上で、二標本によるt検定を行うということで何か問題ありでしょうか。)

  • 世論調査の統計処理

    世論調査の統計処理  テレビで見る世論調査の結果が”支持率~ポイント低下”などと報道されるので,この数字の変化は本当に有意差があるのかNHKに問い合わせたところ有意差の検定をしないで”上昇、低下、大きい、小さい”と放送しているのだと回答あり,そんな結果を勝手に解釈して討論番組で政治家に意見を求めたりしていたのかと驚いてしまいました.  学術論文では統計結果の評価を有意差検定しないと門前払いが当たり前です.パーソナルコンピューターでもすぐできるくらいのの手間なのですが.マスメディアではなぜ統計結果を有意差検定しないのでしょうか?

  • 分散分析の最良の結果とは??

    はじめまして。 統計に関して少々疑問点がありまして、皆様にお尋ねいたします。 統計の知識は初心者に毛が生えた程度です。 早速ですが、とある実験を行いました。 n=10で、同じ被験者に各条件を行ってもらいます。 条件1は刺激あり、条件2は刺激なし、 そして、刺激呈示前から体温を10分ごとに計測します。 データは    0  10  20  30  40 … あり   なし                となります。 そこで、2要因(条件×時間)の分散分析(SPSSにて)をおこないました。そうすると、条件、時間、条件×時間(交互作用)という各項目で有意かどうかが出てくるのですが… この場合、 1、条件のみ有意差 2、時間のみ有意差 3、条件・時間有意差、交互作用あり 4、条件に有意差で交互作用あり 5、時間に有意差で交互作用あり 6、交互作用のみあり 7、条件・時間有意差、交互作用なし(あるのだろうか?) 以上のようなパターンが考えられるのですが、果たして最良の結果とはどれなのでしょうか? 条件間で違う結果の場合は1、時間と共に有意に変化したといいたい場合は、3もしくは4になるのでしょうか? また、5は結果としてまずい気がして、6はどう解釈してよいかよくわかりません。 自分で勉強したものと、周りの意見が混濁して迷ってしまいました。 やはり解釈が難しいのが交互作用だと思うのですが、交互作用が出た場合はもっと細かく調べろよ!という啓示なのでしょうか。 交互作用とは実はありがたいものではなく、厄介者??なのかと思ってしまいます。なぜか私の周りは交互作用をありがたがる人が多くて…。 手前勝手な質問ですが、お答えいただければ幸いです。 よろしくお願いいたします。

  • データ間に差がないことを統計的に述べるには?

    データ間に差がないことを統計的に述べたい場合,どのような検定手法を実施すればよいのか? ということで,悩んでいます. 例としまして,以下のような条件で実験を行い,実験の結果を統計的にみて差がない(差がみられない?)と述べたい場合,3要因の分散分析を実施すればよいのでしょうか?御教示・御助言よろしくお願いします. 例) 2つの異なる六面サイコロ(サイコロA,サイコロB)を,朝昼晩に600回ずつ振り,サイコロの目を記録した. この結果をもとに,何らかの統計手法を実施し,サイコロAとサイコロBに差がないことを述べたい. 私の予想では3要因の分散分析を行い,有意差が見られなければ,2つのサイコロに差がない(差がみられない?)といえる,と予想しているのですが誤っていますでしょうか?

  • 統計と解析学の入門書

    生物学系(医学)の研究をしているものです。 実験データの統計処理にはもっぱら統計ソフトを使っていたので不便を感じなかったのですが、データの処理の仕方でいろいろと疑問なところが生じてきて、果たして自分の実験のデータをどう評価していいのか考えています。それで少し統計のことを勉強しようと思っています。 しかしながら私は理系出身であるにもかかわらず数学が大の苦手で、解析学が全くわからないのです。(高校の数学段階ででストップしています)統計学の入門書を読んでも微分積分だかがいっぱいでてきて理解できません。こんな私にも少しずつでもいいですから理解する助けになるような書物はないものでしょうか。 お恥ずかしい質問ですが、詳しい方、ご回答ください。よろしくお願いします。