パソコンによる2要素を含む統計について

このQ&Aのポイント
  • パソコンを使用した統計処理について苦戦している方への質問です。具体的な検定方法や結果の解釈について教えていただきたいです。
  • 農作物の品種と肥料の組み合わせによる収穫量について、品種ごとの有意差や肥料ごとの有意差を調べたいです。統計ソフトを使用して解析を試みましたが、望んだ結果が得られませんでした。
  • 具体的な統計ソフト「JSTAT for Windows」を使用して統計処理を行っているところですが、品種ごとの有意差や肥料ごとの有意差が求められません。他の統計ソフトの利用や、検定方法の説明を教えていただきたいです。
回答を見る
  • ベストアンサー

パソコンによる2要素を含む統計について

こんにちは。 論文作成のために統計処理を行っているところなのですが、苦戦しています。 授業で多少は習ったはずなのですが、お世辞にも理解しているとはいえず、実際に使用するとなると全くどうにもなりませんでした。 安易に質問せず自力で調べるべきとは思ったのですが、専門書を見てもあまりの難解さに理解が追いつかず、さらにその本に書かれていることを実際にパソコンで計算するとなると、用語が異なっていたり知識不足から結果が読み取れなかったりと、もはやさっぱりです。 数学が苦手だった私からすると、今から理解をし直すにはかなり厳しい状況ではないかと思います。 皆様のお力をお貸し願えたらと思います。 大学は農学系なのですが、実際に私が検定を行いたい内容は、 とある農作物の品種A~Cの3種に対し、肥料を与える方法を4パターン作りました。 つまり総合パターンは3×4=12パターンです。 この組み合わせの結果、得られた収穫量がデータとなります。 この収穫量について、『品種』『肥料』のそれぞれによってそれぞれ有意差があるかどうかを知りたいのです。 例えば、 ・品種Aは品種Bに比べ有意に収穫量が高い ・肥料Aは肥料Cに比べ有意に収穫量を高める などといった結果を出したいのです。 (品種・肥料の組み合わせによる効果については今はそこまで重要としていません。 あくまで品種、あるいは肥料単品による変化のみです。) すなわち、『どの肥料を使用しても品種AがBより収獲量が高い』『どの品種でも肥料AがCより収穫量を高める』といった結果を知りたいわけです。 そこで、統計ソフト『JSTAT for Windows』を使用して統計を試みておりました。 怪しい知識でなんとか、恐らく『JSTAT』で示されている『2因子』の統計を行えばいいのだろう、と判断し、データ設定をしました。 すなわち、収穫量をJSTATに入力し、2因子のデータ設定欄で同じ品種を縦列、同じ肥料を横列のように並べて、統計処理を試みました。 この際、『2元配置 繰り返しなし』にて統計を進め、結果を表示させましたが、求めていた品種と品種での間の有意差および肥料と肥料の間での有意差が出ず、品種A・肥料Aと品種A・肥料Bの間の有意差、品種B・肥料Aと品種C・肥料Cの間、など、個別に有意差が計算されてしまいました。 私が知りたいのは、品種のみ、あるいは肥料のみの間の差ですので、これは望んでいたものではありません。 そこで、 ・私の知りたい品種のみの間での有意差・肥料のみの間での有意差については、出す方法はありますでしょうか? ・ある場合、もしよろしければJSTATでそれが可能かどうか、また可能ならやり方を、不可能なら可能なソフトなどを教えていただけたらなお助かります。 ・また、私は上記の検定の際、『2元配置 繰り返しあり』と『なし』の差が良く理解できませんでしたので、もし説明できる方がいらっしゃいましたらご教授願えませんでしょうか。 また、このデータで検定をしようとした際、『繰り返しあり』が何故か使用できませんでしたので、もし理由が分かりましたら是非。 当方、多少は統計を習ってはおりますが上記の通り理解は素人以下かと思われます。 あつかましい願いかと思いますが、なるべくなら噛み砕いて教えていただけましたら幸いです。 全部ではなく、一部分についてでもヒント、あるいは回答をいただけましたらとても助かります。 よろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
noname#227064
noname#227064
回答No.5

まずは > 全部の平均では品種Aが大きいけど、品種AとBを総合的に比較して有意に差があるといえるだろうか?』 ついてですが、品種に関する主効果が有意であればある程度の効果はあるのでしょうが、(交互作用が有意であれば)肥料によって結果が逆転する場合があるのに、どこまで肥料Aの方が大きいとか言っていいのか疑問が残ります。 そして、 > 『品種A+肥料Aと品種B+肥料Aでは品種Aの方が収穫量がかなり大きいが、肥料Bを使うと品種Bの方がやや大きい。 さらに肥料Cだとほとんど差がない。 > つまり、同一の肥料方法同士を比較し、総合的に有意に高いと言えるか、言えないのかを検定する方法が知りたいのです。 の2点についてですが、この比較は品種A+肥料Aと品種B+肥料Bといった品種或いは肥料が一致しない比較はする必要がないということですか? それならば、Tukeyの方法を用いるより、単純主効果の検定後多重比較とすればいいでしょう。 No.4で記載した「品種を固定して肥料間の比較、肥料を固定して品種間の比較をするしかありません。」がそれにあたります。 「単純主効果」「多重比較」をキーワードにして検索してみてください。 > また、品種の場合、上の記述からは、3品種で収穫量に差異があり、肥料の方法に関わらずその関係性は変わらない(=平均値順で有意に差がある)と言える、という風にも取れますが、まずいのでしょうか? 水準数が3以上になると、その主効果が有意であった場合、水準によりその効果は異なるといえますが、どの水準間で違いがあるかいうためには多重比較をする必要があります。 あと、分散分析後の主効果の検定や多重比較の具体的な検定方法について参考書を一つ挙げておきます。 「心理学のためのデータ解析テクニカルブック」(森敏昭, 吉田寿夫著, 北大路書房)

SAN_007
質問者

お礼

> 品種A+肥料Aと品種B+肥料Bといった品種或いは肥料が一致しない比較はする必要がないということですか? 全く必要ないわけではありませんが、同じ品種でも肥料を変えると収穫量にどういった変化が出るか、あるいは肥料の効果が別の品種と比べどう違うか、というような、品種か肥料のどちらかに視点を絞った見方での比較が第一という実験ですので、どちらも異なる組み合わせ同士での比較は優先順位が低くなります。 もちろん、最終的にどの品種と肥料の組み合わせが一番良いのか、ということを決めるには役立ちますが、それは個別の効果を見てからすべきでした。 ご意見いただいたように、いきなりTukey法を適用していたのは正しい思考順序ではなかったようですね。 そのあたりをうまく理解していなかったので、結果として混乱させてしまったようで申し訳ないです。 > それならば、Tukeyの方法を用いるより、単純主効果の検定後多重比較とすればいいでしょう。 頂いた情報を元に今調べているところですが、JSTATでは単純主効果の検定を行えない、というような記載が見当たりました。 色々なパターンがあるためか、統計ソフトではこういった機能がついていない場合があるようですね。 となると、別のソフトや直接計算での検定も考えなくてはなりません。 お勧め頂いた参考書も探しながら、ひとまず他の方法を考えてみます。 ありがとうございました。

その他の回答 (4)

noname#227064
noname#227064
回答No.4

> 少なくともこのデータにおいては、私の調べたい内容である、『どの品種でも肥料はこれが良い』という肥料や、『どの肥料でもこの品種が良い』という品種があるか、ということは言えない、ということでしょうか? そういうことになります。 テストデータの分散分析表中で > 因子間変動(A) SA=21571.366 1 VA=21571.366 FA= 11.995** p=0.0016 > 因子間変動(B) SB=252801.377 2 VB=126400.688 FB= 70.288** p<0.0001 が主効果の検定であり、交互作用が有意でなければ、ABどちらも有意ですのでどの品種でも肥料Aの方が肥料Bより収穫量が高い(又は低い)ということができます。 (品種はABCと3種類あるので、収穫量は3種類とも同じでなく、どの肥料を使っても品種間の収穫量の違いは変わらないとしか言えません) しかし、テストデータの場合 > 交互作用(A*B) SAB=17834.667 2 VAB=8917.333 FAB= 4.959* p=0.0138 というように、交互作用が有意ですので、Tukeyの方法等を用いて組み合わせごとに比較するか、或いは品種を固定して肥料間の比較、肥料を固定して品種間の比較をするしかありません。 > えっと、交互作用がある上で、主効果がある場合もあるのですよね? 上で説明したとおり、分散分析表では2つの主効果と交互作用に分けて結果が出ています。 > 交互作用というよりは主効果についてを重視したい、ということになるのではないでしょうか。 勿論そうなのでしょうが、No.3にも書いたように、AよりBの方が値が大きいとか、aよりbの方が値が小さいとかいえませんよね。 > 私の望む統計結果は交互作用がある限り、例え実際にはあったとしても得られない、ということでしょうか? 残念ながらそういうことになります。

SAN_007
質問者

お礼

引き続いての回答ありがとうございます。 今回、特に私が調べたかった内容は、肥料の種類による効果込みでそれぞれの品種の収穫量に有意な差があると言えるのか、言えないのかを知りたい、というものでした。 つまり、 『品種A+肥料Aと品種B+肥料Aでは品種Aの方が収穫量がかなり大きいが、肥料Bを使うと品種Bの方がやや大きい。 さらに肥料Cだとほとんど差がない。 全部の平均では品種Aが大きいけど、品種AとBを総合的に比較して有意に差があるといえるだろうか?』 というような、データを見ただけでは判断しにくい状況を比較したい、というものです。 肥料の方法の中には無肥料、つまりかなり収穫量の低いものもあり、当然収穫量が高い品種でも、無肥料のものと他の収穫量の低い品種の多肥料のものを比べれば高い・低いの関係は逆転します。 つまり、同一の肥料方法同士を比較し、総合的に有意に高いと言えるか、言えないのかを検定する方法が知りたいのです。 これまで頂いた回答を読む限り、何だか考え方を間違えているような気がしてきたのですが、このような有意検定を行う方法はありますでしょうか? あるいは、今の時点で有意差はある・ないを確定できる方法がありますでしょうか。 >交互作用が有意でなければ、ABどちらも有意ですのでどの品種でも肥料Aの方が肥料Bより収穫量が高い(又は低い)ということができます。 (品種はABCと3種類あるので、収穫量は3種類とも同じでなく、どの肥料を使っても品種間の収穫量の違いは変わらないとしか言えません) 上記のような結果を得たい場合に、この検定結果から、例えば元データの収穫量で平均値の高い肥料Bの方が高い、と言ってはいけないのでしょうか? また、品種の場合、上の記述からは、3品種で収穫量に差異があり、肥料の方法に関わらずその関係性は変わらない(=平均値順で有意に差がある)と言える、という風にも取れますが、まずいのでしょうか? >しかし、テストデータの場合交互作用が有意ですので、Tukeyの方法等を用いて組み合わせごとに比較するか、或いは品種を固定して肥料間の比較、肥料を固定して品種間の比較をするしかありません。 この場合、品種あるいは肥料を固定、とは具体的にどのようにすることを指すのでしょうか? やはり良く理解できていない気がしますね、本当に。 一度しっかりと理解し直すべきなのでしょうけれど…。

noname#227064
noname#227064
回答No.3

> なるほど、つまり1対1でデータ間に何らかの関係性がある(その2データが同一サンプルから調査した場合など)場合が対応がある、ということでよろしいのでしょうか? そういうことです。 > つまり因子間変動(A)や因子間変動(B)の部分で、品種のみと肥料のみの効果だけではっきりした違いがあるといえない、ということを示している、という解釈でよろしいでしょうか? いえ、そうではなく品種と肥料という要因を分けて考えられないということです。 2要因で水準数がともに2で繰り返しのある試験を行い、それぞれの組み合わせでの平均が、  a b A 0 2 B 2 1 のようになったとします。 それぞれの組み合わせでの値がどれくらいばらついているかにもよりますが、こういうデータでは、AB間やab間に差があるのは確かだとしても、AよりBの方が値が大きいとか、aよりbの方が値が小さいとかいえませんよね。 品種Aでは肥料Aより肥料Bの方が収穫量がよく、品種Bでは肥料Bより肥料Aの方が収穫量がよかったら、品種を固定しないことにはどの肥料が収穫量がよいかいえないということです。 > つまり、そのときの検定内容では品種のみ、などでも有意差があった、今回はない、ということでしょうかね? 交互作用が有意であったから、品種のみ、肥料のみで結果が出せなかったためで、交互作用が有意でなければ、品種間の差或いは肥料間の差が有意であろうがなかろうが、要因ごとに結果が得られるはずです。

SAN_007
質問者

お礼

>品種Aでは肥料Aより肥料Bの方が収穫量がよく、品種Bでは肥料Bより肥料Aの方が収穫量がよかったら、品種を固定しないことにはどの肥料が収穫量がよいかいえないということです。 混乱してきました。 ええっと、つまり相互効果がある、というのは、すなわち特定の品種では肥料Aがいい(品種と肥料の組み合わせで初めて有意差があるか決定できる)ということですか? 品種Aでは肥料Aがよく、品種Bでは肥料Bがよいので、まず品種あるいは肥料をどちらかに固定し、その上で比較することでしか有意差を出すことが出来ない、ということでしょうか。 そういうことであるなら、少なくともこのデータにおいては、私の調べたい内容である、『どの品種でも肥料はこれが良い』という肥料や、『どの肥料でもこの品種が良い』という品種があるか、ということは言えない、ということでしょうか? >交互作用が有意であったから、品種のみ、肥料のみで結果が出せなかったためで、交互作用が有意でなければ、品種間の差或いは肥料間の差が有意であろうがなかろうが、要因ごとに結果が得られるはずです。 交互作用についてうまく理解できていないようです。 えっと、交互作用がある上で、主効果がある場合もあるのですよね? 私がしたいのは、品種と処理全ての組み合わせでデータを検定し、『品種全てを合わせたうえで、この肥料が良い』あるいは『肥料による効果を合わせた上で、収穫量はこの品種で高い』というような、品種間のみ、あるいは肥料間のみでの有意性を知ることです。 なのでこの場合、交互作用というよりは主効果についてを重視したい、ということになるのではないでしょうか。 しかし、このJSTATの結果からは、私には個別の組み合わせでの関係性(要因ごとの結果)しか読み取れませんでした。 なので困っている、ということになります。 この場合、交互作用が有意であったから品種や肥料それぞれでの結果が出せなかった、ということかと思うのですが、では私の望む統計結果は交互作用がある限り、例え実際にはあったとしても得られない、ということでしょうか? それとも、この結果が出た時点でそれは無い、ということになるのでしょうか? 何分理解力が追いついておらず、ご迷惑をおかけしますが、お答えいただけましたら幸いです。 引き続きよろしくお願いします。

noname#227064
noname#227064
回答No.2

> それぞれの品種と肥料の組み合わせごとに、6個ずつのサンプルで収穫量を出しています。 ということは、「選べなかったのは初めから『繰り返しなし』、だった」ということでしょうね。 繰り返しについては、補足に記載された認識でOKです。 対応については、補足の記載ですと少し違います。 例をあげて説明すると、人間の利き手とそうでない方の手の大きさに差があるかないかを調べたいとします。 この場合、同一人物の両手の大きさを測ることになると思いますが、その同一人物の両手のデータが対応ありいうことになります。 同じものを複数回測定したということではありません。 > 求めていた品種と品種での間の有意差および肥料と肥料の間での有意差が出ず、品種A・肥料Aと品種A・肥料Bの間の有意差、品種B・肥料Aと品種C・肥料Cの間、など、個別に有意差が計算されてしまいました。 繰り返しありということと、補足のテストデータの結果でどういうことかわかりました。 > 要因 偏差平方和 自由度 不偏分散 分散比 危険率 > ----------------------------------------------------------------------------------------- > 全体変動 S=346157.110 35 > 因子間変動(A) SA=21571.366 1 VA=21571.366 FA= 11.995** p=0.0016 > 因子間変動(B) SB=252801.377 2 VB=126400.688 FB= 70.288** p<0.0001 > 交互作用(A*B) SAB=17834.667 2 VAB=8917.333 FAB= 4.959* p=0.0138 > 誤差変動 SE=53949.700 30 VE=1798.323 まず、こちらが分散分析表となるのですが、「有意水準5%:交互作用あり。」となっており、品種間のみと肥料間のみとをわけて違いがあるかどうかが言えなくなっています。 つまり、この品種は収穫量がいいとか、この肥料は収穫量が悪いとかがいえず、品種と肥料の組み合わせによって収穫量が異なるということです。 そのため、全ての組み合わせについてTukeyの方法により、対比較を行っていて、例えば、 > 第1列 vs. 第2列:* ですと、品種A+肥料Aの組み合わせと品種A+肥料Bの組み合わせでは有意に収穫量が異なるということになります。

SAN_007
質問者

お礼

続けての回答ありがとうございます。 >人間の利き手とそうでない方の手の大きさ なるほど、つまり1対1でデータ間に何らかの関係性がある(その2データが同一サンプルから調査した場合など)場合が対応がある、ということでよろしいのでしょうか? >分散分析表となるのですが、「有意水準5%:交互作用あり。」となっており、品種間のみと肥料間のみとをわけて違いがあるかどうかが言えなくなっています。 >つまり、この品種は収穫量がいいとか、この肥料は収穫量が悪いとかがいえず、品種と肥料の組み合わせによって収穫量が異なるということです。 ええと、この部分のデータの見方がよく分かっていないので混乱しているのですが、つまり因子間変動(A)や因子間変動(B)の部分で、品種のみと肥料のみの効果だけではっきりした違いがあるといえない、ということを示している、という解釈でよろしいでしょうか? それで、交互作用あり、つまり品種・肥料両方の組み合わせでしか有意差は出ず、だから後に続く部分で全ての組み合わせで比較している、と。 つまりこのデータの場合、品種A~Cの間、及び肥料A、Bの間では明確に差があるといえず、それ故にJSTATが個別に見た結果を示した、ということと考えて良いのでしょうか? 良く考えると、以前に統計処理したときには、各組み合わせ個別ではなく品種のみ、肥料のみの間で有意差が表示されたことがあって、今回の表示とその表示が異なっているので混乱していたように思います。 つまり、そのときの検定内容では品種のみ、などでも有意差があった、今回はない、ということでしょうかね? そういうことでしたら、納得ですが…。

noname#227064
noname#227064
回答No.1

2元配置の分散分析の繰り返しありとなしについてですが、あなたが得たデータは、    品種A 品種B 品種C 肥料1 12  10  10 肥料2 10  12   9 肥料3  8  10  12 肥料4 10   8   9 というように品種と肥料のそれぞれの組み合わせで1つしか値が得られていないのでは? この場合、それぞれの組み合わせで複数の値がないので、繰り返しのない2元配置の分散分析しかできません。 JSTATを持っていないので確認できませんが、そのためJSTATでは繰り返しありが選べなかったのではないでしょうか? しかし、 > 品種A・肥料Aと品種A・肥料Bの間の有意差、品種B・肥料Aと品種C・肥料Cの間、など、個別に有意差が計算されてしまいました。 というように結果が出てくるのはよくわかりません。 上のデータなら、    Df Sum Sq  Mean Sq F value Pr(>F) 品種 2  0    0    0    1.0000 肥料 3  4.6667 1.5556  0.5385  0.6731 残差 6 17.3333 2.8889 というように品種間に違いがあるか、肥料間に違いがあるかという結果が出ていいはずなのですが……

SAN_007
質問者

お礼

ありゃ、補足のほうで投稿してしまったようです、申し訳ありません。 引き続き、ご意見・ご回答をお待ちしております。

SAN_007
質問者

補足

回答ありがとうございます。 そういえば表記をしていなかったようで申し訳ありませんでしたが、それぞれの品種と肥料の組み合わせごとに、6個ずつのサンプルで収穫量を出しています。 このため、複数の値がないから選べない、ということはないのではないかと思うのですが…。 しかし、一度データを入れ直してテストしてみたところ、『逆に繰り返しなし』が選べなくなっていました。 ひょっとしたら、『繰り返しあり』が選べなかったというのが私の勘違いで、選べなかったのは初めから『繰り返しなし』、だったのかなと思いました。 お騒がせしました。 とりあえず、繰り返しのない、ありについてはちょっと調べてみましたが、つまりは一つの組み合わせ(今回の場合、その品種×肥料の組みあわせ)内でデータが複数あるかどうか、ということで良いのでしょうか? 対応のない、あるなどと混同してしまっていまいち把握できていません。 ・繰り返しのない、ある→一項目について、複数のデータがあるかどうか、今回の場合は品種×肥料ごとにデータが一つか、複数か? ・対応のない、ある→全く同一のものから取ったデータがないかあるか、今回の場合は品種×肥料の1サンプルごとに収穫量を複数回調べていないか、いるか? ということかな、と判断しましたが、間違っていないでしょうか? この点が良く理解できていないので、この検定法が正しいのか確信が持てないでいるのです。 あと、テストとして作った検定の結果を表示しておきますので、何かお気づきでしたら教えてくださると助かります。 データ数を減らすため、3品種×2肥料の6パターンにしていますが、フルに入力してもおそらく同様の結果になるかと思います。 <<< 二元配置:繰り返しあり---Factorial >>> 選択されたデータ A1-B1:第1列(品種A+肥料A) A2-B1:第2列(品種A+肥料B) A1-B2:第3列(品種B+肥料A) A2-B2:第4列(品種B+肥料B) A1-B3:第5列(品種C+肥料A) A2-B3:第6列(品種C+肥料B) 要因 偏差平方和 自由度 不偏分散 分散比 危険率 ----------------------------------------------------------------------------------------- 全体変動 S=346157.110 35 因子間変動(A) SA=21571.366 1 VA=21571.366 FA= 11.995** p=0.0016 因子間変動(B) SB=252801.377 2 VB=126400.688 FB= 70.288** p<0.0001 交互作用(A*B) SAB=17834.667 2 VAB=8917.333 FAB= 4.959* p=0.0138 誤差変動 SE=53949.700 30 VE=1798.323 有意水準5%:交互作用あり。 [Tukeyの方法] **:1%有意差あり。 *:5%有意差あり。 -:有意差なし。 第1列 vs. 第2列:* 第1列 vs. 第3列:** 第1列 vs. 第4列:** 第1列 vs. 第5列:** 第1列 vs. 第6列:- 第2列 vs. 第3列:** 第2列 vs. 第4列:** 第2列 vs. 第5列:** 第2列 vs. 第6列:** 第3列 vs. 第4列:- 第3列 vs. 第5列:- 第3列 vs. 第6列:** 第4列 vs. 第5列:- 第4列 vs. 第6列:** 第5列 vs. 第6列:- 結果の読み取り方が分かっていないのが最大の問題ですね…。

関連するQ&A

  • 統計学のF検定、T検定、有意差について

    統計学のF検定、T検定、有意差について教えてください。 ●F検定…分散の有意差を求める検定。有意差がない=等分散 ●T検定…等分散なデータ同士の有意差を求める検定 F検定を行う→等分散であればT検定を行える 【例】 データA、B、CについてF検定を行う。 データA、B間に有意差なし。その他の間には有意差あり。 よってデータA、Bは等分散。 データA、Bの平均値についてT検定を行える。 という認識で合っているでしょうか? ご回答よろしくお願いします。

  • 統計学教えてください

    統計学の問題なんですけど、解る方がいましたら教えてください。 問題  以下のデータは水俣病罹患猫と対照の健康猫の肝臓の総水銀量(mg/kg)である。  健康猫;2.02、 1.71、 2.04、 1.5、1.83、1.55  罹患猫;2.15、2.0、1.81、2.11、2.55  両群のあいだに有意差があるかどうか、有意水準5%で Mann-whiteney検定とt検定を行いなさい。

  • SPSSでの統計

    卒業論文のアンケート結果の統計で悩んでいます。図書館で本を借りたり、インターネットで色々と調べたのですがSPSS(11,5 j for windows)での検定方法がよくわかりません。ある3つの大学で「朝食を食べる・食べない」という質問に対して、最初にノンパラメトリック検定で独立したk個の検定「Kruskal-Wallis検定」を選択して、この質問項目で有意差が確認できました。次に「Bonferroni検定」を行いました。するとa大学とb大学の間に有意差が確認できました。しかし、有意差が確認できてもaとb大学でどちらが朝食を食べるのが多いということが言えるのでしょうか?すいませんが、どなたか教えてください。

  • 統計学についてお願いします。

    統計について素人です。 A群(n=30)とB群(n=40)を比較して有意差があるか調べたいと思います。 検定の順序としては、A群とB群は対応のあるデータではないです。 その為、まずは正規性の検定を行うことになるのでしょうか。 次に正規性があれば、F検定で等分散か確認し、等分散であればステューデントのt検定、等分散でなければウェルチのt検定ということになるのでしょうか。 そして正規性が無ければノンパラメトリック検定となるのでしょうか。 ここまでは合ってますか? それでここからが本題なのですが、私はSPSSやエクセル統計などの統計ソフトを持っていません。 普通のエクセルのみで、このA群とB群を比較して有意差があるか調べる方法を教えていただけませんでしょうか? 手順等できるだけ詳しく教えていただけますと幸いです。 よろしくお願いいたします。 (最悪、エクセル統計であれば購入できそうですが…)

  • 統計(有意差の検定)について

    実験データの統計処理についての質問です。 A,B,C,Dという項目をそれぞれ3回ずつ測定し、以下のようなデータが得られました。 A (1)1.369 (2)1.58 (3)1.484 B (1)0.180 (2)0.169 (3)0.180 C (1)1.543 (2)1.648 (3)1.519 D (1)0.297 (2)0.300 (3)0.318 そこで、B/AとD/Cの2群について有意差があるのか検定したいと思っています。 しかし、このデータで、例えばB/Aに関して、 B(1)/A(1)、B(2)/A(2)、B(3)/A(3)のように(1)(2)(3)がそれぞれ対応しているわけではありません。 こういう場合、どのようにして有意差の検定をすればいいのでしょうか? 同じような質問を検索したのですが、見つからなかったため質問させていただきました。 よろしくお願いします。

  • 統計学で質問します

    最近統計解析について学んでいますが。 たびたび有意差があるとか有意差がないとかの言葉が出てきます。 自分の理解では有意差があるというの偶然の可能性が大きいので、信頼できないデータ 有意差がないというのは偶然の可能性が小さいので、信頼できるデータ であるという感覚ですが。 この理解で合ってますでしょうか? よろしくお願いします。

  • 統計検定について

    統計で有意差があるか検定しようと思っていますが、どの検定を使えばよいかわかりません。 例えば、塾に行っている群と塾に行っていない群で合格・不合格に有意な差があるか検定するにはどうすればよいのでしょうか。また、サンプル数はどのくらいあれば統計的に信頼性があると言えるのでしょうか。 統計処理初心者のためよくわかりません。よろしくお願いいたします。

  • 統計 変化率の有意差検定の出し方(エクセル JMP)

    統計かなりの初心者です。教えてください。 変化率を出した2群の数値に有意差があるかエクセルで調べたいと思います。t検定で、両側分布、対のある検定で行ってみたのですが、結果は出てきませんでした。? その他、エクセルまたはJMPで有意差検定のよい方法、このような問いに対する考え方(統計全般についてまだいまいち理解できていません)がありましたら教えてください。 例:体重 A群70 B群70   3ヵ月後体重  A群68(変化率-3%) B群66(変化率-6%)   12ヵ月後体重  A群71(変化率+1%) B群59(変化率-16%) 出したいもの:3ヵ月、12ヶ月後の変化量、変化率の有意差検定 よろしくお願いします。

  • 【統計】有意に「高い」?「低い」?

    以下のような場合、「有意に高い」というのか「有意に低い」というのかどちらなのでしょうか? (例) 9名のマラソン選手にマラソン走行前後で、気分の明るさを1~10の10段階で回答してもらうアンケートを実施し、以下のような結果を得たとします。 (走行前)→(走行後) Aさん:9 → 10 Bさん:8 → 9 Cさん:8 → 9 Dさん:7 → 8 Eさん:6 → 5 Fさん:3 → 4 Gさん:2 → 3 Hさん:1 → 2 Iさん:1 → 2 次に、走行前と走行後のデータ群に統計学的な差があるかを調べるために検定を行います。ここではデータが順序尺度なのでWilcoxon符号付順位和検定を行います(α=0.05)。 結果、p<0.05(0.039)で走行前後のデータ群は有意に異なるという解析結果が得られます。 分からないのはここからです。 走行前と走行後の中央値は、走行前:6, 走行後:5 で、走行後の方が低いです。 つまり走行前よりも走行後の方が「有意に低い」という解釈をするのでしょうか? しかし、走行後に低くなっているのは1名のみで、残り8名は上昇しています。 つまり走行前よりも走行後の方が「有意に高い」という解釈をするのでしょうか? 有意差検定は「異なる」ということを示しているだけで「高い」「低い」を言っていないのは分かります。そうではなく、解釈をどうすべきか分からないので教えて下さい。 宜しくお願いします。

  • 統計解析のt検定について

    t検定について、理解出来ないので教えていただけないでしょうか 3群以上ではt検定は使えないについて A、B、Cの群について、A-B間、B-C間、C-A間の3回のt検定を行ったとき、   すべての組み合わせで差が出ない確率   = (A-B間で差が出ない確率) * (B-C間で差が出ない確率) * (C-A間で差が出ない確率) となります。  有意差水準を0.05とすると、この3つの確率は0.95となり、全体では0.857になります。    少なくともひとつの組み合わせに差が出る確率    =1-すべての組み合わせで差が出ない確率 なので、0.143となります。 この0.143は有意差水準0.05よりかなり大きな値です。  このように、t検定を繰り返すと、本当は有意差がないのに差があるとしてしまう確率が高くなってしまうのです。これを検定の多重性による第一種の過誤といいます。  そのため、3群以上の平均の差の検定にはt検定は使えません。分散分析など他の方法を用います。 質問1 式の( )と( )の間の*は何を意味していますか 質問2 有意差とは何のことですか 質問3 有意差水準を0.05とすると、この3つの確率は0.95となり、全体では0.857になります。 上記の数字の根拠、上記の数字はどのような式から導かれるのでしょうか 質問4 この0.143は有意差水準0.05より、かなり大きな値です。このようにt検定を繰り返すと、 本当は有意差がないのに、差があるとしてしまう確率が高くなってしまうのです。 どういう事を言っているのでしょうか?御説明いただけないでしょうか 最後までお読みいただき、ありがとうございます。 御回答いただけましたら大変助かります。宜しくお願い致します。