有意差があってもサンプルサイズが少ないと駄目?

このQ&Aのポイント
  • AとBを発生させる因子が有意差(P<0.05)をもって導き出されたが、サンプルサイズが小さいため結論づけには注意が必要。
  • Aの発生頻度は約5%、Bは6%とされており、サンプルサイズ61人ではAは3人(4.9%)、Bは2人(3.3%)という結果となった。
  • 結論としてAとBを発生させる因子(α, β)が有意差をもって導き出されたが、発生人数が少ないため結論としては導き出されない可能性がある。
回答を見る
  • ベストアンサー

有意差があってもサンプルサイズが少ないと駄目?

AとBを発生させる因子(α)が有意差(P<0.05)をもって導き出されました。しかし、サンプルサイズが小さいので統計的に結論として使えないと指摘されました。しかし、それを指摘しない人もいます。 今までの結果からAの発生頻度は約5%、Bは6%といわれていますが、性格にはいまだ不明です。 今回調べた母集団が61人であるため、Aは3人(4.9%)、Bは2人(3.3%)です。 Aを発生させる因子(β)、とBを発生させる因子(α)が有意差(P<0.05)をもって導き出されました。 この(α)と(β)という因子がA,Bを発生させる結論としましたが、AとBの発生人数が少ないため、結論として導き出されないといわれました。 しかし、それを指摘しない人もいます。 これは考え方でしょうか?、それとも、結論としてサンプルサイズが少ないのでこの検討は駄目といわれることが多いのでしょうか?

質問者が選んだベストアンサー

  • ベストアンサー
noname#227064
noname#227064
回答No.1

説明不足です。 有意差があったとは何をどう比較して有意差があったのですか? > 今回調べた母集団が61人であるため これは母集団ではなく標本ですね。 61人を調べたら、そのうち三人にAが発生しており、二人にBが発生していたということでしょうか。 AとBの両方発生していた人はいたのでしょうか。 比較したのは、AとBの発生頻度の差でしょうか、それとも今までの結果との差でしょうか、あるいは別の何かでしょうか。 そして、αとβという因子がどうしてA,Bを発生させると結論付けられるのでしょうか。 > 結論としてサンプルサイズが少ないのでこの検討は駄目といわれることが多いのでしょうか? サンプルサイズが小さくて問題なのは、検出力が低くなる、つまり、大きな差があっても有意にならない可能性が高くなるからです(第二種の過誤を犯しやすい)。 有意差が得られていれば、問題なのは第一種の過誤を犯すことですが、これは有意水準で抑えられています。

naosatouzarube
質問者

補足

ありがとうございます。統計初心者もいいところで、申し訳ありません。 1.ご指摘のとおり、Aという事象が起こったのが3人、Bという事象が起こったのが2人です。 そのなかで、Aという事象が起こった3人と残りの58人を様々な特性(因子)で比較検討した結果、αという因子がある場合にAという事象が起こりやすいと分かりました。Fisher's exact testを行った結果です。 これをBという事象がおこった2人と59人もβという因子について比較検討し同様にして検討を行いました。 2.第2種の過誤とは、検討した結果、有意差が得られたものは有意であるが、それ以外はサンプルサイズが大きいと、もしかすると有意差がでるから、それ以外の因子が有意差がでる可能性が否定できない、と、言うことですか?。そうすると回答をいただいたとおり、第1種の過誤は、サンプルサイズが小さいけど有意水準で抑えられるから、このα,βという因子を発見したことには意味がある、ということですよね? ご回答、よろしくお願いいたします。

その他の回答 (4)

noname#227064
noname#227064
回答No.5

> 1.ご指摘のとおり、Aという事象が起こったのが3人、Bという事象が起こったのが2人です。 > そのなかで、Aという事象が起こった3人と残りの58人を様々な特性(因子)で比較検討した結果、αという因子がある場合にAという事象が起こりやすいと分かりました。Fisher's exact testを行った結果です。 > これをBという事象がおこった2人と59人もβという因子について比較検討し同様にして検討を行いました。 同じ61人のデータを使って、発生した事象と因子毎にFisher's exact testを行ったのですね。 検定の多重性の問題が生じます。 例えば、個々の検定の有意水準を5%にしていたとすると、全体の有意水準は設定した5%よりも大きい可能性があります。 (どの事象も想定した因子に関係していないとしたら、どれか一つでも有意となってしまうのは困りますよね?) これを回避するには、Bonferroni法により個々の検定の有意水準を調整する方法があります。 しかし、この方法ですと個々の有意水準がかなり低くなってしまい、検出力も低くなります。 そのため、サンプルサイズを増やすことが必要になります。 (サンプルサイズを増やせば、どんなに小さい差でも検出できる) その他の状況でサンプルサイズが小さいと拙い場合は、 (1)検定方法が、サンプルサイズが大きい場合のみに正しいのに小さい場合に適用した。  例:カイ二乗検定、 (2)検定の適用範囲から外れていた。 例:母集団が正規分布でないのにt検定を使用した。 という場合でしょうか。 > 2.第2種の過誤とは、検討した結果、有意差が得られたものは有意であるが、それ以外はサンプルサイズが大きいと、もしかすると有意差がでるから、それ以外の因子が有意差がでる可能性が否定できない、と、言うことですか?。 第一種の過誤は有意差が得られたとき、第二種の過誤は有意差が得られなかったときに問題になります。

  • ramayana
  • ベストアンサー率75% (215/285)
回答No.4

フィッシャーテストなら、サンプルサイズが61でも有意差が出ることがあるでしょうね。 以下は、老婆心からの蛇足です。 この種の分析では、因子のαやβをどんな手続きで選んだかが、意味を持ちます。選び方によっては、無関係の事象が有意と判定されることもあるからです。典型的なのが、たくさんの因子候補を試してみて、その中から有意なものだけを抜き出した場合です。万一、この操作があったときは、サンプルサイズの大小にかかわらず、信憑性が薄いと判断されます。こんな場合は、別のサンプル、たとえば化学実験なら追試などで、時系列データなら予測の的中度合いなどで、改めて検定することが求められます。ちなみに、有意なものだけを抜き出すという操作は、血液型性格判断や宝くじが当たる店など、統計で嘘をつくときの常套手段でもあります。

  • ramayana
  • ベストアンサー率75% (215/285)
回答No.3

正しい手続きにより有意差があると判定されたのなら、サンプルサイズが小さいことは、何の問題もありません。 ただ、ANo.1さんの指摘のとおり、説明不足です。どういう仮説を、どういう手続きで判定したのでしょうか? 仮に、 A と B の真の発生頻度がそれぞれ5%と6%だったとして、61人中 Aの発生が3人以上の確率は、2項分布の計算から、60.4%です。同様に、Bの発生が2人以下の確率は、28.3%です。これらの結果をみると、有意差があったという判定は、ちょっと信じ難いです。

naosatouzarube
質問者

補足

ありがとうございます。統計初心者もいいところで、申し訳ありません。 Aという事象が起こったのが3人、Bという事象が起こったのが2人です。 そのなかで、Aという事象が起こった3人と残りの58人を様々な特性(因子)で比較検討した結果、αという因子がある場合にAという事象が起こりやすいと分かりました。Fisher's exact testを行った結果です。 これをBという事象がおこった2人と59人もβという因子について比較検討し同様にして検討を行いました。 AとBの発生頻度は真ではありません。色々なサンプルデータがあるため、一定でないことはわかっています。5%,6%と表記したのは、それ自体がこれくらいの発生頻度であるのが一般的であり、私のサンプルが非常に少ないのか、そうでないのかを判定する材料になるかもしれないと思い、入れました。 よろしくお願いします。

  • jaham
  • ベストアンサー率21% (215/1015)
回答No.2

有意差があると判定した事に錯誤があるからです サンプル数が少ないから、有意差が検証できないでしょう 基本を無視してはいけません、砂上の楼閣 お判りですか

関連するQ&A

  • サンプル数が1とサンプル数が5を比較し、有意差を調べる検定方法

    質問を見て頂きありがとうございます。 例えば、集団Aと集団Bがあったとします。 集団Aのサンプル数(n)は1つで、値を仮に10とします。 集団Bのサンプル数(n)は5つで、値を仮に2、3、5、6、7とします。 この集団AとBの間に有意差があるか調べることは可能でしょうか? また、可能な場合にどのような検定方法があるでしょうか? 当方は、主にエクセルの分析ツールを使ってます。 ご教授御願いします。

  • 統計学 二つのグループの有意差検定?

    二つのグループのサンプルについて統計的な検定をしなければならないのですが、統計学が全く分からないもので、何検定を使ってどう検定したら良いのか分かりません。下記が検定をするデータで、「A群の方が値が大きく、ABの二群には有意な差がある」と結論付けたいのですが、やり方をご教授願えませんでしょうか?A、Bでサンプル数が異なっていてどういった検定を使うのが正解なのか全く分かりません。よろしくお願い致します。 A群 B群 3  2 4  1 2  1 3  2 3 3

  • 「有意差検定」とは

    「有意差検定」「統計学的有意性の評価」とは、どうすればよいのでしょうか。 平均値、標準偏差、標準誤差が求まっているので、以下の手順を踏むとよいと調べたら出てきました。 が、何をどうすればよいのかわかりません。 (ちなみに今回行った実験は、マウスに局所麻酔薬を注射して痛み刺激を与え、痛がらなかった回数を記録する、というものです) ① 仮説設定: まず、研究の対象に応じて帰無仮説(H0)と対立仮説(H1)を設定します。例えば、2つのサンプル間の平均値に差があるかどうかを検定する場合、次のように設定できます。 帰無仮説 (H0): 2つのサンプルの平均値は等しい。 対立仮説 (H1): 2つのサンプルの平均値は等しくない(または、ある特定の差がある)。 ② 統計検定の選択: 2つのサンプル間で平均値の差を評価する場合、独立な2標本t検定が適しています。ただし、データの性質や仮説に応じて、他の統計検定を選択することもあります。 ③ t検定の実行: 選択したt検定を実行し、結果を得ます。t検定は、2つのサンプルの平均値の差が統計的に有意かどうかを評価します。結果には、t値(t-statistic)とp値(p-value)が含まれます。 ④ 結果の解釈: 得られたp値を帰無仮説が成立する確率と比較します。通常、あらかじめ設定した有意水準(例: 0.05)と比較して、p値が有意水準未満であれば、帰無仮説を棄却し、対立仮説を採択します。これは、2つのサンプル間に統計的に有意な平均値の差があることを示唆します。 どんな些細なことでも教えていただきたいです。 どうぞよろしくお願いいたします。

  • 有意差

    農学を学んでいます。しかし実験などをすると「有意差」があるのかないのか、という結果の処理がつきものです。統計学を全く勉強していないのでT検定からp値をだして有意差を求める方法がよく分かりません。 対応がある場合のT検定をして、有意差がある(p<0.05)と求める過程(計算式)を教えていただけるとありがたいです・・・。 

  • 「有意差がない」

    「1要因のANOVAで、A群とB群の間には有意差がなかった」ということを示したいのですが、検定してみたところp値が0.07で、有意傾向にあるとも解釈できる値になりました。 この場合でも、α=0.05と定めていれば有意差は無かったと断言していいと思いますか??

  • 有意差を出したいのですが

    医療系の研究をしています。 痛みを防ぐため、ある対策をしました。同条件のグループAとBがあり、Aにはある対策を行い、Bにはなにもしませんでした。Aでは「痛みあり」が11人、「痛みなし」が20人でした。Bでは「痛みあり」が18人、「痛みなし」が17人でした。対策を行ったAのほうが痛みの発生率が少なかったことに、有意差をだしたいのですが、どのような検定を行えばよいのでしょう?また、有意差ありとなるでしょうか?どうか教えてください。

  • 有意差があるかどうか・・・教えてください

    以下のデータで有意差があるかどうかわかりますでしょうか? すみません、以下の2カテゴリ(カテゴリ内には5つのデータ有り)に関して、カテゴリA,Bが有意差あるかどうかはどのように算出すればよいでしょうか? 有意差基準P<0.05で判断したいのですが、データ比較をどうやってするのか分からないので教えてください。 質問内容わかりにくく申し訳ありません。 同じ列の数値は一致が望ましいのですが、この差分踏まえて有意差出したいのです。 カテゴリA/カテゴリB 2020.0/1945.6 2100.0/2092.2 2200.0/2200.2 1500.0/1509.8 1550.0/1462.8

  • 有意差は無いが、・・・な傾向が認められるとは?

    統計の表現法の解釈に関して教えてください。 例えば、検定群A,対照群Bという2つのグループがあって、BよりAの方が平均値は少し高い結果が得られたものの、しかしバラつきが大きいため、統計的な有意差が無いと計算された場合、よく文献などで、 ”統計的に有意な差は無いが、Aの方が値が高い傾向が認められた。” などと表現されていますが、こういう表現はしても良いものなのでしょうか? 客観的な指標として統計を用いて差は確認出来なかったと計算されたのに、(おそらく期待した結果は差が出ることなので)心象としては差があると主張するのは諦めが悪いと言うか、話の進め方になんだか違和感があるのですが。。。

  • 統計の有意差に関して

    あるデータの有意差を求めたいのですが、データAとBは全く別のデータでなければいけないのでしょうか?Aの中にBが含まれる場合は、有意差を求める事は不可能なのでしょうか?測定の頻度を再考するために、全てのデータAと、抜き出したデータのまとめBに差があるのかどうか検定したいのですが。

  • 有意差の検定について

    現在ある部品の評価を行っています。 高温に放置して、試験前後で部品が位置ズレを起こさないか? ということを知るための評価です。 サンプルがあまり用意できなかったため、3個を試験にかけました。 また、サンプル数が少ないと結果の精度に影響がでると考え、 3個のサンプルに対して3回測定を行いました。 擬似的(?)には試験前後で、各9個のデータを持っています。 ところが測定のバラツキが若干大きく、単純な平均を とるとものすごく位置ズレを起こしたように見えてしまい、 判断に困っています。 以下お教え頂けないでしょうか? 1.9個の少ないサンプル数で、高温放置試験が結果に対して   有意であるかを調べたいのですが、   有意差の判断をすることは統計的に可能でしょうか? 2.実際にT検定を行ってみたところ、P値が約0.3で有意でないと   考えられるのですが、この結果は正しいでしょうか? 統計についてはあまり知識がありません。 よろしくお願いします。