• ベストアンサー
  • すぐに回答を!

有意差検定

個々の計測値のわかっているA群(83.3、78.5、94.7、・・・・・)と平均値、標準偏差のみわかっているB群(80.0±3.0)で、統計学的有意差を検定する方法はありますでしょうか。用語の使い方も不正確かもしれませんが、すみませんがよろしくお願い致します。

共感・応援の気持ちを伝えよう!

  • 回答数2
  • 閲覧数765
  • ありがとう数3

質問者が選んだベストアンサー

  • ベストアンサー
  • 回答No.1

こんにちは。 数学的なことだけを考えれば、B群の分布が正規分布だと仮定でき、B群のサンプルサイズがあれば、できます。 普通に2標本t検定すれば良いのです(Wiki_平均の検定:等分散の場合): http://ja.wikipedia.org/wiki/T%E6%A4%9C%E5%AE%9A 2群の分散が著しく異なるときはもちょっと考える必要があります。 ただし、以降老婆心ながらですが・・ 2群の比較可能性があるか、がもっと大きな問題です。 2群のデータは違う文献からもってこられているのでしょうか? 1つの研究で、処理(A or B)をランダムに割り付けたりすれば その他の条件が平均的に同一になり、純粋に処理間の比較を行えますし、 ランダム化してなくても、同一研究内でデータのとり方によっては 調整もできます。 しかし、異なるバックグラウンドでとられたデータは 狙ってる因子による差なのか、それとも他の要因による差なのかが 区別できません。 その辺を考慮された上で、何らかの仮説を探索される分には 良いのかもしれませんが、比較の可能性についても考慮してみてください。 以上、とり急ぎ

共感・感謝の気持ちを伝えよう!

質問者からのお礼

迅速なご回答、本当に有難うございました。 御指摘の通り、処理を行なったA群と、処理を行なわなかったB群で比較を行ないたかったのですが、後ろ向き研究の為、B群のデータが残っておらず、文献に載っている平均値、標準偏差の値を代用できないかと思ったのですが、分散はかなり異なっています(A群 146.5、B群 9.0 でしょうか)。ただ、A群はこの研究で行なわれた処理以外はB群と異なる要因は作用していないと言って良いかと思います。この場合、平均の検定:異分散の場合(ウェルチのt検定)で検定して良いものなのでしょうか。また、可能なものでしょうか。 再び質問になってしまい、申し訳ございません。ご回答頂けましたら幸いです。

関連するQ&A

  • t検定で合っていますか?

    とあるデータを集めていまして、その内容を発表することになったのですが、統計学的有意差を 求めたほうがよいのでは?というアドバイスを受けました。 そもそもまったくの数学音痴な私にとってははじめから?だらけなのですが、なんとなく調べていくうちにt検定なるものにたどりつきました。2つの群の平均値の比較と書かれています。 しかし私としては3つの群の平均値を比較したいので、t検定を使うことが果たして正しいのでしょうか?それとも他に適切な検定方法があるのでしょうか? よろしくおねがいします。

  • t検定で合ってますか?

    とあるデータを集めていまして、その内容を発表することになったのですが、統計学的有意差を 求めたほうがよいのでは?というアドバイスを受けました。 そもそもまったくの数学音痴な私にとってははじめから?だらけなのですが、なんとなく調べていくうちにt検定なるものにたどりつきました。2つの群の平均値の比較と書かれています。 しかし私としては3つの群の平均値を比較したいので、t検定を使うことが果たして正しいのでしょうか?それとも他に適切な検定方法があるのでしょうか? よろしくおねがいします

  • 平均値の解析法について どの検定法を用いるか

    先日、以下のような質問をして… 「統計分析の初心者です。 データがあってもどの方法で解析をすればよいのか途方にくれています。 経年的に追跡しているデータで、平均値まで出しています。 平均値は低いほど良い結果です。 1年目、2年目、3年目と3回分のデータがあるのですが、1年目よりも2年目、2年目よりも3年目、1年目よりも3年目の方が良い結果が出ている(平均値が低くなっている)ことを統計的に解析したいと思っています。 どのような方法があるのか、たくさんあるかもしれませんが、教えていただけませんでしょうか? これからのためにも、なぜそれが良いのかも知りたいと思っています。」 そして回答者さまから、標準偏差について親切に教えていただきました。 早速、標準偏差を出してみました。 すると、またお聞きしたいことがでてきましたので、どなたか教えていただけませんでしょうか? 1年目のデータと2年目のデータの標準偏差を比較すると、2年目の方が小さくなりました。 これは、ある介入がこのデータに有意な影響を与えていると言えるのでしょうか? 有意差ありと。 2年目のデータと3年目のデータの標準偏差を比較すると、3年目の方が大きくなっていました。 これは、有意差が得られなかったとなりますでしょうか? このように、平均値は小さくなったが、標準偏差は大きくなっていたものに関しては、平均値が小さくなったのは、たまたま偶然そうなっただけというのをお聞きしました。 このように、たまたま偶然そうなっただけというものを、何とか有意差ありと言えるように解析するものはないものでしょうか…? また、これとはまた別の話になるかもしれませんが、よく聞くt検定やカイ二乗検定、マンホイットニーU検定などをこのような研究に使用するとすると、どのように活用すれば良いのでしょうか? 男女や年齢がわかっているのと、得られたデータの値の高い群と低い群を分ける明確なラインがわかっています。 的外れな質問だったら申し訳ありません! 周りに相談できる方がいないので、もしよろしければご回答いただけませんでしょうか? よろしくお願いいたします。

その他の回答 (1)

  • 回答No.2

おはようございます。 これも、数学的なことだけを考えたら、ウェルチで良いかもしれません。 ただ、分散(A群 146.5、B群 9.0)があまりにも違いすぎていませんか? 介入の差だけでこれだけ分散に差が出るのは考えにくいような気もしますが。。 A群に著しい外れ値があるのか、A群、B群は背景に本質的な差があるのか。 そもそも、これだけ分散が違う2群の「平均」を比較することは意味があるのか ということも検討すべきでしょう。 A,B以外の因子も見えている範囲では大体一緒でも、何か見逃しが あるのかもしれません。 因みに、そういった未知の因子も含めて平均的に同一にし、 偶然誤差に転化してくれるツールがランダム化です。 しかし、検証すべき仮説の一つとしてピックアップする程度であれば許容されるかもしれませんね。 最後の方は蛇足かもしれませんが、以上、とり急ぎ。

共感・感謝の気持ちを伝えよう!

質問者からのお礼

再び迅速なご回答、どうも有難うございました。 確かにA群に著しい外れ値がありますが、計測値は計測値ですので、今回は平均の検定:異分散の場合(ウェルチのt検定)でいこうかと思います。将来的には、B群(コントロール群)の計測値も集まってくる見込みです。 どうも有難うございました。

関連するQ&A

  • T検定? 有意水準を求めたく、T検定について調べています。

    有意水準を求めたく、T検定について調べています。同じ被検者のデータに対し2種類の評価方法で評価しました。その時の有意差水準を求めたいと思っています。 分かっているのは、それぞれの平均値、標準偏差、データ数(評価回数)のみです。またデータ数(評価回数)は同じ数です。 このような時はどのようにして有意水準を求めればよいのでしょうか?また有意水準を求めることは可能でしょうか? 初心者でほとんど検定についての知識はありません。 よろしくお願いいたします。

  • 不良率の差の検定

    不良率の平均値の差の検定に関する質問です。 ある製造ラインで製造された製品の10日間の不良率の平均値がA1%、標準偏差がS1で、その後に製造方法を変えて、10間の不良率の平均値がA2%、標準偏差がS2だとした場合、 (A1,S1)と(A2,S2)の数値をそのまま使用してt-検定しても良いのでしょうか?

  • 2データの経時的推移に相関があるか、を検定するには?

    臨床的「血糖値とHbA1cに相関がある」、 といえると思いますが、どういった検定をすれば、 2データ間の経時的推移に統計学的に相関がある、といえるのでしょうか。 例えば症例1~50で、A,Bの2つのデータをDay1,2,3,4,5に測定し、 その2つのデータ間の経時的推移に統計学的な相関があるかどうか、 ということを調べるとします。  症例1だけでみると、日を追うごとに、Aは上昇し、Bは低下しています。 症例2,3,4・・・も個々でみると、 AおよびBは視覚的には症例1と同様な動きをしています。 つまり、症例ごとにみてみると、 AとBは反比例の関係にあるように視覚的に見えます。 ただし、測定は5ポイントだけなので、 症例を1つとっても統計学的有意差は検定できません。 そこで、症例1~50をあわせれば、 統計学的に相関があるといえそうですが・・・。 データAの経時的推移(平均+標準偏差)と、 データBの経時的推移(平均+標準偏差)に「相関がある」 とはどのような検定をすればいえるのでしょうか。  つまり、最初の例で言えば、 血糖値の推移(1月、2月、3月・・・12月)と HbA1cの推移(1月、2月・・・12月)に相関がある、(たとえば、血糖値が上がればHbA1cも上昇する)、 ということはどうすれば統計学的有意にいうことができるでしょうか。 なお、症例1~50において、 データAは血圧のように個人間で大きな差があります。 ご教授のほどお願いいたします。  

  • 統計学・仮説検定について

    統計学での母平均の検定について 1:内容量250mLと書かれた缶ジュース10本の内容量を調べたところ  平均248mL,標準偏差4.22mLであった。  この表示は正当か、有意水準1%で検定せよ という問題と 2:ある大学の今年の出願者は101,360人で、昨年の出願者は98,676人であった。  出願者数の標準偏差を仮に7,000人としたとき、  今年の出願者は多いといえるか、有意水準1%で検定せよ という問題について 1:Z = (/x - μ) / (σ/√n) = (248-250)/(4.22/√10) = -1.50 ≧-2.81より不当とは言えない  (/xはxバーのことでほかの/は分数の意味です)  (2.81=t_{0.01} (9) ) 2:Z=(101,360 - 98,676)/(7000) = 0.383 ≦ 1.65より増えているとは言えない  (1.65 = 標準正規分布の片側設定の有意水準1%の値) と、解答がありました。 私としては、Z = (/x - μ) / (σ/√n) なのだから、2についても Z=(101,360 - 98,676)/(7000/√2)だと思うのですが、 どうして2だけ√2がつかないのでしょうか?

  • t検定について

    A) サンプル数 300  平均22.5  標準偏差4.00 B) サンプル数 1400  平均23.0  標準偏差5.90 のt 検定を」というご質問が出されていました。 私も興味ををもって解いてみましたが、best answer に選ばれた回答も出されておりましたが、ヒントであって、解は出ていませんでした。 次のようなことでいいのでしょうか。ぜひともお教えいただきたいので、よろしくお願いいたします。 この問題は仮説検定のうち、2つのサンプルの平均値に差があるかどうかを検定する問題だと思いました。 帰無仮説は 2つのサンプルの平均値には差がない」とします。 両群の平均的な分散は   ((300-1)*4^2*(1400-1)*5.9^2)/(300+1400-2)=31.50 このとき検定統計量は t=0.5/√(31.5(1/300-1/1400))=1.40 この問題では自由度が1698となり、分布表からは正確な数が出ませんが、正規分布になるときの数とから、有意水準5%なら 1.9779~1.9600 の間にありそうですので、検定統計量のほうが小さいと判断できると思いました。 よって「帰無仮説を棄却するすることはない。」と結論しました。 このようなことでいいのでしょうか。特に自由度が1698で分布表から具体的な数がきっちり求められないので、他のやりかたでなければならないのでは?と不安を感じているのですが。

  • 元データのないt検定

    お世話になっております。 Excelでt検定(ttest)を行う際に、元データがないときに 平均、標準偏差、n数 から有意差を求める方法を教えて下さい。 Excelを使わなくても、求められるなら大丈夫です。 宜しくお願いします。

  • エクセルで誤差範囲を設定したら、マイナスに!

    データは正規分布していないデータで、ノンパラメトリックな検定で有意差は出たのですが、エクセルでグラフを作ると、平均値より標準偏差が大きい値のため、最小値が0なのに、エラーバーがマイナスに突き抜けてしまいます。 この場合、このデータは使えないのでしょうか? (有意差は信頼できないものなのでしょうか?) 統計学に詳しい方でご存じでしたら ご回答よろしくお願いいたします。

  • 統計学入門書の例題で、標本平均7.5(標準偏差2.5、n=28)と標本

    統計学入門書の例題で、標本平均7.5(標準偏差2.5、n=28)と標本平均9.1(標準偏差2.3、n=25)を平均値検定した結果、z=2.43で有意水準5%で有意差ありとなっていました。ところが、それぞれの母平均を区間推定すると95%信頼区間で推定幅に重なりを持ってしまいます。もし、有意差があるなら、重なりを持たないと理解していますが…。当方の計算法の誤りまたは計算違いでしょうか?計算方法は、例えば前者の場合、7.5±1.96×不偏分散の平方根/28の平方根でやってます。

  • これはどういう意味ですか(泣)

    帰無仮説 2つの標本の平均値は等しい。 標本数1 6 平均値1 8.46 標準偏差1 4.002 標本数2 6 平均値2 21.82 標準偏差2 8.145 有意水準 0.05 検定方法 両側検定 F値 4.14217085610118 確率 0.0724572476022886 t値 3.60605002946898 確率 0.00479946268108932 自由度 10 結論 等分散の仮定は棄却されませんでした。 帰無仮説は有意水準 0.05 で棄却されました。 自由度 10 におけるPの値は 0.00479946268108932 です。 ある実験の前後の統計を出したいので、統計ソフトで計算した結果、よくわからない言葉が出てきてしまいました(泣) ちなみに標本数・平均値・標準偏差1が実験前で、標本数・平均値・標準偏差2が実験後の結果です。 5%有意差があるかないかを調べたいのですが・・この結論の日本語がよくわかりません。 どなたか詳しく説明していただけませんか。 バカですみません。

  • 統計の標準化について教えてください!

    大学院の学生です.データの標準化のことで教えていただきたいのですが,例えば1から10まであるデータをエクセルで標準化するにはどうすればよいのでしょうか.  また,標準化されたデータは「個々のデータを標準化すると,個々のデータの相対的な全体の位置を知ることができる」と理解してよろしいのでしょうか.  さらに,この標準化されたデータの統計学的有意差を見ることはできるのでしょうか?  教わったまま時が過ぎてしまい,理解出来てない部分が多いです. ですが教科書などを見ても簡単な表記(データ-平均値÷標準偏差)位で詳細がわかりません.先生に聞いても良くわかりません.長々とずうずうしくすみません,教えていただけましたら幸いです.宜しくお願いいたします.