• ベストアンサー

データの比較方法

手持ちのデータと公表されているようなデータとの比較検定は簡単にできますか? たとえば専門的な統計ソフトを使わず、エクセルフとかリーソフトで行うとか… ex. A)手持ちのデータ(生データあり)は、n=300  22.5±4.00 B)手持ちにないデータ(生データなし )、n=1400  23.0±5.90 というような場合、A,Bで差があるかどうか検討したいと考えています。 ある論文では、t検定をしていましたが生データなしでt検定は可能でしょうか?

質問者が選んだベストアンサー

  • ベストアンサー
  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.1

>手持ちのデータと公表されているようなデータとの比較検定は簡単にできますか? 簡単かどうかは、その人次第。   >生データなしでt検定は可能でしょうか? 生データとは、何でしょうか。一般的には、加工していない、例えば四捨五入をしていない生データで統計をします。が、それは枝葉末節。利用しようとするものは、事実なら全てデータですが。生か死んだかではなく、事実か否かが問われます。  t検定が適切かどうかは、これだけでは不明です。t検定は、一番の問題は、ランダムサンプリングがされているか、そのデータが正規分布しているか、の検証が不可欠です。私ならこの場合、別の方法を選択します。  気になるは、単位。なぜなら、平均値がわずか0.5の差ですから、統計学的には有意差有りでも、「現実にはどうでもよい、気にするほどでない」ということになるかも。

genki_max
質問者

お礼

回答ありがとうございました。 本データは、体格の指数であるBMIについて、私が測定したデータが全国平均と統計学的に有意差があるか検証できるか苦慮していたところでした。先行研究ではt検定にて比較検定をしたものがあるものの(全データを入手しての検定かは不明)、文科省の公表データは集計結果のみで全データではないため何か方法があればと考えていました。

その他の回答 (1)

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.2

 指導者がいる、例えば学生、院生だと、教員が指導するべきで、そんな場合は、「教員に能なしのレッテルを貼る」ことになるので、以下は読まないこと。質問者の中には、質問することで「能なしのレッテル」を貼っている人もいて、『教授も、こんな失礼な学生、院生を抱えて苦労するな』とこの種の質問を読むたびに感じています。  一人でやっていることを前提に。あるいは、検定の練習なら、    検定法としては、U検定を勧めます。この場合は、順番だけですから、分布は考慮する必要がありません。  ただ、1400人のデータというのが、平均値と標準偏差だけなら(生データではない、の返答がありませんが、このと意味ですか?)、t検定しか使えません。両群の平均と標準偏差から、t値を計算し(電卓で)、自由度から有意差の判定をしたことがあります。  ただし、正規分布かどうか、それにランダムサンプリングをしているか、その上、AグループのデータをBグループのデータが含んでいないか、をクリアする必要があります。

genki_max
質問者

お礼

ご回答ありがとうござました あるイベントで身長、体重などを測定する機会があり、せっかくなので全国平均などと比較できたらと思い質問させて頂きました。 手計算でできる範囲ならば、頑張ってやってみたいと思いますが・・・

関連するQ&A

  • 2群間のデータ比較

    ある化合物Xの生体への影響を調べる実験をしました。 A群は無処置,B群には化合物Xを投与。各群n=5。 その結果,ある血中パラメータ(正常値:20-50)において下記のような数値が得 られました。 A群:30,35,40,35,40 B群:9000,200,40,7000,4000 正常値が25-50なので,明らかにB群(5例中4例)は異常値を示しており,「生物 学的有意差あり」と結論できます。 では統計学的にはどうだろうかと思いExcel関数を用いて統計処理をしました。 まず,FTEST関数で等分散性を調べたところ,P=7.15E-12となり,不等分散である ことがわかりました。 次に,TTEST関数(不等分散,両側検定)で群間比較したところ,P=0.088538(P>0.05 )となり,統計学的有意差なしとなりました。 生物学的有意差は明らかなのに統計学的有意差が無しとなり,気持ち悪いです。 この統計処理の手順,どこか間違っているでしょうか?

  • 統計学についてお願いします。

    統計について素人です。 A群(n=30)とB群(n=40)を比較して有意差があるか調べたいと思います。 検定の順序としては、A群とB群は対応のあるデータではないです。 その為、まずは正規性の検定を行うことになるのでしょうか。 次に正規性があれば、F検定で等分散か確認し、等分散であればステューデントのt検定、等分散でなければウェルチのt検定ということになるのでしょうか。 そして正規性が無ければノンパラメトリック検定となるのでしょうか。 ここまでは合ってますか? それでここからが本題なのですが、私はSPSSやエクセル統計などの統計ソフトを持っていません。 普通のエクセルのみで、このA群とB群を比較して有意差があるか調べる方法を教えていただけませんでしょうか? 手順等できるだけ詳しく教えていただけますと幸いです。 よろしくお願いいたします。 (最悪、エクセル統計であれば購入できそうですが…)

  • 【統計】 geometric mean の 比較? 【基礎】

    以下、よろしくお願い申し上げます。 基本的なことですみません。。 【質問】 Group A ; 10,100,1000,10000 Group B ; 1000,10000,100000 例えば、上の二つのグループを比較する際、 Geometric meanで、Aは316.2、 Bは10000となりますよね。 その際、統計的に、この差は有意であるかを計算する場合、 普通のT検定でよいのですか? Group Aの数値には、10,100,1000,10000をそのまま使い、 Group Bの数値には、1000,10000,100000をそのまま使って T検定していいのでしょうか? あるいは、いったんLOG換算して、Aには、1,2,3,4を Bには、3,4,5を使ってT検定したほうがいいのでしょうか? お手数おかけしますが、よろしくお願いいたします。

  • 細胞株での試験結果データの取扱いに関して質問です。

    細胞株での試験結果データの取扱いに関して質問です。 いま、ある細胞株に薬剤を添加し、反応(=活性など)をみる試験をするとします。  薬剤A 10well  薬剤B 10well (質問)---------------------------------------------------------------------------  プレート上で細胞株へ薬剤A添加試験を同時10well、同様に薬剤B添加試験を同時10well試行して得られるデータを、それぞれ薬剤A:n=10、薬剤B:n=10とし、薬剤AとBの反応性の違いを統計解析にて検定し、p値を算出するというのはあまり意味がないことなのではないでしょうか? ---------------------------------------------------------------------------------- バラつきが小さいとされる細胞株の試験で有意差検定を実施するのは意味が無いというか、 バラつき(誤差)が小さければ、いくら臨床的意義のないような僅かな差(効果量)であっても有意差がつくことは統計学的に当然なはずです。 また細胞株での試験は臨床試験などとは違い、試行を複数回繰り返すことが容易です。 試行を繰り返せばβエラーが下がるため検出力が上がり、さらに有意差がつきやすくなります。 そのため細胞株の試験で有意差検定をするのはナンセンスで、 「薬剤A:代表値○, 薬剤B:代表値△」のように 「代表値を直接比較」 すれば済むのではないかと思います。 このような質問をしたのは、細胞株を用いた研究の論文や学会発表をみていると いい結果であるかのうように見せるために、わざわざ意義の薄いと思われる有意差検定をしているのではと思う節があるからです。 細胞株から得られたデータで有意差検定するのはナンセンスだと思いませんか? ご回答頂ける方お願いします。

  • 検定方法はT検定?ウィルコクソン?

    検定方法についてです。統計の本をいろいろと読んでやってはみたのですが、数人に聞いたところT検定で良いという人とウィルコクソンだと言う人などがいてかなり困っています。助けてください。 --------------------------------------------------------------- 1分間のデータが7200個あり、その平均値の比較です。A群(n=8)、B群(n=14)の二群に分けています。 介入は、介入aと介入b。 比較したいのは以下です。 (1)A群の介入の前と後を比較 (同様にB群) (2)A群の介入aの前と介入bの前を比較(同様にB群)   A群の介入aの後と介入bの後を比較(同様にB群) (3)介入aの前のA群とB群を比較 (同様に介入b)  介入a後のA群とB群を比較 (同様に介入b) (4)変化量(介入後-介入前)を比較  I:介入aの変化量のA群とB群を比較  II:A群の介入a変化量と介入bの変化量を比較 -------------------------------------------------------------- (1)(2)は対応のあるT検定、(3)は対応のないT検定ではだめですか? (4)-I、IIの検定方法は何がよいのでしょうか?また、変化量は絶対値になおすべきですか? どんな検定をすべきかくわしく教えていただけたらと思います。

  • 「比」を用いた多重比較検定について

    大学院で医学研究をしているものです。統計に関して素人のため質問させてください。 ある薬剤の血小板に対する作用を調べています。5人程度からサンプル血をもらって、control群と薬剤およびアンタゴニストなどを含む4群との多重比較検定をしたい思っています。必要な比較はコントロール群との比較のみです。 Bonferoni法やTukey法、Dunnet法などで検定しましたが、血小板は反応性に個人差が非常に大きいのが難点で生データのままではなかなか有意差ありという結果が得られません。n数を増やすにも限界があります。例えば、control群が10、薬剤群が20とい人もあればcontrol群が100、薬剤群が200というように傾向は一貫していますが、値の差は大きいです。そこでコントロールを全て「1」としてそれに対する比を取り、同様に検定するとうまく有意差がでます。比に変換してしまえば、生データそれぞれの持つ絶対量としての情報が失われますが、薬剤により反応が上がったか、下がったかは明確になります。これを用いた検定が果たして統計学的に正しいのかがいろいろ調べてみたのですが、よく分からず困っております。 ご回答お待ちしております。

  • 生存率の比較をしたいのですが。

    マウスの実験を行っており、各群6頭程度のマウスに関して、Aの処置を行ったときと、Bの処置を行ったときとで、生存率について、統計学的な有意差を検定したいのです。 論文を見るとlog-rank testという検定方法などが使われていました。 検定法の適応基準(どの方法で検定したらいいのか?)や、 実際にどのようなソフトウエアを購入したらいいのか、など教えていただければ、嬉しく思います。 よろしくお願いいたします。

  • カイ二乗検定で処理したいのですがデータのとり方がわからず困っています。

    左利き手と右利き手の被験者における、左右の耳の聴力低下度を調べています。 目的は、左と右の利き手の被験者で利き手の違いに意味があるかどうかどうかを知りたいので、統計はカイ二乗検定を用いています。 聴力低下度の指標は、高音域、低音域の2項目あり、さらに左右の耳があるので、計4項目からなります。データは順位尺度です。 データ入力は、被験者が重複するいわゆる複数回答形式です。 統計処理するデータの扱い方をお教えいただけないでしょうか。 統計に用いるデータは生データを処理するのでしょうか? 順位尺度の生データ(例数)の統計結果は、 自由度   3 カイ二乗値 23.33 危険率   p=0.0001 生データのカイ二乗検定を行うと、検定は棄却され両グループ間で有意差が見られました。 表にして示す場合、生データはn(総例数)が異なるため両グループ間の比較にならないので、構成比率(例数/n*100)で示します。 構成比率のデータで検定すると 自由度   3 カイ二乗値 6.15 危険率   p=0.150 構成比率のデータを用いカイ二乗検定を行うと、検定は採択され両グループ間は差がありません。 統計処理は、生データ比較でしょうか? それとも表にあらわすような構成比率の比較でしょうか? どちらが適切なのでしょうか? どうぞ、よろしくお願い申し上げます。

  • t検定とノンパラメトリック どっちが正しい?

    データが出たのですが差が有ると言っていいのかどうかがわかりません。/(。-。-。)\ マウス二群(A群n=20とB郡n=20)の生存期間を比較したいのですが差が小さい(差=7.8)ことも有って 対応の無いt検定ではp<0.05なのですがMann-WhitneyのU検定ではP>0.05です A群 平均126.1 標準偏差9.2 B群   133.9     11.6 F検定ではF値=0.621 P値=0.308 でありこれはt検定を使って良いとも解釈できますが ノンパラメトリックの方が正確であるとも聞きます この二群に統計的に有意な差はあるといえるのでしょうか? 御教授よろしくお願いいたしますm(_ _)m

  • テスト結果の伸びの比較について

    テストの伸びの比較をしたいと思っています。 Aというクラスの前期テストと後期テストの「伸び」と、Bというクラスの前期テストと後期テストの「伸び」の比較です。 AクラスもBクラスもそれぞれの前期と後期でのテストの平均点の伸びはt-検定で有意差が見られたのですが、 その「伸び」具合をAクラスとBクラスで比較する場合になにかよい方法はありますでしょうか? つまりどちらの伸びが優れているかどうかです。 この結果をもって、指導方法をどちらかに統一するための根拠のひとつにするのが目的です。 ※もちろん得点の伸びはさまざまな要因がありますので、このデータだけでどうこうすることは無いのですが、 材料のひとつにしたいと思っています。 単純にAクラスの伸びが10点で、Bクラスの伸び5点だったので、Aクラスのほうが伸びているとするしかないのでしょうか? 外部的な報告のデータに使用したいので、そのような伸び具合の比較を統計的にできる方法があれば助かります。