• 締切済み

分析の個人差を調べるには、どういう検定を行えばよいでしょうか

今、ある成分の分析(法)について、測定者による違い(個人差)が(有意に)あるのかないのかを検証したいと考えています。 例えばですが、測定者が4人いた場合、適当な数のサンプルを用意して同条件で一斉に分析し、以下の様なデータを分散分析すれば良いのかなと考えています(測定者が2人なら、対応のあるt検定でしょうか)。 つまり、各自が出した値の平均を比較し、有意の差があるのかないのかを見る、ということで検証出来るのだろうという考えです。 測定者 Aさん Bさん Cさん Dさん サンプル1 1234 1235 1236 1237 サンプル2 3456 3457 3458 3459 (中略) サンプル6 6781 6782 6783 6784 まず、第一のご質問なのですが、こういう考え方で大筋間違っていないでしょうか? もしも決定的にダメな点があれば、どういう実験にすればより良くなるか、知りたいと思います。 またこの時、少し気になっているのが、サンプルの濃度がサンプルごとに大きく違っていたらまずいのだろうかということです。 上の例だと、4桁ということで大体同じかなとも思うのですが、例えば以下の様にサンプルごとの違いが大きいと、分散分析して良いのか、少し心配になっています。 測定者 Aさん Bさん Cさん Dさん サンプル1 34 35 36 37 サンプル2 3456 3457 3458 3459 (中略) サンプル6 26781 26782 26783 26784 第二のご質問として、こういう場合はどう考えるべきか、知りたいと思っています。 こういう事に通じておられる方のご意見を、うかがってみたいので、どうぞよろしく御願いします。

  • 9001
  • お礼率76% (20/26)

みんなの回答

  • backs
  • ベストアンサー率50% (410/818)
回答No.4

> 上記の様に試験し検定して、要因B(測定者)について計算されるP値を見ればよいのかなと思っていますが、いかがでしょうか。 いいんじゃないですか。 ただ、 > TwoWayANOVA.xlsでやっていることが、違うのかどうか、 という点に関しては私には分かりません。なぜならExcelの分析ツールの使い方が分からないので、追試のしようがないからです(^_^;) 少なくともExcelの分析ツールを使うよりはTwoWayANOVA.xlsの方が良いかとは思います。

9001
質問者

お礼

さっそくお読みいただき、ありがとうございました。たすかっています。 >> 上記の様に試験し検定して、要因B(測定者)について計算されるP値を見ればよいのかなと思っていますが、いかがでしょうか。 > >いいんじゃないですか。 ...ありがとうございます。よくわかっておられる方に見ていただいて、安心しました。 >ただ、 > >> TwoWayANOVA.xlsでやっていることが、違うのかどうか、 > >という点に関しては私には分かりません。なぜならExcelの分析ツールの使い方が分からないので、追試のしようがないからです(^_^;) > >少なくともExcelの分析ツールを使うよりはTwoWayANOVA.xlsの方が良いかとは思います。 ここで、これら2つの中身が違うのかどうかわかっていないことについて現在悩んでいるのは、試しにTwoWayANOVA.xlsの「各水準の繰り返し数が全て等しく、2以上の場合」のサンプルデータをエクセルの分析ツール(分散分析: 繰り返しのある二元配置)で解析してみたところ、TwoWayANOVA.xlsの出力結果の「モデル I(母数モデル)」と同じ数字が得られたからです。 今やっていることについて、TwoWayANOVA.xlsで解析したよと他の人に説明したとき、別にエクセルの分析ツールでやってもよかったんじゃないかとか、現に同じ数字が得られるじゃないかとか言われても、現状「そうだよねー...」としか答えられないので、なんでこの件についてエクセルの分析ツール(分散分析: 繰り返しのある二元配置)での解析ではだめなのか、知っておかねばとおもったわけです。 それにしても、統計の世界では、エクセルはつくづく信用されてないのですね。 ともあれ、先程記した組み合わせで実験して問題なさそうで、よかったです。ありがとうございます。

  • backs
  • ベストアンサー率50% (410/818)
回答No.3

たしか自分自身のwebサイトは掲示できないというルールがあったので、、、 webサイトからのリンクは解除してありますが、群馬大学の青木先生が作成されたExcelワークシートがあります。 http://aoki2.si.gunma-u.ac.jp/lecture/stats-by-excel/vba/ これを試してみては?

9001
質問者

お礼

早速ご示唆いただき、ありがとうございました。 おおしえいただいたページを、今、みたところです。 今回の話に使えるのは、「プログラム」「17. 二元配置分散分析」 (http://aoki2.si.gunma-u.ac.jp/lecture/stats-by-excel/vba/html/TwoWayANOVA.html) の「エクセルファイルをダウンロード」 (http://aoki2.si.gunma-u.ac.jp/lecture/stats-by-excel/vba/xls/TwoWayANOVA.xls) かなと思いましたので、これをみているところです。 これの「繰り返し≧2」というワークシート(各水準の繰り返し数が全て等しく、2以上の場合)で、以下の様な組み合わせで試験していこうかと考えてみました。 これは例えば、試験サンプルをA-Cの3種用意し、測定者を1-4の4人用意し、各々の組み合わせで各2回ずつ分析を行った、という設定です。 要因A(試験サンプル) 要因B(測定者) 観察値(分析値) サンプルA 測定者1 3 サンプルA 測定者1 1 サンプルA 測定者2 7.8 サンプルA 測定者2 5.6 サンプルA 測定者3 10.3 サンプルA 測定者3 14.3 サンプルA 測定者4 2.8 サンプルA 測定者4 4.4 サンプルB 測定者1 7.1 サンプルB 測定者1 3.8 サンプルB 測定者2 6.2 サンプルB 測定者2 7.9 サンプルB 測定者3 15.5 サンプルB 測定者3 6.7 サンプルB 測定者4 9.4 サンプルB 測定者4 12.6 サンプルC 測定者1 9.7 サンプルC 測定者1 3.5 サンプルC 測定者2 10 サンプルC 測定者2 7.2 サンプルC 測定者3 11.9 サンプルC 測定者3 5.1 サンプルC 測定者4 4.2 サンプルC 測定者4 9.1 上記の様に試験し検定して、要因B(測定者)について計算されるP値を見ればよいのかなと思っていますが、いかがでしょうか。 (エクセルの分析ツールの「分散分析:繰り返しのある二元配置」と、このTwoWayANOVA.xlsでやっていることが、違うのかどうか、いまひとつわかっていないのですが...) もしもお時間があれば、ご一読ください。

  • backs
  • ベストアンサー率50% (410/818)
回答No.2

対応ありの一元配置分散分析のことを乱塊法と説明している書籍もあれば、それを二元配置の分散分析として解説している書籍もありますね。私は紛らわしいので、 森・吉田「心理学のためのデータ解析テクニカルブック」北大路書房 の教えに従って、実験デザイン名で区別するようにしています。まぁ、どちらも言い方が違うという理解でも良いとは思いますが。。。 > Excelの分析ツールで「分散分析:繰り返しのない二元配置」を使えば(実質的には)解析し判断出来るのかなあと思ったのですが、これで大丈夫でしょうか? Excelの繰り返しのない二元配置がどのようなものか知らないので良く分かりませんが、普通に考えて良くないでしょう。繰り返しのない二元配置分散分析と乱塊法は異なるものだからです。 私の結論としては「Excelで分析するのはやめたほうがよい」ということになりますので、Excelについては他の方が回答してくれるのを待ちましょう(^_^;) > 計算数値は繰り返しのない二元配置分散分析と同じになる・・・ 結果は異なります。ただし、ここのスレッドでも言われていますが、分散分析といっても色々な実験デザインがあるので、方々で呼び方が異なることもあるのではたから見ると「ごちゃまぜ」になっている部分もあります。 乱塊法についてのページ http://aoki2.si.gunma-u.ac.jp/lecture/TwoWayANOVA/randblk.html などを参照にしてRでやってみては? > サンプルごとの濃度の違いが大きくても問題なかろう というか、サンプルごとの濃度に違いがあるかどうかを確かめるための検定でしょう?ここに提示されているデータは見るだけでサンプル間に顕著な違いが見られるので、そもそも(実質的には)検定する必要もないと思います。

9001
質問者

お礼

ありがとうございました。 >対応ありの一元配置分散分析のことを乱塊法と説明している書籍もあれば、それを二元配置の分散分析として解説している書籍もありますね。 >まぁ、どちらも言い方が違うという理解でも良いとは思いますが。。。 「対応ありの一元配置分散分析」「乱塊法」「二元配置の分散分析」は、各々、同じことを別の言い方で表現しているのだとのこと、了解いたしました。 >Rでやってみては? 残念ながらRは使ったことがなく、以前ダウンロードして触ってはみたのですがインターフェースに慣れず今のところ断念しております。「Excelで分析するのはやめたほうがよい」の結論は、自分のような素人にはきついなあというところです。 >というか、サンプルごとの濃度に違いがあるかどうかを確かめるための検定でしょう?ここに提示されているデータは見るだけでサンプル間に顕著な違いが見られるので、そもそも(実質的には)検定する必要もないと思います。 ご説明が悪く、すみません。これらのサンプルを題材として、分析の個人差があるのかどうか、あるとしてどれくらいかといったことを調べようという話ですので、サンプルごとの濃度に違いがあるかどうかは、ご指摘のように既知の内容です。ここで気になっているのは、上記の目的のために題材として使う複数のサンプルの間で、濃度の違いが大きいと、まずいのかなという点です。 「Rでやってみては?」の点で、自分にとっては、ちょっと敷居が...という感じがしてきました。Excelの分析ツールをそのまま利用するのはよくないのだとして、Excelの関数を利用してこの目的を達するために、参考になる解説ページがあればなあという状態です。もしも、気付きがあれば、またよろしくおねがいいたします。

  • backs
  • ベストアンサー率50% (410/818)
回答No.1

対応のある1元配置分散分析で問題ないでしょう。

9001
質問者

お礼

さっそくレスいただき、ありがとうございました。たすかります。 backsさんにコメントいただいた「対応のある1元配置分散分析」は、これまでやったことがないので、急ぎ勉強したいと思います。 分散分析については、長らく、Excelの分析ツールに頼ってきているのですが、 http://q.hatena.ne.jp/1160661553 を見ると、対応のある一元配置分散分析はExcelの標準の機能(分析ツール?)では対応していないと書かれているので、どうしようかと思案しています。 なんとか、Excelの関数を使って、この例のような検定を、対応のある1元配置分散分析で行いたいのですが、参考になるページはないものでしょうか? もしも、ここを見たらよくわかるよというページのアドレスを教えていただけたら、まずそれを見てトライしますので、良い参考例があれば、おねがいいたします。 (今、自分なりに調べていて、解らなくなったのですが... ) http://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/arc013/382.html を見ると、対応のある一元配置分散分析は乱塊法のことだと書かれており、また、計算数値は繰り返しのない二元配置分散分析と同じになると説明されています。 http://www.statistia.com/excel/anova_3_1.html では、更にあっさりと「繰り返しのない二元配置の分散分析は「乱塊法」とも呼ばれており」と書かれていて、Excelの分析ツールで「分散分析:繰り返しのない二元配置」を使うという説明が続いています。 これらを自分なりにまとめると、結局、今回の問題については、Excelの分析ツールで「分散分析:繰り返しのない二元配置」を使えば(実質的には)解析し判断出来るのかなあと思ったのですが、これで大丈夫でしょうか? それと、「第二のご質問」の件については、対応のある1元配置分散分析ならサンプルごとの濃度の違いが大きくても問題なかろうという理解でよいでしょうか。もしも、それは違うよということでしたら、おおしえください。

関連するQ&A

  • 統計(有意差の検定)について

    実験データの統計処理についての質問です。 A,B,C,Dという項目をそれぞれ3回ずつ測定し、以下のようなデータが得られました。 A (1)1.369 (2)1.58 (3)1.484 B (1)0.180 (2)0.169 (3)0.180 C (1)1.543 (2)1.648 (3)1.519 D (1)0.297 (2)0.300 (3)0.318 そこで、B/AとD/Cの2群について有意差があるのか検定したいと思っています。 しかし、このデータで、例えばB/Aに関して、 B(1)/A(1)、B(2)/A(2)、B(3)/A(3)のように(1)(2)(3)がそれぞれ対応しているわけではありません。 こういう場合、どのようにして有意差の検定をすればいいのでしょうか? 同じような質問を検索したのですが、見つからなかったため質問させていただきました。 よろしくお願いします。

  • 3群の有意差検定について

    初めて質問致します。 統計学については素人ですので、的外れな質問でしたらすみません。 現在、A・B・Cの3群についてある値を算出し、その値によって3群が分類できるかどうかを検討しております。 A・B・Cはそれぞれ標本数が異なっており、対応はありません。 等分散性の検定→分散分析→多重比較という手順で以下のように行いました。 Levene検定(有意差なし)→一元配置分析(有意差あり)→Bonferroni検定 Levene検定(有意差あり)→kraskull- wallis検定(有意差あり)→Bonferroni検定 この検定方法(特にBonferroni検定の採用)は正しいのでしょうか。色々調べてみたのですが結論が出ないので質問させていただきました。 ご教授よろしくお願いします。

  • 統計分析の方法と意味

    下記(1),(2)は5日ごとにA区とB区の値を示したもので、 A区とB区の間に有意差があるのかを調べたいのです。 時間的経過があるので単純に一元配置の分散分析では、おかしいと思い、単回帰分析を行ったところ、理解できない結果が出てきました。結果の意味が十分出来ていないのか、そもそもこのような分析に単回帰分析を用いること自体が間違っているのでしょうか。間違っているなら、正しい分析を教えてください。分析はエクセルで行っています(エクセル統計も入っています)。 統計について全く知識がありませんので、専門用語をあまり使わず、教えてください。 (1)A区 50.4,44.1,34.1,15.8   B区 67.5,46.8,39.5,16.6  一元配置の分散分析を行うと両区に有意差はない。  単回帰分析を行うと5%水準で有意差がある。 単回帰分析の結果は正しい気がする。 (2)A区 12.6,4.2,1.9,1.4   B区 12.0,5.9,2.0,1.0 一元配置の分散分析を行うと両区に有意差はない。  単回帰分析を行うと5%水準で有意差がある。 単回帰分析の結果は変な気がする(有意差がないのが正しいのでは)

  • 重回帰分析と分散分析の結果が違う

    次のようなRのコードを書きました。 x1~x7は因子で、1がなし2がありだと思ってください。 最後のxがデータです。これが大きい程よいと言う意味だと思ってください。 data <- data.frame( x1 = c("1","1","1","1","2","2","2","2"), x2 = c("1","1","2","2","1","1","2","2"), x3 = c("1","1","2","2","2","2","1","1"), x4 = c("1","2","1","2","1","2","1","2"), x5 = c("1","2","1","2","2","1","2","1"), x6 = c("1","2","2","1","1","2","2","1"), x7 = c("1","2","2","1","2","1","1","2"), x = c(35,48,21,38,50,43,31,22) ) data colnames(data) <-c("B","C","B:C","D","B:D","A","7","x") data summary(aov(x ~ A+B+C+D+B:C+B:D,data=data)) summary(lm(x ~ A+B+C+D+B:C+B:D,data=data)) 結果としましては、 分散分析では因子C以外は有意差がないという結論を出しており、 重回帰分析では因子Bと因子B:D以外は有意差がないという結論を出しています。 重回帰分析と分散分析は基本的に数学的にやっていることは同じと言われたのですが、結果が異なり戸惑っています。 なぜこのようなことになったのか心当たりがある方ご教授ください。 よろしくお願いします。

  • 分散分析の交互作用について

    はじめまして、 SPSSの三要因分散分析についてお尋ねします。 (1) A×B×Cの三要因分散分析を行いました。すべて2水準です。 結果、主効果、交互作用ともに有意さはありませんでした。 (2) 次にA×B×Dの分散分析を同様に行いました。 すると、A×Bの交互作用が有意でした。 (1)と(2)におけるAとBは同じデータなのに、なぜ(2)では交互作用が生じてしまったのでしょうか。 ちなみにA、Bは被験者内要因、C、Dは被験者間要因です。 ご教授の程、どうぞ宜しくお願い致します。

  • 複数回の検定 統計

    多重検定・多重比較について教えて下さい。 例えば、A、B、C、Dの4群があるとします。 このとき、A群とD群およびB群とC群に関して平均値に有意差があるかどうかを検定したい場合、 t-検定を2回行う方法と1元配置の分散分析から多重比較を行う方法、どちらが適切なのでしょうか? また、A群とB群、B群とC群、C群とD群、D群とA群に関して平均値に有意差があるか検定したい場合、 t-検定を4回行う方法と、1元配置の分散分析から多重比較を行う方法、どちらが適切なのでしょうか?? 詳しい方、宜しくお願いします。

  • 分散分析について

    分散分析について簡単な事で良いので教えてください A:P値>有意水準α B:P値<有意水準α のとき、t検定では、Aでは判定保留、BではH1を棄却となったと思うんですが、これが3つの場合、分散分析の場合だとどうなりますか? 単純に、Aは判定保留、Bは全てに差があるのでH1を棄却でいいですか? もう一つ、少なくとも2つには差があるけど、1つは分からない場合ってのもあると思います、その場合はどのような関係式になりますか? よろしくお願いします

  • 多重検定 選び方

    どの多重比較を使えばよいかについてお聞きしたいです。 controlA(約15反復)群とcontrolB(約15反復)群があります。 このA,Bは平均値に差があることがわかっています(ただし等分散性は仮定できる場合もできない場合もあります)。 サンプルC、D、E、、、、群(それぞれ約50反復)を多重比較することで各サンプル群がA,Bどちらに属するか、もしくはどちらにも属さないかを見ていくために多重検定が使えないか悩んでいます。 ・Dunnett法を用いることでAと有意有り無し、Bと有意有り無しをそれぞれ判定する。 ・Tukey法を用いてAとBとX(X=C,D,・・)の3群で比較する。 ・もっと適切な方法(Bonferroniとか?)はないか などを調べています。 そこで どれが適切か、またその際に気をつけなければいけないことは何か (反復数の違い、等分散性の確認など) ご指摘いただければ幸いです。 よろしくお願いします。

  • 検定で出てしまった有意差を認めたくないのですが。。。

    2つの装置で同じ試料を測定した値を比べています。 この2つの装置が同等であると言いたいのですが、一元分散分析による検定でも対応のあるt検定でも有意差が出てしまいます。n数が多い(n=120)のも問題なのですが、これはどうにもなりません。 以前、ある統計の本で、有意差が出てしまったけれど、それが意味のある差とは思えない場合は、区間推定までやって説明(言い訳?)することができる・・・というようなことを読んだことがあるのですが、それは具体的にどういうことなのでしょうか。 また、それ以外にも検定で出てしまった有意差を言い訳できるような手法があればご教授いただきたいと思います。

  • 重回帰分析かロジスティク分析か?

    多変量解析で、教えてください。 20人のケースで、Xという現象がー100~100%の幅で、増減したとして、事象A,B,C,D.E.Fが関与しているかどうかを調べるとします。 それぞれが、それぞれA~Fの現象と、変動率を散布図にて、表示すると、A,B.Cで相関があり、相関係数は R=±0.4~0.7でした。D,E.Fは、r=0.2以下でした。 単回帰分析をすると、要因A,B,Cでの回帰式は、有意とされました。A,B.Cの要因がどの程度のつよさで、Xという現象に関与しているかを調べる必要があるとすると、多変量解析をする必要があると思いますが、 その方法論として、X現象に対する重回帰分析が良いのか、X現象が増加するか、減少するかという現象に置き換えて、ロジスティク回帰分析の方が良いでしょうか? それとも、症例数から言うと多変量解析は無意味でしょうか? また、もし重回帰分析、ロジスティク回帰するとすると、A~F全て組み込むのか、単回帰で、有意だったA~Cだけで良いのでしょうか? 見よう見まねで、A~Cだけで重回帰すると、分散分析ではすべて有意でしたが、回帰式では、A,Bの組み合わせでは、A、B共に有意、A~Cの組み合わせだと、Aだけ有意とでました。この所見の記載として、 単変量解析では、A,B,Cが有意だったが、多変量解析では、Aのみが有意であるとして良いのでしょうか?