• ベストアンサー

検査結果が正しいかどうかの証明について教えて

検査結果が正しいかどうかの証明について教えて 統計の得意の方教えてください。 1万件位の検査データがあります。生化学の検査で標準の検査法から少し逸脱した個所があって検査データに疑義が生じています。私としては標準の検査法で実施したデータと比較しても差がないと思うのですがそれを証明しなければなりません。そのためには母集団が1万件としたらどのくらいの標本のサンプル数が必要でしょうか? 追試で標準法と実際にやった方法の比較検討をしなければいけないと考えていますが、どのような検定法をやればよろしいでしょうか。検査結果のデータは陽性、擬陽性、陰性の3種類です。 よろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.2

 とりあえず陽性+か陰性-かだけ考えるとしますと、1万件のデータがあっても、陽性率P(+)が低かったり、標準の検査法におけるfalse positive(陰性のサンプルなのに陽性と判定する)の確率P(-|+)が高かったりするとやっかいです。  標準の検査法の結果陽性と判定される確率Q(+)は、false negative(陽性のサンプルなのに陰性と判定する)の確率をP(+|-)として Q(+) = (1-P(+))P(-|+) + P(+)(1-P(+|-)) であって、そのうち (1-P(+))P(-|+)/Q(+) の確率で「ホントは陰性」のものが含まれており、また、 P(+)(1-P(+|-)) )/Q(+) の確率で「ホントに陽性」のものが含まれている。  たとえば P(+)=0.1% P(-|+)=1% P(+|-)=1% だとすると、1万個のサンプル中、陽性と判定されるものは 10000個×Q(+) ≒110個 ぐらいあるけれども、そのうち「ホントは陰性なのに誤って陽性にされたもの」が100個ぐらい含まれている。つまり判定が陽性であるもののうち、ほとんどが誤判定である、ということになります。  さらに標準の検査法が再現性を持つかどうか(同じサンプルを繰り返し検査して、いつも同じ結果が出るかどうか)だって怪しい。つまり、標準の検査法と標準の検査法と(同じ検査法同士)を比べたって結果は一致しないおそれが多分にある。いや、もし「判定が陽性であるもののほとんどが誤判定である」ような状況であれば、一致する方が異常じゃないでしょうかね。  で、ご質問が仮に臨床検査のお話だとすると、まさにそういう状況にある。標準の検査法だけを取ってもこの有様です。  そうなると、二つの検査法を比較するには、ナントカしてそれぞれのROC曲線を描いた上で、「非標準の検査法が標準の検査法に勝るとも劣らない」ことを示すしかないのではないかなあ。  そのためには、判定結果の正解が分かっているサンプルが沢山必要になる。つまり、人為的に作った正解の分かっているサンプルを使って(実験者には正解が分からないようにブラインドの状態で)実験し、ROC曲線を作るぐらいしかないのでは?

M1343
質問者

お礼

ご回答ありがとうございました。統計が専門過ぎて理解できないところもありますが、ROC曲線について勉強してみます。標準の検査法が再現性を持つかどうかまさにご指摘のとおりです。参考になりました。

全文を見る
すると、全ての回答が全文表示されます。

その他の回答 (1)

  • Ishiwara
  • ベストアンサー率24% (462/1914)
回答No.1

「正しい」という証明は、非常に困難です。 「検定」は、正しいという仮定を否定(棄却)するためにあるものですから、ここでは使えません。もし「棄却域ではないがそれに極めて近い値」が出た場合は、実務的には「非常に怪しい」ということになります。それゆえ、それを「正しい」という主張に使うことはできないと思います。 むしろ、現在見えている「差」が「医学的または生理学的な見地から容認できるかどうか」の観点から結論を出したらいかがでしょうか。

M1343
質問者

お礼

ご回答ありがとうございました。確かに「正しい」という証明は、非常に困難だと思います。 この検査はあくまで診断を確定するための補助的なものです。ご指摘のとおり、他の疫学調査、臨床診断等総合的に検討し判断したいと思います。

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • 統計に関する質問です。

    統計に関する質問です。 小麦における3産地以上の蛋白質含量における差を比較しています。 それぞれ標本数の異なり、例えばアメリカ産は1000標本、カナダ産は500標本、国産は50標本となっています。 その場合は、分散分析し、差が見られた場合はturkey法という多重検定で精査する統計法が適しているのでしょうか? ご助言をよろしくお願いします。

  • 検定方法を教えて!

    50以上の試料に対し、それぞれ、ある検査をして、3人の検査員が独立して「正常、軽度異常、高度異常、判定不能」と判定しました。この3人の判定結果に有意差が無いことを統計学的に証明したい。ところが「正常、軽度異常、高度異常」が順序変数なのに、「判定不能」はその順序から逸脱しており、名義変数の混在と思います。順序変数と名義変数が混在する多重比較検定法をご存じの方は是非ともご教授下さい。大変困っています。お願いします!

  • エクセルでの計算結果

    エクセルでt検定をすると、2.215E-19のように「数字E+数字」という結果になってしまいます。標本数を少なくしたり、標本数が多くても数値を変えて試すとちゃんとした結果がでることもあります。原因と解決法を教えてください。

  • 層化比例無作為抽出時の検定などの方法

    とある書籍にて以下のことを学習しました。 ・層化比例無作為抽出法を用いて標本抽出をおこなった場合、標準誤差の算出には標本全体の分散ではなく、各層内分散の加重平均値を用いる。 ・よって、単純無作為抽出時に比較して標本誤差を低く抑えることができる(ことが多い)。 ここで質問なのですが・・・、 ・層化比例無作為抽出をおこなう場合、すべてのな区間推定や検定,果ては分析仮定で標準誤差を用いるすべての多変量解析において、一般的な統計ソフトを用いることは『正しくない』のでしょうか(大抵の統計ソフトは単純無作為抽出を仮定していると考えています)? ・『正しくない』とすれば、皆さんはどのように対処されてらっさるのでしょうか?ご自身でスクリプトを書いたりされているのでしょうか?それとも、「分析結果にさほど影響を与えるものでもないから統計ソフトで済ましている」といった感じなのでしょうか? 以上、どなたかおわかりの方がいらっしゃいましたら、ご教授いただけませんでしょうか? 宜しくお願いいたします。

  • t検定 結果の解釈の仕方

    よろしくお願いします。 初心者向けの(エクセルを使った)統計の解説本に次のような例題があります。 改良前の平均値 1500 改良後の標本平均値 1553 改良後の標本標準偏差 162.5541 改良後の標本の大きさ 50 有意水準5%で検定しないさい。  そこで,t値=2.313319 自由度50-1=49より,=TINV(0.05,49)=2.009597 t値2.313319は判定基準の2.009597を越えるので有意差有り というのが回答になっています。  以上の計算手順は理解できた上で質問です。 1 例題では改良前の平均値のみが与えられており,改良後は標準偏差や標本の大きさが与えられています。要するに「改良前の平均-改良後の平均の存在する範囲」の比較をしています。  もし,改良前も改良後も平均値,標準偏差,標本の大きさが与えられている場合,どちらを基準に考えればよいのでしょうか。つまり,「改良前の平均の存在する範囲-改良後の平均」を比較することもできると思います。例題はなぜ,「改良前の平均-改良後の平均の存在する範囲」の比較を行っているのでしょうか。 2 仮に,「改良前の平均-改良後の平均の存在する範囲」の比較でも,「改良前の平均の存在する範囲-改良後の平均」の比較でもどちらでもよいとするのなら,結果の解釈はどのように変わってくるのでしょうか。  素人質問で申し訳ありませんが,よろしくお願いします。

  • 2つの正規母集団に関する統計量の分布&推定

    (1)二つの標本平均をX、Yとしたとき、X-Yの標準偏差は?という問題の解き方はわかるのですが、3X-2Yのときどうやったら良いのでしょうか?(2)320名を標本抽出したとき検査の陽性率は67.8%であった。陽性率Pを信頼係数95%で区間推定すると~となる、という問題はどうやって解けばよいのでしょうか。統計学初心者ですが教えてください!

  • クラミジア検査結果について

    いつもお世話になっています。クラミジアの検査結果についてですが、【クラミジアDNA(PCR法といわれるもの?)】は陰性、血液検査のクラミジア抗体【IgG抗体】陽性(INDEX 1.96)・【IgA抗体】陰性(INDEX 0.56)でしたが、クラミジアDNA検査では陰性なのにIgG抗体が陽性になるというのは、どういう状況なのでしょうか? また、【クラミジアDNA】は抗原検査、【血液検査】は抗体検査という認識で良いのでしょうか? 一応膣の分泌物を採って検査に出し、結果待ちです。

  • これはどういう意味ですか(泣)

    帰無仮説 2つの標本の平均値は等しい。 標本数1 6 平均値1 8.46 標準偏差1 4.002 標本数2 6 平均値2 21.82 標準偏差2 8.145 有意水準 0.05 検定方法 両側検定 F値 4.14217085610118 確率 0.0724572476022886 t値 3.60605002946898 確率 0.00479946268108932 自由度 10 結論 等分散の仮定は棄却されませんでした。 帰無仮説は有意水準 0.05 で棄却されました。 自由度 10 におけるPの値は 0.00479946268108932 です。 ある実験の前後の統計を出したいので、統計ソフトで計算した結果、よくわからない言葉が出てきてしまいました(泣) ちなみに標本数・平均値・標準偏差1が実験前で、標本数・平均値・標準偏差2が実験後の結果です。 5%有意差があるかないかを調べたいのですが・・この結論の日本語がよくわかりません。 どなたか詳しく説明していただけませんか。 バカですみません。

  • 標本数が少ないときの検定の仕方

    まず、私が今、行おうとしている検定の仕方をご説明します。 1. 非常に時間のかかる測定結果が数件あり、そのうちの1件(標本A)が平均から大きく外れた値を示しています。おそらく測定時になにかの外乱があり、このような値を示したのでしょう。原因を追求するのは、困難なのでこの値をすててしまいたいところです。 2. そこで平均、分散、標準偏差を計算しました。*** 3. 標本が正規分布をなすことを仮定して、標本Aよりも大きな平均よりのずれを示す確率を正規分布確率表で確認したところ、16%と出ました。 4. と、いうことはそのような値が生じる確率は16%ある訳で、この値を捨てるのは適切ではない。うーん。残念。←今、ここ。 さて、お聞きしたいのは***の部分です。 今回の場合、この異常値・標本Aを平均、分散、標準偏差の計算に用いることで、大きくこれらの値が変わってしまっています。 たとえば、標本Aを取り除いた上で、平均、分散、標準偏差の計算を行ってみると、標本Aの値が生じ得る確率は0.04%になります。ということはなにか変なことが起こったんだろうね、ということでこの値は捨てていいことになると思います。 しかし、異常値かもしれない値を、最初から取り除いて(つまり特別扱いして)行う検定というのもなんだか、ズルをしているようで変な気がします。 このような計算の仕方(検定の対象となる異常値をあらかじめ除いて検定を行うやりかた)は統計上、正しい手順なのでしょうか? そもそも標本数が少ないときにはもっと別の手順で検定を行うべきなのでしょうか? なにぶん、素人なので定義に反した用語の使い方をしているかも知れませんが、何卒よろしくお願いいたします。

  • 調査結果は、標準誤差率が何%までなら信頼できるデータといえるのでしょうか

    統計に関して全くの素人なもので、お力をお貸しいただけると大変助かります。 現在、仕事でレポートを作成しており、政府統計調査のデータを根拠として示したいのですが、標本調査結果に添付されている「推定値の大きさ別標準誤差率」を見ると、同じ調査でもデータの大きさによって1%未満から30%以上の標本誤差率が存在します。 レポートをまとめる際、例えば同じ「業種別の工場数」の表を記載する場合でも、都道府県ごとなら結果精度が保てても、市区町村ごとでは誤差率が大きくなるため不適切、といったことに注意しなければならないと思うのですが、 一般的に、標準誤差率が何%までなら「信頼できる推定値」といえるのでしょうか(あるいは定義があるのでしょうか)。 ご教示よろしくお願い申し上げます。