• 締切済み

ROC曲線のAUCの分析方法

特定の状態の有無を調べるスクリーニングテストをして、その結果からROC曲線(Receiver Operating Characteristic curve:受信者操作特性曲線)を作図しています(エクセル手計算です)。 ROC曲線下面積のAUC(Area Under the Curve)は、スクリーニングテストの精度を表しているとされており、参考書をみれば0.5-0.7が低精度、0.7-0.9が精度中等度、0.9-1.0が高精度となっています。 AUCについて3点質問があります。 1.AUCの結果からこのスクリーニングテストの精度は妥当である、とする際の計算方法(RやSPSSを使わずに手計算で計算する方法) 2.1.の結果は、t-検定や相関係数の無相関検定のように、有意確率がサンプル数に依存するか 3.2つのスクリーニングテストの精度を比較する方法(2種の相関係数の差の検定のように、2つのAUCの差を検定を手計算でする方法) ご存知の方、これらについて教えていただけませんか。 よろしくお願いいたします。

みんなの回答

  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.1

 ROCのArea Under Curveに関して有意確率、t-検定などの言葉が出て来るところを見ると、もしかして、「スクリーニング検査はランダムな答を出す(判別能力のない)ものである」という帰無仮説の検定について仰っているのだろうか。それとも、実験で得たAUCの値に含まれる誤差の分布についてお考えなのだろうか。  後者だとすると、まずは「適当な仮定のもとで、閾値Tに於ける条件付き確率  p(T) = P( テストがPositive | ホントにPositive)  q(T) = P( テストがPositive | ホントはNegative) をデータから推定せよ」という問題から考えるべきかと思います。たとえば、ロジスティック回帰分析でfittingを行えば、p(T), q(T)とそれぞれの誤差範囲が推定できる。これを使ってROCのAUCの誤差の分布も推定できそうに思われます。  しかし実務上は、その誤差はあんまり問題にならんように思います。というのは: (1) 最終判定(Positive/Negative)が判明している多数の例に於いてスクリーニング検査の結果が分かっている、というのでなくては、それが実際スクリーニングになっているのかどうか判断しようがない。簡単に実施できるからこそスクリーニング検査なのだから、最終判定ができたものの殆どについてスクリーニング検査を実施するのは容易のはず。もしそのデータが少ないなら、それは、そもそも最終判定が得られた例が少ないということだが、そういう場合、スクリーニング検査に果たして意味があるか? (2) スクリーニング検査法の候補が複数あって、それらの間には検定に掛けなくては分からない程度の違いしかないのだったら、判別の性能よりも、他のポイントを比較する事が重要だろう。 と思われるからで、つまり、もっとデータを取ってから判断すべきでしょう。 1.について、「0.5-0.7が低精度」云々は、トンチキな著者がイーカゲンなことを抜かしてやがるだけかと。なぜなら、「このスクリーニングテストの精度は妥当」という判断は、そもそも数学の対象ではありえません。スクリーニングのコストと効果、false positive, false negativeの際に発生する問題(false negativeで見逃したためにそりゃもお大変なことになった、false positiveで精査がどっさり発生し、精査結果が出るまで3年待ち、など)の重大性の程度に鑑みて、実務に於ける価値観に従って判断すべきものであり、これによって閾値の設定も決まる訳です。 2. について、サンプル数が多いほどROCが滑らかに描ける、という簡単な話では? 見た目にもカクカクしているようでは、(データのゆらぎを無視しても)ROCを階段関数として積分したときと、台形則で積分した時との違い程度(order)の誤差がAUCに生じうることは明らかでしょう。 3. について、これは上記の(2)の話。AUCが1に近い方(カーブが左上の角に近づく方)がまし、という基準だけで判定するのは、あまり利口とは言えないでしょう。検査の種類によってコストも適用条件も違うし、また、検査にとっての「得手不得手」というものもあります(特に、判別の対象となる事象がそもそも純粋ではなく、複数の要因で生じた似たような現象が混合したものである場合)。複数のスクリーニング検査を旨く組み合わせると性能が上がる、という場合もあるでしょう。

duoshaoqia
質問者

お礼

stomachmanさん、ご回答ありがとうございました。 現在、既存のテストをある状態のスクリーニングに応用できないか調べています。 サンプル数は約800で、SPSSの入ったPCを借りてROC曲線の作図と分析をしたところ、 AUC:0.716 標準誤差:0.043 漸近有意確率:0.000 漸近95%CI:0.631-0.801 という結果が出ました。 この結果は、AUCが0.5(スクリーニングの結果が完全にランダム)を帰無仮説としたときに、AUCが0.5だと言えない(スクリーニングの結果がランダムであるとは言えない)という 結果である、と認識しています。 ↑この認識は間違っていませんよね? 1.毎回SPSSの入っているPCを借りることはできないので、エクセルで計算(AUCが0.5であるという帰無仮説に対する検定)をできるようになりたい 2.AUCは大きい値である方が良いスクリーニングなので、AUCが大きくなるように条件を変更するのとともに、サンプル数の制限(例えば年齢や性別などでわけて、それぞれの場合分けで分析したら異なる結果になるか)をしたときに、AUCが高くなってもAUC=0.5の帰無仮説に対する検定結果がサンプル数に影響してしまうのではないのか 3.2に付随して、場合わけしたときにそれぞれのAUCの値が統計的に大きいのか小さいのかを判断して、最も良いパターンを見極めたい という理由で3つの質問をいたしました。 3つ全ての質問において、私自身がROC曲線の分析方法の正しい知識が不足しているのがそもそもの問題であることは重々承知しています。 知識の足りない部分を補完するために、質問しました。 質問の1について、計算式かもしくはその流れがわかれば、もう少し分析の考え方を理解できると思います。 質問の2について、例えば相関係数が、サンプルが30の時のr=0.3と、サンプルが100の時のr=0.3では意味が違う(サンプル数が有意確率に影響する)と思います。 AUCも同じじゃないのか、と思っています。 質問1の計算式等や考え方がわかれば、この問題も解決できると思います。 質問の3についても同様で、質問1,2が理解できれば自ずから理解できると思います。 もう少し詳しく教えていただけないでしょうか? よろしくお願いいたします。

関連するQ&A

  • 判別分析について

    判別分析で、相関係数0.35、p=0.001 という結果を得ました。 この結果は、相関は0ではない確率は非常に高い(p=0.001)が、相関としては0.35程度ということだと 思います。これについて、判別の精度をみるには、分析結果の式に多くのデータを代入して見てみるしかないとは思いますが、相関係数のみからいえることはないのでしょうか。たとえば、判別できる確率は35%とか。 よろしくお願いいたします。

  • 回帰分析で「有意な相関がある」という言葉はあり得るのか

     回帰分析(単回帰、重回帰)において、例えば単回帰では「2つの間には有意な正の相関関係が認められる」という日本語はあり得るのでしょうか。そもそも、回帰分析において相関関係の有意性を検定する検定方法というものが存在するのでしょうか。または、相関係数や決定係数で判断するしかない(例えばr2が0.8以上なら精度が高い)のでしょうか。  また、回帰式や回帰係数の有意性の検定といわれているものは母集団に対する検定ということですので、今回の質問の答えに当てはまらないと考えていますが、この考えは合っているのでしょうか。

  • 相関係数の差の検定についての質問です。

    相関係数の差の検定についての質問です。 相関係数の差の検定について調べていましたら、Fischerのz変換という方法を調べついたのですが、上司からMeng-Rosental-Rubin methodという方法があるから、その方法で検定をしなさいと言われました。知らない方法だったので調べたのですが、Fisherのz変換と同一の方法なのか、それとも全く違う方法なのか分からず、どなたかご存知の方がいらっしゃいましたら、教えていただけませんか。 相関係数は、ある事象について、AとBの方法で評価し、どちらの評価法の相関係数がより強く相関しているのかを検定をしたいです。 よろしくお願いいたします。

  • 回帰曲線の有意差について

    統計学に関してはあまり知識が無いのですがよろしくお願いいたします。 あるデータ(体表面積、修正体表面積、体重)に相関があるかどうかを調べたいのですが、その過程にはどの様な検定を行っていったら良いか分からないので教えて下さい。 行いたいことは、下記の2点です。 1.体表面積と体重、修正体表面積と体重のグラフの相関を検定(おそらく対数関数を示すと思います) 2.体表面積と体重、修正体表面積と体重の対数回帰式か対数近似式をだす 3.性別による体表面積と体重、修正体表面積と体重の対数回帰式の差を検定 調べてみたところ、 1.は、Spearmanの順位相関係数を用いて検定 2.は、エクセルで近似曲線式をだす 3.は、共分散分析法で検定 で考えていますが、間違っていますでしょうか? また、エクセルで行うことは可能でしょうか? 宜しくお願いします。

  • 統計学について

    統計学の無相関検定について 無相関検定について理解ができておらず、 どなたか教えてください。 理解できていない場所を理解したいので、 非常にまとまりがありませんが、箇条書きとしました。 番号ごとに箇条書きしたので、 番号に対応するように回答を頂けると幸いです。 よろしくお願いします。 (1)無相関検定により、帰無仮説が採択されると、相関係数の数値の大小に関係なく、一律で統計結果自体を無効にする。 (2)統計結果自体の無効とは、すなわち相関係数ゼロのことを指す。 (3)相関係数ゼロとは、すなわち無相関のことを指す。 (4)「相関の強さ」と「有意」は別個の考え方である。 (5)「相関が強いこと」=「相関係数が1または-1に近いこと」である。 (6)相関が強い場合でも、有意でない場合は、「統計自体が無効だった」ということになる。 言い換えれば、「統計結果は無相関だった」という解釈になるのだろうか? (7)相関が弱い場合で、かつ有意である場合は、「弱い相関があった」ということになる。 (8)「統計自体が無効だったこと」=無相関なのか? (9)「相関の強さが弱過ぎる」=無相関なのか? (10)相関があるという仮説の数は無限であり、相関が無いという仮説の数は1つである。 11.相関係数がゼロであることは、無相関検定をやること以外の方法では生じない。 つまり、変数が2つのとき「偏差積の平均÷標準偏差X÷標準偏差Y」の計算結果によって、相関係数がゼロという答えが出ることはない。(無相関検定をやる前から無相関であるという答えが導き出されることはない) 非常にまとまりが無くて申し訳ありませんが、よろしくお願いします!

  • 相関分析結果の解釈

    「介護サービスの満足度」と「介護サービスの満足度に影響を与える可能性のある要因」間で、相関分析を行った結果、一番相関係数(ピアソンの相関係数)が高かったのが、「訪問回数(r=.70)」、2番目に相関係数が高かったのが、「訪問時の滞在時間(r=.53)」という結果がでました(両側検定、p<.01)。この結果より、「訪問回数」の方が、「訪問時の滞在時間」と比べて、「介護サービスの満足度」を高めるのに、より重要な要因と言えるでしょうか。アドバイスをお願いします。

  • 複数の相関係数の検定の方法

    2つやそれ以上の相関係数が求められている時の、その有意差を検定できないかと悩んでいます(例えば0.3と0.4で有意差があるかなど)。それでネットで多少なりとも探して、「相関係数の相等性の検定」という言葉を見つけました。でも本当にこれでいいのか分からないし、何よりやり方が分かりません。もしSPSSでできるのならそれがベストなのですが、他にも素人でできそうな方法があれば教えてほしいです。一応、大学の統計の授業くらいの理解はあります。またちょっとは理解して使いたいので、良い本なりウェブサイトがあれば、重ねてそれも教えてもらえればありがたいです。どうかご存知の方がおりましたら、よろしくお願いします。

  • 相関係数と有意差

    統計で相関をみるときに相関係数と有意差とどちらが重要なのかよくわかりません。たとえば、Spearman検定で、有意差があるのに相関係数が低い、といったときは統計的に有意な相関があるといっていいのでしょうか?統計素人でここがよくわからず困っています。すみません、ご存知の方おられたら教えてください。よろしくおねがいいたします。

  • t検定と因子分析

    お世話になっております。是非、ご教示いただきたくどうかよろしくお願いいたします。 質問50項目に対するAとBのグループの回答結果をt検定で比較する場合、得点の平均値を比較するのではなく、6段階(1~6、1が非常にあてはまる、6が全く当てはまらない)の回答のうち、「1、非常にあてまる」と回答した人の割合(この時の割合とはグループ毎に計算したものです)をt検定するという方法はおかしいでしょうか。 また、AとBのグループを合わせて因子分析を行い、各因子のAとBの各下位尺度得点についてt検定を行うことや、A、B別の各下位尺度間の相関係数も出す方法とは、A、Bそれぞれの大まかな特徴を明らかにすることしかできないため、より正確な違いが見たいのであれば各質問結果のt検定が妥当である、ということになるのでしょうか。この辺の理解ができず悶々としています。すみません。どうか教えていただけないでしょうか。よろしくお願いします。

  • SPSSのソフトを用いた統計解析に関する質問です。

    SPSSのソフトを用いた統計解析に関する質問です。 ぜひご教示いただきたく、宜しくお願いいたします。 A,B,Cの3つの検査を用いて、疾患の有無を判別するのに有効な検査を比較検討するため、ROC解析を行いました。 ここまでは、A,B,Cの3つのROC曲線とROC-AUC値などを比較して最も有効性が高い検査の見当をつけることができました。 仮にここではAが最も有効性が高かったとします。 問題は、この後、(1)Aのみ実施した場合と、(2)BとCの検査を同時に実施した場合の2つのパターンを比較して、(1)と(2)では同程度の判別能力があることを示したいのです。 この場合、(2)のようにBとCの二つの検査を融合したROC曲線を描くことはSPSSで可能なのでしょうか。 また、もしROC解析では2つの検査を融合させたROC曲線を描くことができないのであれば、どういった解析方法で(1)と(2)の判別能力を比較することができるでしょうか。 私的に、判別分析を用いるほうが妥当なのかと考えておりますが…。 結論として、この2点が質問事項です。 〈1〉2つの検査を融合させたROC曲線を描くことはできるのか、できるのであればその方法を教えていただきたい 〈2〉上記の〈1〉が不可能であれば、Aという単一の検査を実施した場合と、BとCという2つの検査を同時に実施した場合での検査の判別能力を比較検討するために適正な解析方法を教えていただきたい 焦ってこの文章を書いていますので、説明が分かりにくいかもしれませんが、 できるだけ速く結果を出す必要があるため、ぜひお知恵を貸していただきたく存じます。 どうぞ宜しくお願いいたします。