• 締切済み

統計でカットオフ値を求める際の質問です

統計のド素人なもので教えて下さい。 歯医者に通院している患者さんの身長や体重、年齢、歯の痛さの尺度の値など(合計15項目ぐらい)のデータを使って、虫歯の予後に関わる因子のカットオフ値、感度、特異度を求めたいと思います。 症例数が22人しかいませんが、この少人数のデータでこういった解析を行う意味はあるのでしょうか? もし症例数が足りないということであれば、最低何症例あれば可能なのでしょうか? よろしくお願いします。

みんなの回答

  • toukeier
  • ベストアンサー率75% (3/4)
回答No.1

ROC曲線解析のためのサンプルサイズ計算で見積もることができます。AUCが0.9、検出力95%、虫歯予後良好と不良が1:1とすると、片群10例でOKです。ただ、感度・特異度は10%刻みになってしまいますね。また、AUCが0.9になる因子はあまり多くないかもしれません。ということで、結果があまり実用的ではないかもしれません。が、上記の条件なら、計算上はいまの症例数でも足ります。 > power.roc.test(auc=0.90, power=0.95) One ROC curve power calculation ncases = 9.155913 ncontrols = 9.155913 auc = 0.9 sig.level = 0.05 power = 0.95

参考URL:
http://web.expasy.org/pROC/files/pROC_1.7.2_R_manual.pdf

関連するQ&A

  • SPSSを使用した統計学に関する質問です。

    これまでの急性虫垂炎の症例の手術群・非手術群のそれぞれのBT、WBC、CRPにおいて 「BTは〇〇℃以上かつWBCは〇〇以上かつCRPは〇〇以上でカットオフ値を設定したところ手術の適応は感度〇〇%、特異度〇〇%であった」と結論付けるために具体的なSPSSの使用法を教えていただけないでしょうか?BT,WBC,CRPを3項目とも使うやり方がわかりません。 それぞれの項目についてのROC曲線ならできたのですが...。 お願いします!

  • 統計解析法は残差分析でいいのか?

    ある疾病の年度ごとの発生率を統計解析にかけてレポートを作成しようと考えているのですがどの統計解析法を使って良いのかがわかりません。 手元にあるデータとしては一年毎の全患者数と統計にかけたい疾病の疾病例数です。また年ごとのサンプル数はかなり幅があります。 単純に疾病例数を全患者数で除算しものを発生率としてグラフにしてみますと減少傾向にあるようにみえます。 これを統計解析にかけてある疾病の発生率が減っていると証明することはできるのでしょうか? 10年分のデータがあるとして 全患者数、疾病例数の2マス×10年分10マスとして残差分析にかけていいものなのでしょうか? そもそも残差分析なる物がどういうものか理解できていないのですが・・・ また別のデータとしてその疾病に効果があると考えられる薬剤の一年毎の出荷数なるものがありますがどのような統計処理を行えばよいのでしょうか? 全く統計は素人で申しわけありませんがよろしくお願いします。

  • 論文(統計含む)のreviwerからのコメント

    救急系の医師です。あるまれな外傷(Aとします)についての研究論文(Aの予後因子の研究)で、minor revisionでしたが、以下のコメントがついていました。 No corrrelation is made relating A with B, C, D. A:今回研究テーマの外傷名。~脳出血 B~D:Aの予後因子として調査した項目(Aと付随していることがある状態。脳出血の一形態)です。 論文では、Aの予後因子としてB~Dを含め7つの因子を統計処理(単変量、多変量解析など)しています。 抽象的ですいません。 この文の意味は、「AとB、C、Dの相関調査がされていない」との意味でしょうか? 何を修正すればいいのか分からず困っています。よろしくお願いします。

  • 統計に関しての質問です

    統計に関する質問です 看護師をしているのですが統計に関しては全くの素人で統計の何たるかも解らないのですが、仕事上でどうしても使わなければならなくなりました。 そこで質問なのですが、看護記録の善し悪しを判断するのに看護記録評価表なる物を作成しました。その中で「出来ている」を○。「出来てない」を×にして全体の何%が良くない記録(×)なのかを割り出して提示しようとしています。その場合、どの位のデータ(サンプル?)をとれば良いのでしょうか?患者数は600人程度で、そのうちの何人位のデータを取るとこのデータが正確なのでしょうか?全体の1/3程度で良いと言う意見もあります。こんな考えをすること自体間違っているのかどうかも解りませんが、どなたかお教えいただけませんでしょうか?

  • 「統計学」因子分析に代わる方法はないですか?

    妥当な統計解析方法が見つからず困っています。 下記のような「はい」「いいえ」で答える質問紙を用いて、第三者が客観的に評価を行ったとします。 例)今日の患者さんの症状で当てはまるものに「はい」をつけてください 質問1 100m歩くと息切れがする    質問2 階段を昇ると胸痛が出現する    質問3 起床時の問診でドキドキ感を訴えた など50問  この結果、似たような項目に「はい」がついた人を分析し、 その結果、心臓由来の原因症状を因子に分類(痛みの因子・息切れの因子・・など)する方法を探しています。 通常ですと、5~7件法の質問に対し因子分析法を用い、 因子負荷によってそのまとまりを探すのが一般的ですが、 今回のデータはアンケートではなく、 第3者が症状を質問し「はい」=1「いいえ」=0と変数化した2件法なので、 因子分析には向かないのではないかと考えたためです。 患者さんご自身に答えていただく方法は今回とれないのです。 どなたかよい解決方法を知っていましたら、ご教示ください。 宜しくお願いします。

  • 統計学のデータを分析するソフトは?

    データをとって、それを統計学的手法で結果・考察をしたいのですが、エクセルでできるのか?それとも統計専門SPSSのソフトが必要なのか? どうでしょうか? ちなみに、データの統計処理の内容は因子分析です。 因子負荷量や共通性、寄与率などを算出し、数少ない因子に要約して回転などを加える予定です。 この程度は、エクセルで十分でしょうか? それともSPSSでないと困難でしょうか?

  • 統計学の多変量解析の考え方で困ってます

    1)症例数が23程度で、多変量解析をしています。重回帰解析において、ある物質がP<0.05となるのですが、独立変数の選択の仕方で、Pが出たり出なかったりします。独立変数の選び方で、変わるならば統計者の意図が入る形になり、biasがかかる気がします。症例数が23程度での重回帰解析に意味はないのでしょうか?また同じ独立変数でstep-wise解析を行っても、その物質のみが採用されるようです。多変量解析を行ううえで、step wiseと重回帰解析の使い分けについてご教授ください。教科書的には重回帰で目安をつけて、step wiseで確認するみたいに書かれていますが、その認識でいいですか?

  • エクセル統計での単変量解析の仕方

    エクセル統計(2010)での単変量解析の仕方を教えていただきたくメールしています。 まず、現在特定の疾患に罹患した患者の情報を、後ろ向きにある薬剤の併用群と非併用群とで病気の悪化までの期間、および生存期間にどう影響しているのかを検討する研究を行っています。  使用している薬剤の使用状況や患者背景などたくさんの因子が病気悪化や生存に影響していると考えられるため、多変量解析をしていくのが最も有用と思われますが、その前に、患者背景(年齢、性別、前治療歴など)の雑多な因子を単変量解析にて検討して多重共線性を解析した上でCox比例ハザードモデルで多変量解析したいと思っています。  そこで、最初のふるいわけをする単変量解析のやり方がよくわからず、エクセル統計2010を使用した場合、どのように開始していくのか教えていただければ幸いです。各調査項目に関してハザード比、95%CI、検定結果(p値)として標記したいと思っています。  よろしくお願いします。   

  • 統計に含めていいデータかどうか

    ただいま卒業論文の研究を行っております。 高等学校の先生方に対して質問紙調査を行う必要があり、学校にご協力のお願いをしにいきました。 質問紙は、3つの尺度で構成されているのですが、そのうちの1つを省いてくれたらお引き受けいたしますと言われました。仮にこの高等学校をA高とします。 3つの尺度でアンケートを行っていただける他の学校はあるのですが、データの数が少ないので、尺度を1つ除いた状態でお願いをさせていただこうと思っています。 仮に3つの尺度を(1)外的要因(2)教師がもつ態度(3)行動とします。 おこないたい研究は、(1)が(2)にどのように影響しているのか、(2)が(3)にどのように影響しているのかの大きく分けて2つです。 ご協力いただけない尺度は(1)に当てはまります。 (2)が(3)に与える影響の検討を行うときのみに、A高のデータを統計に含めることは、研究的に可能なことでしょうか。 大変迷っております。助言をお願いいたします。

  • 統計学における分布の予測

    失礼します。 私は医学部大学院で研究を行っている者です。 現在、血中に存在するある因子の濃度を測定しているのですが、解析をしていて疑問に思ったことがあります。 一般的に医学データは正規分布に従うことが少ないと、医療統計学の本には書いてあり自分もそう認識しています。しかしγ-GTPやALTなどの因子は対数正規分布を示すと言われています。 そこで、正規分布(対数正規分布)を示す因子の共通点(例えば分泌場所など)を考えてみたのですが、なかなか推定できません。 体内因子の分布というのはある程度予測できるものなのでしょうか? そしてそれはどのような条件なのでしょうか? 統計学、生理学共に知識が少なく申し訳ございませんがご教授頂ければ幸いです。