• 締切済み

ある疾患の再発率の予測式があってその妥当性を自施設のデータを用いて検証

ある疾患の再発率の予測式があってその妥当性を自施設のデータを用いて検証したいと考えています。個々の患者での予測式から得られた値(再発率 ○%)と実際の再発の有無のデータはあるのですがここからどのような統計手法をとれば良いのかわかりません。この結果から予測式の妥当性を示すための手段をご教授ください。統計ソフトはSPSSがあります。

みんなの回答

  • ramayana
  • ベストアンサー率75% (215/285)
回答No.2

文献サーベイが正攻法だと思います。医学系の学会誌などで、同じようなテーマを扱った過去の研究論文を探し、そこで使われた方法を参考にするのです。 それがうまく行かないときの代替として、思いつく方法を2つ挙げます。ご参考になるかどうか自信ありませんけれど。 以下   一定期間内の再発率 = F(x1, x2, …, xk) という予測式が与えられているものと想定します。x1, x2, …, xkは、性、年齢、治療歴など、再発に影響する個人属性です。また、自施設のデータとして、各個人のx1, x2, …, xkの値と、その個人が再発したかどうかの情報が、n人分あると想定します。 1 予測式を再計測する方法 関数F(x1, x2, …, xk)は、具体的には累積正規分布関数、ロジスティック関数、線形関数などの関数型で表されていて、そこにはいくつかのパラメータ(係数)があるはずです。そのパラメータを、自施設のデータで計測するのです。 元の予測式の計測方法が分かっている場合は、その計測方法を踏襲するのが無難です。 元の予測式の計測方法が分かっていない場合は、普通はプロビット分析を使うことになると思います(「再発した」、「再発しない」の2値データを扱うので)。 計測したパラメータは、元の予測式のパラメータとたいてい一致しません。その差が有意かどうかを、計測したパラメータの推計誤差から判断すればよいのです。 2 グループ別再発率を計算する方法 もし、サンプルサイズ(n)が大きければ、x1, x2, …, xkが類似する者どうしを集めてグループ分けして、各グループの再発率を「グループ内再発者数/グループ内人数」で計算します。この再発率が、予測式によるものと有意に差があるかどうかをグループごとに判断するのです。再発者数は2項分布に従う(グループの人数が大きければ近似的に正規分布に従う)ので、差が有意かどうかの判断は簡単だと思います。 (1と2の比較) 2の方法は、「F(x1, x2, …, xk)の関数型に依存しない」という意味で、1の方法より一般性があります。ただ、サンプルサイズが大きいときのみ利用できます。 1の方法は、単に予測式があてはまるかどうかだけでなく、「どの属性の効果が予測式と違うのか」といった、より深い知見が得られます。

noname#227064
noname#227064
回答No.1

帰無仮説を再発率(母比率)=予測式から予測した再発率、対立仮説を再発率(母比率)≠予測式から予測した再発率として検定する方法は使えないのでしょうか?

関連するQ&A

  • 重回帰分析で得られた予測式の妥当性について

    ある集団のデータから重回帰分析である値の予測式を作成しました。 その予測式を他の集団に当てはめてみましたが、その予測式が妥当か否かはどう判断したらよろしいのでしょうか? 予測値と実測値で有意差がなく、有意な相関があればいいのでしょうか?

  • 統計学のデータを分析するソフトは?

    データをとって、それを統計学的手法で結果・考察をしたいのですが、エクセルでできるのか?それとも統計専門SPSSのソフトが必要なのか? どうでしょうか? ちなみに、データの統計処理の内容は因子分析です。 因子負荷量や共通性、寄与率などを算出し、数少ない因子に要約して回転などを加える予定です。 この程度は、エクセルで十分でしょうか? それともSPSSでないと困難でしょうか?

  • 傾向スコアの求め方

    統計初心者です。 今回、ある治療を行った人と行わなかった人で個々の因子の相違を検討したいと考えており傾向スコアで解析するよう指示を受けました。 患者ID 治療A      年齢  score1  病気A  病気B  病気C  001   行った      75    300    +     -    - 002   行わなかった  73    780    -     -    -  ・  ・ というようなデータがあり(約1600件)、患者ごとの傾向スコアを求めたいと思っております。 統計初心者なのでソフト(Dr.spss)を利用したかったのですが私が使っているSPSSのバージョンでは傾向スコアを出すことはできないようです。 SPSSを使って何かと何かの解析を組み合わせれば計算できるものなのか、あるいは傾向スコアを出す計算方法があるのでしょうか。 お手数おかけしますがどなたかわかる方がいらっしゃいましたら教えていただけませんでしょうか。 よろしくお願いいたします。

  • 売上の時系列予測について

    いつも参考にさせて頂いております。 本日は売上データの将来予測について、どのような統計的解析手法があるのか伺いたく存じます。 目的は、過去2年間の売上データ(毎日)を基にして、来月の売上予測(毎日)を予測する、というものです。時系列分析のテキストを読みますと、指数平滑化を使って明日一日だけの予測はできそうですが、1ヶ月の予測をデイリーで予測することは不可能です。このような分析は、EXCELやSPSS BASEでは不可能なのでしょうか。それとも、一年間のトレンドについて移動平均を使って大まかな傾向をつかみ(季節変動など)、あとはエイヤッと勘で予測を立てるべきなのでしょうか。ご助言いただきたく、宜しくお願いいたします。 ※手元にあるデータは、2年分の売上データ(毎日)です。 ※所有するソフトはEXCEL、エクセル統計、SPSS BASEです。 ※マッピングしただけで、月曜日に売上が伸び、以降週末に向かって落ちるという傾向が掴めました。また年始から11月までなだらかに売上が伸び、年末に向かって落ちます。

  • 統計解析;spssで有意差検定

    次の試験区を設定した場合、どのような手法を用いて有意差検定を行うのが妥当でしょうか? 左から阻害物質の有無、阻害物質の種類、阻害物質を取り除く処理の有無 1,無、-、- 2,有、A、無 3,有、A、有 4,有、B、無 5,有、B、有 解析はspssで行いたいと思っております。 皆さんの考える方法をお聞かせて下さい。よろしくお願いいたします。

  • 統計解析法は残差分析でいいのか?

    ある疾病の年度ごとの発生率を統計解析にかけてレポートを作成しようと考えているのですがどの統計解析法を使って良いのかがわかりません。 手元にあるデータとしては一年毎の全患者数と統計にかけたい疾病の疾病例数です。また年ごとのサンプル数はかなり幅があります。 単純に疾病例数を全患者数で除算しものを発生率としてグラフにしてみますと減少傾向にあるようにみえます。 これを統計解析にかけてある疾病の発生率が減っていると証明することはできるのでしょうか? 10年分のデータがあるとして 全患者数、疾病例数の2マス×10年分10マスとして残差分析にかけていいものなのでしょうか? そもそも残差分析なる物がどういうものか理解できていないのですが・・・ また別のデータとしてその疾病に効果があると考えられる薬剤の一年毎の出荷数なるものがありますがどのような統計処理を行えばよいのでしょうか? 全く統計は素人で申しわけありませんがよろしくお願いします。

  • 統計手法について教えてください

    過去数年のデータを元に、今後3年後5年後10年後と予測の数値を出したいのですが、良い方法は無いでしょうか。ちなみに統計手法のことはよくわかりませんので、事例や計算式を解説したものでもあれば教えてください。

  • 最適な分析方法は?

    様々な気象要素(量的)の値から、量的なある事例数及び事例の有無を予測するための統計学的手法について、どなたか教えていただけないでしょうか? 統計学の素人で、主にエクセルしか手元にありません。 求めたい事項は、 (1)事例(及び事例数)に対してどのような要素を説明変数とすべきか? (2)どのような手法で分析をすべきか です。 漠然と重回帰分析で、危険度から順に削除していく方法かなと思っていますが、ある方からロジスティック回帰分析が良いのではといわれました。ロジスティック回帰分析については知識がないため良く分かりません。 まとまりがない質問で申し訳ありませんがよろしくお願いします。

  • 経済学の理論の検証手法

    自然科学における理論は、理論の前提となる状況を実験室に作って実験をすることで確かめられ、異なるチームによる複数の実験によって確実なものになり、統計的手法を通じて理論が理論として定着することになるのではないかと思います。 経済学における理論では、実験そのものが困難だったり、関連する要素が膨大なために現象に関わるパラメータを限定するのが極めて難しく、仮に同じ実験をしようとしてもそれらが同じであることを担保することができないため上記のような手法が取れないことが多いように思います。経済学では個々の理論の正しさを担保するために自然科学における実験に相当するようなどのような検証手法が用意されているのでしょうか?

  • 適合率と再現率

    バグの有無予測のため、Rでロジスティック回帰と線形判別分析で予測しました。 しかし適合率と再現率の求め方がわかりません。 適合率は、検索結果の中にどの程度正解が含まれるかを示す。 再現率は、正解のうち、どの程度が検索にヒットするかを示す。 正解ってなんですか?データの事ですか?予測結果を使うんですか?