• 締切済み

統計学的検討

統計に関する質問です。ある治療を行い、合併症の発生有無、合併症発生までの期間を検討しています。カプランマイヤー法を用いて、期間は算出し、優れた治療を行っていることがわかりました。そこで、集計された多くの項目に対して、多変量の解析も行ってみようかと考えています。年齢、性別、疾患名、他治療の介入の有無、生存期間などが集計されています。 合併症の発生有無、発生までの期間に影響した因子を検討しているのですが、この集計では、観察打ち切りになった例も多く存在しており、どのように検討してよいか、わからず悩んでいます。 ちなみに、平均観察期間は、カプランマイヤー法で算出された合併症発生までの期間より短いです。 つまり、多くの患者が合併症を発症せず、観察打ち切りになっていました。すみませんが、グループで検討しているのですが、複雑な統計処理を行った経験がなく、聞く人がいなくて困っています。よろしくお願いいたします。

みんなの回答

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.3

>聞く人がいなくて 指導者がいるのに、横から口出しは、研究者の倫理にはんするのですが、いないなら、  統計学では、サンプルに恣意的要素が入ると、検定をするのは間違いです。すなわち、ランダムサンプリングが絶対的条件です。が、人を対象とする場合は、前向きコホートをしない限り無理。薬の効果は、ダブルプラインドで行うのは、この理由です。  ですから、厳密な意味では、無理。論文などでは、そこを指摘されると、返答はできません。唯一に耐えられるのは、サンプル数が多い場合で、各群1000人は無いと、らしいです。 >複雑な統計処理を行った経験がなく なら、質問者が理解できる検定法を実行すれば、十分。算数で出来る問題を、プログラミングしてコンピュータでやるのは、見栄張り、端的に言えば馬鹿。まあ、やりたがりが多いですが。  合併症の発生率なら、カイ2乗検定。これは、初心者の私でも簡単。ただ、両群が等しい、とした検定の出発点で「帰無仮説が成立していない」と指摘されると、返事不能。  そこは、認めて、「大きな差があります」と言えるなら、発表に耐えられる。なぜなら、検定は「有意差が有り」だけ。「差が無い」との表現は間違いである=差は有る、というのは検定をするまでもないので。

  • alice_44
  • ベストアンサー率44% (2109/4759)
回答No.2

無理かなと。 合併症の発生に影響する因子を分析するには、 観察期間が短過ぎるのだと思います。

回答No.1

時間と他の因子を独立変数にして、発生率を従属変数にしたロジスティック重回帰はどうですか?

関連するQ&A

  • 医学統計、適切な検定方法を教えてください

    臨床医学統計です。 ある疾患を治療していて合併症が何例も生じていました。その合併症を減らすために治療法を昨年から変更しました。昨年から10か月間、30人の症例がありましたが合併症は0でした。 治療法を変更する以前の10か月は40人中6人も合併症が生じました。 治療法変更前と後では合併症発生率の有意差はあるのかないのかはどうやって行うのですか?

  • 統計処理について

    統計処理の選択がわかりません、どうかお教えください。 例えば。 太っているグループと痩せているグループの2グループについてその要因を検討する場合。 二つのグループに対して年齢や御飯を食べている回数、運動の回数など の具体的数字によるデータが検出されるものと、アンケートによる二件法、五件法のデータで出る検出される場合の統計処理方法についてお尋ねします。  この場合には、t検定とX二乗検定で統計処理ができ、有意差の有無が判 定できるものなのでしょうか?   それとも他にもやった方が良い統計処理があったらお教えください?

  • 統計解析、検定手法(Cochran-Mantel-Haenszel法)について

    統計解析の素人なため、質問自体が根本的に問題かも知れませんが、 ご教授いただけますでしょうか。 ----------------------------------------------------- 7年間の観察期間で、2群に分けて特定の検査を実施しました。 それらのデータを集計して算出した例数を用いて それぞれ差を検定したいのですが、 Cochran-Mantel-Haenszel法が適していると聞きました。 ある部門で計算をしてもらい、結果を算出してもらいました。 漸近有意確率 (両側検定)にて、ある特定の検査項目のp値に 「*:p≦0.05」が出現したのですが、どのような説明ができるのか 教えていただけますでしょうか。 結果------------------------+ カイ2乗 5.621 自由度 1 漸近有意確率 (両側検定) 0.021 +---------------------------- 質問方法と、情報の提示に問題があるかもしれませんが、 ご協力お願い申し上げます。

  • 相関分析で困ってます;統計初心者です。

    機械の故障発生の分析に統計手法が使えないか検討している者です。 例を上げますと、 ジュースの自動販売機の故障分析で、硬貨やお札を受付けて、何枚目程度で1件の詰まりが発生するのか?という分析です。 1ヶ月間に受付けた硬貨や紙幣の枚数と、詰まりが発生した件数はデータとして持っています。しかし、多くの台数を調べていくと、利用状況が当然ばらばらで、データも1つとして同じ物がありません。 このようなデータに対して、(硬貨・お札枚数)×(詰まりの発生件数)で相関分析(量×量それとも量×質??)を行っても良いものか決めかねています。受付枚数も詰まり件数も正規性がないので、データを変数変換等して正規化する必要があるのでしょうか? (データは詰まりが1~30件、硬貨・お札枚数が1000~5000のように非常にばらついています) なにぶん統計初心者でして、どうしてよいか困っております。ぜひご回答よろしくお願いします。

  • Kaplan-Meyer 生存分析に便利なソフトを教えて

    医療関係者(医師)です。Kaplan-Meyer 生存分析をするのに使いやすいソフトを教えて頂けませんか? 現在、FileMaker のデータを Excel に export して、「4stepsエクセル統計」(税込み 4200円)付録の「Statcel2」を用い、生存分析できているのですが、(1) たとえば 肺癌の stage1 から stage4 までの生存分析をしてくれるものの別々のグラフに表示され、1つに手作業でまとめなければならず面倒、(2) 生存期間 0.125月 など 1以下の少数がエラーになる、(3) 表の隣り合った列に並べてからデータの範囲を指定しないといけない、(4) 打ち切り、非打ち切りを 0,1 で指定しなければならない、など不便な所があります。Statistica version6 というソフトが良いと聞き、生存分析してみた所、(2) はエラーにならず、(3) は離れた項目でも選択でき、(4) は「打ち切り」、「非打ち切り」 のままでも良いのですが、(1) は Statcel2 よりさらに使いにいでした。

  • 観察期間中に複数回罹患した場合の統計解析

    以下のような場合、統計解析はどうするのがいいのでしょうか? Aさん、Bさん、Cさん、Dさん・・・と多数の人がいて、各人、1月からの1年間の肩こりや腰痛の発生、改善をみるとします。Aさんは1月に右肩こりが発生しましたが、2月には改善しました。Bさんは2月に右肩こりが発生し、3月には改善したものの、8月に再度肩こりが発生し、11月に改善しました。Cさんは4月に右肩こりが発生し、徐々に軽快してきましたが、治りきらないうちに6月に左肩こりが発生し、1ヶ月間は両肩こりの状態で7月に右は改善。左は10月に治りました。Dさんは5月に左肩こりが発生、改善しないうちに7月に腰痛が発生。腰痛は8月に治りましたが、左肩こりは結局年内には改善せず、翌年の2月に治りました。Aさんの場合は単純に右肩こりというイベントが観察期間内に1回なのでいいのですが、Bさんは同じ部位に2回発生しています。Cさんは両肩こりの時期があり、「肩こり」という括りなら同じですが、別々と捉えるべきなのでしょう。Dさんは肩こりの後は腰痛で肩こりと重なる時期もあります。カプランマイヤーなど生存曲線を描く場合はイベントは1回だけでしょうから、B、C、Dのケースでは解析できません。でも、Bさんを例えばB1さん、B2さんと別人とし、B1は2月に左肩こり、B2は8月に左肩こりとすればイベント1回ずつとなります。CやDのように重なる時期があってもOKですし、Dの左肩こりように観察期間を治らないまま終えれば打ち切りとし得るように思います。もちろん、B1とB2は便宜上別人にしただけで、同一人物なので、その点が問題とは思うのですが、このように考えて解析していいものなのでしょうか?その場合、同一人物を考慮した解析の工夫はありますか?それとも、そもそも別人とすること自体がナンセンスであれば、上記の状態をうまく解析する方法がありますか?統計に詳しい方、教えてください。

  • 吸引法変化による体温の対応のあるT検定について

    統計法についての質問です。 気管内吸引の方法を変更して、感染の有無をモニタリングしています。 変更前1年間、変更後1年間の体温の平均値を、対応のあるT検定でP値を算出することに意味があるでしょうか?ただ単純に高熱の回数を比較した方がわかりやすく、意味があるように感じています。統計に詳しい方よろしくお願いします。

  • 信頼区間の用い方

    お世話になります。 ある治療法について、どれ位の期間継続するのが妥当かを検討したいと思っております。後ろ向き研究で栄養的改善程度をもってその治療が十分に効果を発揮する時期を示したいと思い、栄養状態を示すといわれている要素である体重、血清アルブミン、血清コレステロール、末梢血リンパ球数についての変化を集めてみました。しかし、治療前と治療終了時の対応のある2群の平均の差の検定はできても、治療期間中においては検査時期を統一して定期的に得たデータではないため、治療効果がピークに達する時期を示すのが困難です。そこで、治療患者群(15人程度)で体重、血清アルブミン、血清コレステロール、末梢血リンパ球数について各々観察期間中に最もよい数値が得られた治療開始後月数と最も悪い数値が得られた月数を求めそれらの平均値や信頼区間から妥当な治療期間を推定しようと考えました。しかし、やはりこの研究デザインに無理があるのか、各要素ごとの信頼区間はばらつきが非常に大きく、到底使えるものではありませんでした。そこで各要素の月数をすべてまとめて信頼区間を算出してみると、最も良い効果の出現する時期の信頼区間の上限と最も悪い時期の信頼区間の下限がほぼ同一となり、最適治療期間の指標となるのでは?と思われました。 1)このような手法をとった論文はみたことがないので、おそらく間違った手法であるような気がしますが、やはりダメでしょうか? 2)体重、血清アルブミン、血清コレステロール、末梢血リンパ球数が各々独立したデータであるなら、それらのうちどれかひとつでも最高の結果が得られる時期としての信頼区間であるという考え方は間違っていますか? 3)一般的に考えれば、栄養状態が良い時期に上記4つの要素が連動して良くなると思われますが、観察期間中の最高値をとる時期をそれぞれみつけてみると、意外に各要素間にばらつきがありました。統計学的に各要素に相関・関連性がないデータであることを示すにはどういった手法がありますか? 4)全く別のものでもよいので、何かよい解析手法があれば教えて下さい。

  • 心理学基礎実験で・・・

    大学で心理学基礎実験という授業があります。 心理の学科なら必ずあると思うんですが、 実験・測定・調査方法・論文作成について実習形式で 学ぶものです。 前期では行動分析、一対比較法による尺度構成、大きさの恒常性について それぞれ実験を行い、レポートを提出します。 現在、行動分析を学んでるんですが、次回の授業で 実験をし、その次の週にレポートを提出しなければなりません。 でもいきなり実験します、と言われても何をどうすれば いいのか分かりません。。。 レポートを書くってことは、実験をして、何かが 判明しないとかけないじゃないですか・・・。 どんな実験をして、どんな結果が出れば何がわかるのか、なんて どうやってわかるんでしょうか?? みなさんの行った実験や参考になる本やサイトを 教えてください!! 私たちは7人1班で、うち2人が観察されます。 観察は10秒ずつの時間見本法(タイムサンプリング)で いくつかのカテゴリーを決めておきます(非観察者の 表情や顔の向き、相互作用などなど) そして、ソレを集計し、カッパー係数を算出します。 授業では時間見本法のやり方と、カッパー係数の算出法 ぐらいしか学んでなくて、ソレを算出したら何がわかるのか などはわかりません・・・。 長くなったんですが、何か良きアドバイスをお願いします。 補足などもしますので・・・

  • 大腸がんの5年生存率の計算方法

    上記について質問させていただきます。 ある部位の結腸癌に対して手術をした方が、観察期間中(5年)に他の部位の結腸癌になり治療を受けた場合の扱いはどうなるのでしょうか? 可能性としては以下のどれかでしょうか? 1.他の結腸癌の診断がついた時点で打ち切り扱い。 2.他の結腸癌の治療を行った時点で打ち切り扱い。 3.それぞれ別の症例としてカウントし、それぞれ治療5年後まで観察継続。 4.その他 (もし上記3の場合は観察期間中に結腸癌で死亡した場合、どちらの結腸癌によるものか不明であることがあります。) 統計は全く知識がないため、わかりやすく教えていただけると助かります。 皆様のお知恵をお貸しください。 よろしくお願いいたします。