• 締切済み
  • すぐに回答を!

統計解析法の選択について

統計初心者でまだまだ勉強を始めたばかりです。 エクセル統計を購入したのですが、3つの疾病でそれぞれのあるデータ(血液データなどの数値)の平均値の差の検定、 またそのデータを異常なし、軽度異常、中等度異常、高度異常と分けた場合に疾病ごとのそれぞれの割合を解析したい場合、 後者は独立性の検定(χ2検定)でよいのでしょうか。前者に関しては何が最もよいかわかりません。 初歩的な質問で申し訳ありません。周りに相談できる人がいなく質問させていただきました。 よろしくお願い致します。

共感・応援の気持ちを伝えよう!

  • 回答数2
  • 閲覧数187
  • ありがとう数2

みんなの回答

  • 回答No.2
  • kgu-2
  • ベストアンサー率49% (787/1592)

>3つの疾病で  疾病どうしの比較に意味がありますか。ガン患者と肝硬変の患者の血圧を比較しても、意味があるとは考えられません(意味があることを明示できれば、りっぱな論文になります)。一つ一つの疾病について比較するのが、一般的です。 統計は、A集団とB集団の2つに絞った方が簡単で、説明もしやすくなります。疾病の場合は、健常者(A集団)と患者(B集団)について比較します。データのある人が、患者かどうか不明なのですか。  健常者と患者との比較なら、データが正規分布をしていると想定できるならt検定、想定できないならF検定が一般的です。これならエクセルでできます(それぞれ関数のTTEST,FTEST)。その他に、U検定も有力な方法です。がエクセルには無いようです。 >そのデータを異常なし、軽度異常、中等度異常、高度異常と分けた場合に疾病ごとのそれぞれの割合を解析したい場合、 解析に意味があるとは思えません。何と何を比較したいのかが不明です。この4群で比較するのなら、解析しないでも、正常者が一番多い、というのは自明でしょう。もっとも、メタボ検診のように、血圧を140だか135だかに下げれば、異常者だらけになりますが。  そもそも、疾病の程度はどのように判別しているのですか。それとどの程度一致するのか、の解析の方が意味があるのでは。  検定は、集団を設定して、それを比較します。疾病だと、健常者と患者でしょう。どの集団とどの集団を検定すれば意味があるのか、をまずお考えください。臨床検査関係の論文か雑誌には、山ほど発表されているハズなので、それに目を通されて、似たものを真似ることから始められることをお勧めします。

共感・感謝の気持ちを伝えよう!

質問者からのお礼

親切なご回答ありがとうございました。 健常者との比較を考えていませんでした。 いくつか論文を読んで勉強します。

関連するQ&A

  • 統計解析について

    お世話になります。 最近、統計解析のソフトを使ってデータの解析をする事がある程度の初心者の質問です。 30人分の縄跳びを連続で跳んだ回数データがあります。挑戦した回数は10回です。このデータを統計的に解析したいのですが、既存のデータでは200回以上跳んだ場合200以上と記載されています。試しにソフトを使って検定を行うとそれなりの数値が計算されるのですが、この場合200回以上のデータをどう考慮されているのでしょうか?200回以上だと500や1000となると計算に影響すると思うのですが素人考えなのでしょうか?

  • 統計解析法は残差分析でいいのか?

    ある疾病の年度ごとの発生率を統計解析にかけてレポートを作成しようと考えているのですがどの統計解析法を使って良いのかがわかりません。 手元にあるデータとしては一年毎の全患者数と統計にかけたい疾病の疾病例数です。また年ごとのサンプル数はかなり幅があります。 単純に疾病例数を全患者数で除算しものを発生率としてグラフにしてみますと減少傾向にあるようにみえます。 これを統計解析にかけてある疾病の発生率が減っていると証明することはできるのでしょうか? 10年分のデータがあるとして 全患者数、疾病例数の2マス×10年分10マスとして残差分析にかけていいものなのでしょうか? そもそも残差分析なる物がどういうものか理解できていないのですが・・・ また別のデータとしてその疾病に効果があると考えられる薬剤の一年毎の出荷数なるものがありますがどのような統計処理を行えばよいのでしょうか? 全く統計は素人で申しわけありませんがよろしくお願いします。

  • 統計解析 年齢補正

    統計解析で、平均値に関する解析をしました。480名男女 年齢補正の作業はどうしても必要なのでしょうか? できればやりたくないのですが。 初心者がやる場合、excelではどうするのでしょうか? Welchの方法と対応のあるt検定後、相関分析もやりました。

  • 回答No.1
  • backs
  • ベストアンサー率50% (410/818)

基本: どのような実験計画(調査計画)に基づいてデータを得たのかによって、適切な分析手法というものは決まってきます。逆にいえば、適切な解析法を把握せずにデータをとることは、もはや適切な方法を用いてデータを扱うことができないということ(結果として適切な方法を用いることができることもありますが)。 > 3つの疾病でそれぞれのあるデータ(血液データなどの数値)の平均値の差の検定 どのようなデータが得られているのか、それがハッキリしなければ"最もよいか"ということは分かりません。古典的には「k群の平均値の差の検定」として分散分析が用いられますが。 > 異常なし、軽度異常、中等度異常、高度異常と分けた場合に疾病ごとのそれぞれの割合を解析したい 独立性の検定が適切かもしれないし、そうでないかもしれません。ただ、多くの場合は比率の差の検定が行われることもあるということです。 ・どのような尺度水準をもつデータが得られているのか? ・そのデータは連続型なのかカテゴリカル型なのか? ・独立なのか対応ありなのか? ・従属変数は何か、独立変数は何か(どのような変数があるのか)? この辺りをまとめて質問をすると、より的確な回答も得られるかもしれません。

共感・感謝の気持ちを伝えよう!

質問者からのお礼

丁寧なご回答ありがとうございました。 情報の足りない質問で申し訳ありませんでした。 3つの疾病→例えばある地域の心筋梗塞、脳梗塞、閉塞性動脈硬化症。 血液データ→GFR(腎機能)とした場合、それぞれの患者で数値で表せるので間隔尺度データということになり、平均値を検定するのはそれぞれをt検定でだすしかないのでしょうか。 指摘していただいたご回答を参考に勉強します。 ありがとうございました。

関連するQ&A

  • 統計解析

    統計解析に関する質問です。Fisherの直接確立計算法とKurskal-wallis検定について分かりやすく説明していただける方いらっしゃいますか?自分で調べてなんとなくはわかるのですが、統計用語が難しくていまいち理解に苦しんでおります。。

  • 平均値の解析法について どの検定法を用いるか

    先日、以下のような質問をして… 「統計分析の初心者です。 データがあってもどの方法で解析をすればよいのか途方にくれています。 経年的に追跡しているデータで、平均値まで出しています。 平均値は低いほど良い結果です。 1年目、2年目、3年目と3回分のデータがあるのですが、1年目よりも2年目、2年目よりも3年目、1年目よりも3年目の方が良い結果が出ている(平均値が低くなっている)ことを統計的に解析したいと思っています。 どのような方法があるのか、たくさんあるかもしれませんが、教えていただけませんでしょうか? これからのためにも、なぜそれが良いのかも知りたいと思っています。」 そして回答者さまから、標準偏差について親切に教えていただきました。 早速、標準偏差を出してみました。 すると、またお聞きしたいことがでてきましたので、どなたか教えていただけませんでしょうか? 1年目のデータと2年目のデータの標準偏差を比較すると、2年目の方が小さくなりました。 これは、ある介入がこのデータに有意な影響を与えていると言えるのでしょうか? 有意差ありと。 2年目のデータと3年目のデータの標準偏差を比較すると、3年目の方が大きくなっていました。 これは、有意差が得られなかったとなりますでしょうか? このように、平均値は小さくなったが、標準偏差は大きくなっていたものに関しては、平均値が小さくなったのは、たまたま偶然そうなっただけというのをお聞きしました。 このように、たまたま偶然そうなっただけというものを、何とか有意差ありと言えるように解析するものはないものでしょうか…? また、これとはまた別の話になるかもしれませんが、よく聞くt検定やカイ二乗検定、マンホイットニーU検定などをこのような研究に使用するとすると、どのように活用すれば良いのでしょうか? 男女や年齢がわかっているのと、得られたデータの値の高い群と低い群を分ける明確なラインがわかっています。 的外れな質問だったら申し訳ありません! 周りに相談できる方がいないので、もしよろしければご回答いただけませんでしょうか? よろしくお願いいたします。

  • 統計いついての基本的な質問です

    統計についての質問です。 ある患者さんを対象にした心理実験の論文で、数字列の復唱が何ケタまでできるか二人の被験者(AさんとBさん)に調べたものがありました。 2桁、3桁、4桁、5桁の数字をそれぞれ10回ずつ復唱させた結果(計40回)、Aさんは10/10, 8/10, 2/10, 0/10という成績でした。Bさんは10/10, 9/10, 5/10, 3/10という成績でした。 論文では、二人の成績には有意な差がある(χ2=6.17, p<.02)と結論しているのですが、この検査結果をどのようにχ二乗検定すれば同様の結果になるのでしょうか?よくわからず統計ソフトで数字を入れてみても違う結果になってしまうもので・・・ ただし5桁の検査結果は検定には含めなかったとも書いてあるのですが。。 素人質問で大変申し訳ないのですが、どなたかお教えいただければ幸いです。実は同じようなデータを解析しようとしていて困っています..

  • 統計解析の平均値

    お世話になります。統計学の初心者です。 あるデータの解析を実施しようと思うのですが、 例えば一週間分のカロリーの平均値を人毎に算出して、 12週間の傾向を観察したいのですが、1週間のカロリーの平均を計る際、1日食べなかった人や飲み会などに参加してしまい、平均値の変動(参考にならない数値結果)があるため、その人の平均値が大きく変動してしまいます。除外するには除外するデータが多すぎて困っています。 平均値の算出方法として食事を摂らなかった人や計算値が大きすぎる人をうまく考慮した平均値の計算方法はあるのでしょうか?

  • 平均値の解析法について

    統計分析の初心者です。 データがあってもどの方法で解析をすればよいのか途方にくれています。 経年的に追跡しているデータで、平均値まで出しています。 平均値は低いほど良い結果です。 1年目、2年目、3年目と3回分のデータがあるのですが、1年目よりも2年目、2年目よりも3年目、1年目よりも3年目の方が良い結果が出ている(平均値が低くなっている)ことを統計的に解析したいと思っています。 どのような方法があるのか、たくさんあるかもしれませんが、教えていただけませんでしょうか? これからのためにも、なぜそれが良いのかも知りたいと思っています。 周りに相談できる方がいないので、教えてくださる方がいれば助かります。 よろしくお願いします。

  • 統計

    卒論のために、統計(検定?)を勉強しています。 データの数が多くなくて、2×2のχ二乗検定もしくはFisher解析をまず行いました。 その後、3群比較が必要になり、2×3の検定を行いたいのです。セルの期待度数が小さく、Fisher解析のほうがいいのかと思ったのですが、これは2×3はできないのでしょうか。 検討違いの質問内容でしたら、ご指摘下さい。 いろいろ本を見てみたのですが、 よくわからないのです、すいませんが よろしくお願い致します。

  • 統計解析法

    統計解析手法の検定についての質問です。 2つの母平均の差の検定の場合です。 帰無仮説H0:μ1=μ2 対立仮説H1:μ1≠μ2とします。 帰無仮説が棄却された場合は結論として対立 仮説が成り立ち、第1種の過誤はαであり、 このケースは問題ありません。 しかし、帰無仮説が棄却されない場合、第2 種の過誤の問題があり、積極的に結論として 帰無仮説が成り立つとは言えません。 上記問題は、2つの母平均の差の検定の手法を 使って、積極的に2つの母平均に差が無いと言 う結論を統計的に導き出す事の障害になります。 2つの母平均の差の検定の手法をうまく工夫 する事、又は、別の手法で、2つの母平均に差 が無いとの結論を統計的に導く事は出来な いでしょうか? ご教授の程宜しくお願い致します。

  • 統計解析で何を用いればよいのか教えてください。

    メンタルヘルス教育で介入群(n=14)と非介入群(n=10)の前後の比較と、介入群(3群:n=7、8、9)に対する介入前後の比較の統計解析を行いたいのですが、何を用いればよいのか分からなくなってしまっています。サンプル数は10前後なのでノンパラメトリック検定となるのではないかと考えています。介入群と非介入群の比較については分散分析をすればと助言もいただいたのですが、ほとんど理解できていません。 抽象的な質問で分かりにくいかもしれませんが、助言を頂けるとありがたいです。

  • 統計学

    2個のサイコロを同時に投げる時、それぞれの出る目の数をX,Yとする。XとYは独立か。 さらに、Z=X+Yの従う確率分布及びその分布の平均値と分散を求め、μ(z)=μ(x)+μ(y) 、 σ^2(z)=σ^2(x)+σ^2(y)がそれぞれ成り立つことを確認せよ。 という問題なのですが、2次元確率分布表とXの周辺分布、Yの周辺分布はわかったのですが、周辺分布を使って、平均値と分散が出せたと思うのですが、ご教示願えませんでしょうか。 また問題にはσ^2(z)=σ^2(x)+σ^2(y)が成り立つ時、σ^2(z)=σ^2(x)+σ^2(y)+2σ(xy)が成り立つ時がありますが、どのような場合に変わるのでしょうか。 独立のときが後者で、独立ではない時は前者なのでしょうか。

  • 統計解析法に関して

    統計学に関しては全くの初心者です。現在、ある疾患の原因究明の研究に携わっています。具体的には、死後脳を使って候補遺伝子の発現量の違いを疾患群と健常者群とで比較検討を行います。そこで、データの解析法について御指導していただきたく存じます。論文など参考にするのですが、結果のみでそこにいきつくまでの考え方、解析の流れなどが判然といたしません。 得られた発現データと診断にてT検定を行うだけならクリアカットですが、死後脳を扱うために種々の影響を考えないといけないのではないかと思っています。実際、論文にはPMI(死後、脳摘出までの時間)、pH、死亡年齢などを考慮したように書いてあります。私の扱っているサンプルも調べてみると疾患群と健常者群でPMIなど有意な差があります。そのため、診断以外の変数が遺伝子の発現に影響している可能性を考える必要があるかと思います。素人なりに考えたのですが、それは重回帰分析をすればよろしいのでしょうか。それで発現量に影響を及ぼしている変数が見つかれば、それを共変量としてANCOVAを行う。発現量に影響を与える変数が見つからなければ、T検定もしくはOne-way ANOVAを行う。こういった考え方でよろしいでしょうか。統計ソフトはSTATISTICAを使う予定です。何卒、御指導の程よろしくお願いします。