- ベストアンサー
統計計算について
はじめまして、私は看護師をやってます。今回看護研究たるもので、骨折した患者さんにVAS(痛くないが0最大痛いが10)とゆう痛みのスケールをもちいて、足つぼマッサージを行う前と後のデータをとりました。その効果を統計学的にみてみたいのですが?どうもt検定では、だめなそうで。。。 統計学にくわしいかた、ぜひよろしくおねがいします^^ データは18にんで 前が9,8,10,7,5,9,10,10,8,10,10,6,8,9,10,9,10,9, 後が9,9,10,7,6,10,10,9,8,10,7,8,10,10,10,10,10,10
- みんなの回答 (4)
- 専門家の回答
質問者が選んだベストアンサー
- ベストアンサー
統計学的な「検定」における「検定法の選択」についての質問と理解しました。 適切な検定法を選択するには、得られた変数の「尺度水準」を考える必要があります。 “得られた変数”とは、今の例では、8とか9とか10という数字で表されているデータのことです。 尺度水準が (1)「類別」以上 (2)「順位」以上 (3)「間隔か比率」 (4)「間隔か比率」で正規分布をなす というような(実は多少端折りあり)分類で、適切な検定法を選ぶことになります。 「類別」というのは、A、B、C、というようないわゆる分類による変数です。これをたとえば、1、2、3というように数値で表したところで、この「平均」などを計算しても意味がありません。 「順位」というのは、観測によって得られた、たとえば、A、B、C…という分類が、A<B<Cというように大小(強弱etc)の比較が可能な順番になっている分類です。これは、数値に置き換えて、1、2、3…とした時、少なくとも1<2<3という大きさの比較は可能なものです。この場合、平均を計算することが無意味とは言えませんが、場合によっては少し苦しい感じです。分かりやすい例でいえば、職場における「偉さ」の尺度として1=ヒラ、2=係長、3=課長、4=部長、5=社長というように変数を選んだ場合はこれに当ります。明らかに序列がありますが、3は1の3倍偉いかというとそういうわけではありませんし、1と2の差が1で、4と5の差も1であるから、この二つの差は等しいといえるかというとかなり無理がありそうです。 質問者さんがあげられている今の例は、この「順位」に相当するのではないでしょうか? 「間隔・比率」でようやく、通常(?)の測定値、つまり、何個とか、何センチとか、何グラムとか、そういう連続した尺度での計測値を取扱うことになります。1個+2個=3個というように本当の意味での計算が可能な変数です。(痛さの尺度では痛さの尺度1+2=3というわけにはいかないのではないでしょうか? 一応そのように推測して話を進めます。) 実は以上の説明は多少不正確ではありますが、おおよその意味を理解していただくため細かいところは省略しました。 で、それらの観察値から、さらに要約値(平均値とか中央値とか標準偏差とか相関係数とか)を取り出して検定するのかなどを考慮し、帰無仮説を立てて、適切な検定法を選択して、検定するという順序になると思います。 検定法ですが、上記の尺度水準と、それから何を求めたいか、すでに既知の条件或いは仮定してもよい条件をみて決めます。ここでは、尺度水準ごとに、ざっと主なものの名前だけ挙げておきます。 (1)類別変数 ・1試料なら2項検定、1試料χ二乗検定 ・独立2試料なら、Fisherの直接確立検定、2試料χ二乗検定 ・対応2試料なら、McNemarの検定 ・独立多試料なら、多試料χ二乗検定 ・対応多試料なら、CochranのQ-検定 …… (2)順位変数(以下は検定の名前のみ羅列) →Kolmogorov-Smirnovの1試料検定、同2試料検定、1試料連検定、2試料連検定、2試料中央値検定、Mann-WhitneyのU-検定、Mosesの検定、符号検定、Wilcoxonの符号順位検定、多試料中央値検定、Kruskal-Walisの検定、Friedmanの検定、Spermanの順位相関検定、Kendallの順位相関検定、…… (3)→独立2試料無作為化検定、対応2試料無作為化検定、…… (4)→1試料の平均値のための正規分布による検定(母分散既知)、1試料の平均値のためのt-検定(母分散未知)、1試料の分散の検定、2試料の分散のF-検定、等分散独立2試料の平均値を比較するt-検定、対応のある場合のt-検定法、Bartlettの検定、一元配置分散分析、二元配置分散分析、相関係数rの検定、回帰直線の検定、……。 ということで、今の課題では、得られた変数の尺度水準は(私が推測するに)「順位」ですから、(1)か(2)、出来れば(2)から、条件のあったものを選ぶことになります。 すなわち、t-検定を使うのは適切とはいいがたいと思います。 順位変数でかつ、対応2試料ということになりますので、適切な検定法は、符号検定法かWilcoxonの符号順位検定法であり、段階が1段階の変化か2段階の変化かでその違いの意味がある変数が得られていると判断できる場合には、後者の方、すなわちWilcoxonの符号順位検定法が適切だと私は考えます。 もし1→3 と4→5の変化の違いが単純に差が2と1の違いがあるとは言い難い場合には、Wilcoxonではなく符号検定法が適切といえます。このあたりはVASという尺度の性質を知らないと選べません。もし、痛み2は1の2倍、で痛み8は4の2倍の痛さでその二つの「2倍」という意味が同等であるといえる尺度であれば、尺度水準は一段階上がると思います。 なお、お書きになったデータに間違いがないのであれば、1尺度以上改善(数値低下)2例、1尺度以上悪化(数値上昇)8例、不変8例ですから、どんな検定法を用いてもよい効果が得られた(数値低下があった)という結果は出ないと思います。むしろ有意に悪化なのか有意差はないのかという問題のようです。それは実際に計算してみないとわかりません。 なお、この領域でのこういう研究をお続けになるのであれば、「生物統計学」のようなジャンルの、詳しい解説のある本を少なくとも1冊は手元に置かれていたほうがよろしいと思います。
その他の回答 (3)
#1の補足を読むと、有意差を出したいという意味のよ うですが、#3の方が書かれているように、研究の結果 としては、「悪化している」ので、むしろ、「検定で 有意差が出ない」ほうがよろしいのではないでしょう か? 統計方法をいろいろ変えるのは一つのテクニックでは ありますが、あるレベルを超えると、かなり結論はう そに近くなります。 「よかれと思ってやってみたが、全体としては、悪化 した人が多かった。検定では、有意差が出なかったの で、害があるとまでは言えないが、積極的に行う価値 のある程の看護行為ではなかったと考える。 質問の結果をみる限り、上のような結論が、妥当ではないでしょうか。 また、下記URLより、正規分布検定ができるようです。
- kgu-2
- ベストアンサー率49% (787/1592)
推計統計学では、おっしゃるように、有意差がでないとなんの話もできません。出たら勝ち、です。 ただ、その場合もルールがあります。 t検定を採用されたようですが、この場合、被験者の分布がt分布をしている、あるいは十分にt分布であると推定してもよい、という前提が必要です。 実際のデーターを見ても、10が多く、t分布しているとは想えません。なにより、最大を10としていますが、11のひとも35の人もいたかもしれません。したがって、検定法として、t検定を採用したこと事体が誤りだと考えます。 私なら、前と後ろで、よくなったかどうかだけを聞いて、カイ2乗検定くらいで、と考えますが。 ただし、最大の10の人が多く、痛い思いをするこの検査には、参加したくありません。
補足
VASスケールは最高10なんです。。。 痛い患者さんにマッサージ^^ 少しはよかれとおもってやってみたんですが。。。
有意差がでないという意味でしょうか? 「それほどの差はない」と考えてよいのではないかと思いますが。 それとも、t検定は方法論として間違っていると? 私は間違いではないと思いますが、そういう指導があったとしたら、対応のあるのに対応のない検定をしているか、あるいは、Wilcoxonを使えという意味だと思います。
補足
ありがとうございます。えーーと、私もどうも、ウイルコクソンとゆうのがあやしいとおもっていたのですが、、、それには、対応のあるt検定より有意差はでにくくって、正規分布していないデータにもちいるんですよね。。。 すくない知識でもうなやんでいるんですが、正規分布しているかしていないかとゆうのは、手っ取り早く知るにはどうしたらいいんですかね? 本当うに素人で、、、すいません><
お礼
お返事がおそくなりました。 ありがとうございました。大変参考になりました。 貴重なお時間をさいてしまいすいませんでした。 これからも、がんばって研究を続けたいとおもいます。