サンプルサイズの計算方法とマンホイットニー検定の条件

このQ&Aのポイント
  • 看護研究で準実験的なデザインで皮膚症状の改善を目的にした二つのケア方法を比較する調査を行います。
  • サンプルサイズの計算方法を知りたいが、看護研究や統計学の知識が不足しており困っています。
  • マンホイットニー検定の条件についても知りたいです。
回答を見る
  • ベストアンサー

サンプルサイズを計算する能力がなくて困っています。

看護研究で準実験的なデザインで皮膚症状の改善を目的にした二つのケア方法を比較する調査を行います。看護研究や統計学の知識が足りないので、自力でサンプルサイズの計算ができなくて困っています。数式は調べたのですが、あてはめようにもさっぱり意味がわかりません。どなたかぜひとも教えてください。お願い致します。   尺度は、順序尺度で5段階の皮膚スコアを使います。対照群と介入群にケアを無作為に割り付けたいと思います。前回、同一対象者に対照群と介入群のケアを連続して実施したため、前のケアのバイアスの影響が出て、うまくいきませんでした。今回は、対応のない2群のデータにします。検定は、マンホイットニー検定を考えています。  計算があんまりにも難しくて、いろいろな本をあたるうち、マンホイットニー検定は、危険率5%(p<0.05)での検定には、両群とも4以上が必要と書かれていました。こんなに少なくても大丈夫なのでしょうか 患者さんに迷惑をかけないよう検出可能な最小サイズでいきたいです。 どなたかぜひとも教えてください。よろしくお願いしたします。

質問者が選んだベストアンサー

  • ベストアンサー
  • r_nurse
  • ベストアンサー率65% (180/274)
回答No.1

看護大学で教員をしている者です。 計算ができない、数式が分からないのは、構わないと思うのですが(私も統計家ではではないので、多くはソフトウェアに頼っています)、なぜサンプルサイズを事前に決定した方がよいのかの意味を理解していないといけないと思います。 > こんなに少なくても大丈夫なのでしょうか?  たとえば、サンプルが少ないと何に問題が生じて大丈夫でなくなる可能性があるとお考えでしょうか?  私自身は、サンプルサイズの問題は程度の問題であって、実施可能でかつ問題点が最小化できるようにデザインしますし、弱点は弱点として論文に書くようにしています。  すくなくとも、各群が3,4名というのは、理論的に計算可能とか、算出した値に意味が出てくるといった最低ラインとお考えになられた方がよいと思います。  期待される差(標準化エフェクトサイズと呼んだりすると思います)がどれくらい違うのかによって、必要なサンプル数は異なります。  5段階で評価されるということですが、A群が全員5、B群が全員1と回答すると予想されるときと、A群の平均が2.45、B群の平均が2.55の時では、変わってきますし、各群の標準偏差(ちらばり)の大きさによっても異なります。  参考までにフリーウェアのRというソフトで計算すると、対応のないt検定の場合、比較的差が大きいとされる目安(標準化エフェクトサイズ=0.8)で、有意水準0.05、検出力0.8となるように計算すると、各群が25.5は必要と出てきます。ノンパラメトリックだと、もう少し必要になると思います。            

857555
質問者

お礼

ご教示ありがとうございます。 とても参考になります。具体的な数値まで示していただき、非常に助かりました。 昨年の研究ではサンプル数の算定は行いませんでした。文献を読んでみると、介入効果をみる場合、有意差が出なかったときに、本当に差がないのか、数が足りなかっただけなのかということがわからなければ、研究自体の意味がなくなってしまうとありました。必要以上の人に迷惑をかけないためにも重要な意味があると思いますし、研究結果の信頼性に大きく影響があることだと思います。サンプルサイズを押さえたうえで研究計画書は書いていないと、肝心の研究方法の妥当性に問題が生じるような気がしました。弱点にも気付くことができません。  昨年の調査では、各群7名程度の対象者で今年度も同等程度を見込んでいます。現実的な制約は変えられないので、サンプルが少ないという問題を最小化するにはどうしたらよいか考えています。ある症状を持つ高齢で寝たきりで全身性の皮膚疾患のない対象者など、条件の限定をするという方法でも効果があるのでしょうか?思いつくのはそのくらいしかないのですが、ここは重要な部分なので慎重に考えてみたいと思います。非常に勉強になります。ありがとうございます。

関連するQ&A

  • 文献で使われている統計学的分析の正否について

    ある文献で使われている統計学的分析に疑問を感じるので教えて下さい。 対象者に、運動プログラムを処方して、その介入群と対照群を、間隔尺度のスケールで評価しています。単回帰分析(ピアソンの r )を用いているのですが、スチューデント t-検定をするべきではないですか? 運動プログラムというのは、数字では表せない介入ですし、2変量間の関係を見るにも見れないと思うのです。結果はP値と95%信頼区間で表され、もっともらしいですが。 t-検定だと、独立した群間の間隔尺度の平均値の差を分析でき、独立変数は名義尺度で良いのですが・・・・。 実は今度、その先行研究を元に、似たような研究の計画を立てようと思うのですが、分析方法に引っかかっています。知人の医師は、問題ないと言うのですが・・・。

  • 無作為に介入群と対照群に割り付けるにはどうしたらよいでしょうか?

    看護研究で準実験的なデザインで2つのケアの効果の差を出したいと思っています。昨年同様の調査をしたら、5月から8月の期間、対象者は10人くらいでした。できるだけきちんとした研究方法でデータを取りたいのでもう一度調査をしたいと考えています。入院患者さんなので入退院のため、調査開始時に全員いるわけでなく、5月に4人、6月に2人とかという感じです。 このような場合、無作為に対照群と介入群の割り付けを行うにはどうしたらよいでしょうか?  封筒法?乱数表?置換ブロック法?? 素人なのでよくわかりません。どなたかぜひとも教えてください。 お願いします。

  • 統計学 実験研究計算(フィクション例)答え求めてく

    ある看護研究者は、新人看護師のストレスの研究をするためにストレスの刺激となるであろう要因を探していた。そこで、ある特別で高度な最先端医療のオリエンテーションを受けることが、新人看護師の不安を高める効果があるのではないかと思い、実際にその効果の有無を検討してみることにした(事前に病院の倫理委員会に申請し承認を得ている実験を仮定する)。 無作為に抽出した被験者を実験群と統制群に各々5人ずつ割り当てた。実験群の被験者に対しては、不安を上げる効果をもつと予想される医療オリエンテーションを実施し、一方統制群の被験者に対しては、オリエンテーションを行わなかった。その後、各被験者の状態不安(質問紙)の強さを測定したところ、Table1.のような結果が得られた。 両群の状態不安の平均値に差が認められるか否か検討しなさい。 実験群 10 8 22 14 18 統制群 9 11 7 8 7 1.実験群と統制群の状態不安得点の平均値と標準偏差(SDをも求めなさい((注)式と計算過程を明記すること。SD値は√のままでよい)。 2.2条件(2群)間の平均値の差の検定をt検定を用いて行いなさい。 3.以上の結果から、ここで用いたオリエンテーションが不安を高める効果があったと結論できるか。 という課題の問題なのですが 誰にきいても何を写してもいいといわれたので 回答お願いします! 他にも山ほど課題があり専門分野ではない問題で焦っています(>_<)

  • 【統計処理】2群間の差の有無を調べるには?

    あるデータを収集し、その分析をしなくてはいけません。 SPSSを使用する予定ですが、どの分析方法がいいのかがわからないので教えてください。 ランダムにN=30のサンプルを2群に分けました。 属性が等質であることは確認しました。 介入群と対照群の2群に対して、 介入直前・直後・10分後・15分後・・・・30分後までリッカート尺度を測定しました。欠損値はありません。 介入群と対照群でそれぞれの時間で測定されたリッカート尺度に差があるのかどうかを調べたいと思っています。 統計がよくわからず、皆さんに教えていただけたらと思います。 よろしくお願いいたします。

  • 統計:正規分布を仮定するかどうか(検定手法)

    母平均に関して差があるかどうかを検定したいです。 サンプルに関してA群とB群があります。 t検定を行いたいのですが、この場合、A群・B群ともに正規分布を仮定できる分布でなくてはならないものだと思います。 しかし、A群・B群に関して比較する項目が5種類ありそのうち3種類は正規分布を仮定でき、あとの2種類は正規性を期待できません。 この場合、統一してノンパラメトリック検定を行うべきですか? それともt検定とノンパラ(マンホイットニーU)検定の両方を使うべきですか? あと、A群だけ正規分布を期待できてB群は正規分布を期待できない場合は?・・・やはりノンパラメトリック検定ですか? 両群とも正規分布を期待できてはじめてt検定ができるのでしょうか?

  • 統計の検定方法がわからず困っています。どなたかぜひとも教えてください。

    看護研究初心者で、統計学の本を読んでもさっぱりわかりません。非常に困っています。理解力が低く、情けない限りです。すみません。どなたかお助けください* 現在実験研究をしていて今月末でデータが出そろいます。 データ数は13の予定です。 あるケア方法の有効性を検証するために、同一対象者に従来のケアと新たなケア時の皮膚の症状(0~3の皮膚スコア)と臭気の程度(0~5)についてデータをとりました。 質問です。対応しているデータと思いますがデータ数が少ないし、正規分布もしていないような気がするので、検定はウィルコクスンの符号付順位和検定でしょうか?でもグループ内に同順位が3つ位づつあったりするのに大丈夫でしょうか?EXELしかないのですがこの研究の検定名と初心者でもわかる検定の手順を教えてください。不足情報は追加いたします。参考サイトでもよいのでよろしくお願いいたします。

  • t検定 U検定 メディアン検定

    サンプルサイズ300の集団に心理系の4尺度の質問を行い、まず属性により尺度得点に差があるかをみたいのですが、下位尺度と自作の質問で全部で17あります。属性は2群が4種類と3群がひとつの5つあります。 この全てについて、性別で2群に分けた後、別の属性で分類し比較したいのですが属性によっては、8と140とかかなりサンプルサイズにばらつきがあります ある属性では、正規分布は1尺度だけでこれにはt検定。正規分布でない尺度にU検定をし、等分散でないものにはメディアン検定など使うのでしょうか SPSSを使っています 記述するときには膨大な量になります。正規分布している場合にはt検定で平均値とSD、p、そうでなければU検定で中央値とp、等分散でなければメディアン検定で中央値とpを書くのでしょうか 初心者です

  • 対応のない2群の順序尺度の検定法を教えてください。

    対応のない2群の順序尺度の検定は、マン・ホイットニー検定だと思うのですが、次の場合はどう考えたらよいのでしょうか? 介入後の臭気の程度を順序尺度で評価するときに、個人差を考え、2名で評価しました。2名の評価値の平均を分析に用いるとき、検定はマン・ホイットニー検定でしょうか? それとも順序尺度だけれど平均値を使うのでt検定となるのでしょうか? 統計学は、難しくてなかなか理解できなくて困っています。すみません。初心者にわかるような内容で解説していただけないでしょうか? 順序尺度は、非計量データであることを考えると平均値を用いること自体がナンセンスという気がします。しかし臭気という感覚を評価するとき、個人の感覚に左右されるものであるので2名か3名の平均値を使った方がいいように感じます。ここもわかりません。 どなたかぜひとも教えてください。お願い致します。

  • 統計で,χ2乗検定について

    看護研究で、マニュアルを作成し、効果をみるために、マニュアル使用前と使用後にアンケートを行いました。マニュアルの項目で実施したか、しなかったかを把握するために、質問を名義尺度データとしました。実施した(1)、実施しない(2)、使用前と使用後を調査しました。名義尺度データの場合、χ2乗検定でないと、統計できないと思っているのですが、χ2乗検定で行えますか?よろしくお願いします。

  • どの検定を使えば良いのか

    卒業論文で自己意識尺度と友人関係に関する尺度を使って アンケートを行いました。 そのアンケートの統計ソフトで計算するのに どの検定を使えば良いのかわからなく、困っています。 自己意識尺度は7件法、友人関係は6件法の合計点を計算します。 具体的には自己意識尺度で私的自己意識尺度と公的自己意識尺度の 平均を回答者全体で出し、それより低い者と高い者とに分けて統計処理をします。 友人関係に関する尺度も表面的に付き合っているか、内面的に付き合っているか 回答者全体の平均を出し、 それより低い者と高い者とに分けて、統計処理をしようと考えています。 統計処理する時には、私的自己意識の高い者と友人(内面)の高い人 公的自己意識の高い者と友人(表面)の高い人という群の間に 関連性があるかを調べたいと思っています。 t検定とかカイ2乗検定とかいろいろありますが、私の場合は どの検定を使えば良いのでしょうか。