• ベストアンサー

統計・分析 データを2値にわける手法

カットオフ値の設定についての問題になりますが、 アンケートなどで、ある項目に対して以下のような例があります。 「大変そう思う」「ややそう思う」 「あまりそう思わない」「全然そう思わない」をそれぞれ、4、3、2,1点とします。 これを例えば「思う群=A群」、「思わない群=B群」の2群に分ける場合どうしたらよいでしょうか??? 中間値の「2.5点」をカットオフポイントとして、A群とB群を比較するべきでしょうか? それともA+B群の全体で平均点を出して、その平均値をカットオフポイントにしてA群、B群とわけるべきでしょうか? ある論文には「大変そう思う」「ややそう思う」をA群、 「あまりそう思わない」「全然そう思わない」をB群としてありました。・・・結構権威ある先生の論文でこのやり方でした。 あるテキストにはA群とB群で高いほうの95%信頼区間の下限値をカットオフポイントとするみたいな方法も書いてあります。 どうやるのが、最適なカットオフポイントの設定なのでしょうか?

質問者が選んだベストアンサー

  • ベストアンサー
  • backs
  • ベストアンサー率50% (410/818)
回答No.1

> ある論文には「大変そう思う」「ややそう思う」をA群、「あまりそう思わない」「全然そう思わない」をB群としてありました。 > あるテキストにはA群とB群で高いほうの95%信頼区間の下限値をカットオフポイントとするみたいな方法も書いてあります。 簡便的には前者の方法が最も適しているでしょうし,統計学的な観点からすれば後者の方が適しているといえます。実際は質問項目が何十個とあるわけですから,後者のようなやり方(具体的な方法が察しかねますが)では手間がかかり過ぎるでしょう。かといって,前者の方法を用いた場合では判断が曖昧であるという指摘もあります。そして4件法のデータを間隔尺度とみなすことにも(人によっては)疑問が残ります。 それでも私の場合はやはり「ある論文には「大変そう思う」「ややそう思う」をA群、「あまりそう思わない」「全然そう思わない」をB群として」という方法を採用します。 目的にもよりますが,この場合,ある項目に対して肯定的か否定的かで分けることに着目していると考えられるからです。もし平均値や中央値を境界として分けるとなると極端にどちらかに得点が偏っていた場合に都合が良くないことが起きるからでもあります。例えば4点の人が多くて平均が3.8とかになってしまい,その値で分けるとA群とB群との境界が均等ではなくなる。 というか,そもそも各項目の平均値などで分けるということは各項目ごとにA群とB群とを分けることになるので,被験者で分けることには無理があります。そうなると,論文に載っていたという方法が最も適していると考えられます。

ssmarugoo
質問者

お礼

返事が遅くなってすみません。回答ありがとうございます。 疫学統計を数式で完全に説明できるほどの先生(医学者でもある)方にも直接聞いてみたところ、やはりbacksさんの見解と同じようなことの説明を受けました。どうもありがとうございました。

その他の回答 (1)

  • kishiura
  • ベストアンサー率21% (15/71)
回答No.2

理系大学4年です。 最小二乗法により、y=ax (aは定数、xは点数)を求めて、yをカットポイントとの大小で比較してA群、B群の判定をするとき、そのカットポイントはy平均=a(x平均)になります。

ssmarugoo
質問者

お礼

回答ありがとうございます。統計学的な観点からの説明ありがとうございます。カットオフ値が全体の平均が基本だと勉強になりました。どうもありがとうございました。

関連するQ&A

専門家に質問してみよう