• 締切済み

アンケート分析 ANOVAについて

アンケート分析についての質問です。詳しい方どうかよろしくお願いいたします。 今回、被験者に5つの因子を想定して26項目のアンケート(1-5段階評価)を行いました。各因子4~6項目あります。 5つの因子に対して、因子間に差があるかを一元分散分析を用いて分析したいのですが、その手順が分かりません。過去の文献を見ると、平均値の分散分析を行っているようなのですが。。。単に5つの水準のものをANOVAかけるのはやった事があるのですが、このようなケースが初めてでして どなたか詳しいかた、よろしくお願いいたします。

  • yowy
  • お礼率50% (6/12)

みんなの回答

  • backs
  • ベストアンサー率50% (410/818)
回答No.5

まずは因子ごとの尺度得点(例えば因子1に3つの質問項目があるとすれば、それら3項目の合計点)を計算することですね。そうすると回答者は45人いるわけだから、F1からF5まで各45人分のデータがまとめられることになりますでしょ? F1 = {x1, x2, x3, ..., x45} F2 = {y1, y2, y3, ..., y45} F3 = {z1, z2, z3, ..., z45} F4 = {h1, h2, h3, ..., h45} F5 = {k1, k2, k3, ..., k45} このデータを「5群の平均値の差の検定」として分散分析をすればよいのです。厳密には独立5標本ではないのですが、便宜的に(といっていいのかどうか分からないですが)独立5標本として分析するので問題ないでしょう。 実際、質問紙調査の場合は実験室的な実験ほど厳密にデータを集めるのはかなり難しいので、ときには"妥当である"という割り切りも必要かもしれません。

yowy
質問者

お礼

本当に色々とありがとうございます。 これでやってみたら F (4,20)= 2.506 sig.=.075 と出てきました! ずっと悩んでいたことなので、その過程でも色々と勉強させていただいて感謝しております また機会があれば、どうかよろしくお願いいたします

  • backs
  • ベストアンサー率50% (410/818)
回答No.4

正確なことは実験の計画書を見てみないと判断できませんが、その結果はおそらく擬似反復によるものでしょう。 心理系の、しかも質問紙調査を行っている論文の多くみられる例ですが、主効果の自由度に対して明らかに誤差の自由度が過大である場合、そのほとんどは"まず間違いなく"擬似反復に気づかず解析を行ってしまっています。 自由度について正しい見方を身につけると、擬似反復は簡単に見抜けてしまいます。誤差の自由度は全データ数から推定したパラメータの数を引いたものになります。例えば、1要因5水準の分散分析モデルだと全てで5つのパラメータを推定することになるので、仮に30人分のデータが得られている場合は 30 - 5 = 25 というのが誤差の自由度になります。ちなみに、主効果の自由度は4になります(主効果の項では4つのパラメータを推定するので)。 ただ、適切な解析を行っていても同じように誤差の自由度が過大になることはあります。それは、単にたくさんのデータをとって少しのパラメータしか推定していない場合です。例えば、1グループ200人で構成されている5つのグループを用意して、グループごとに差があるかを検定した場合です(G1=200, G2=200, G3=200, G4=200, G5=200で合計1000人の被験者を用意したことになる)。この場合は 1000 - 5 = 995 というのが誤差の自由度になります。主効果の自由度は同じく4になります。 まとめると、質問者さんのような自由度が得られる場合は以下の2点のことが考えられます。 1) 擬似反復であることに気づかずに解析してしまっている(間違った解析)。 2) 多くのデータから少ないパラメータを推定しているに過ぎない(解析としては間違いではない)。 どうやってこの2つを見分けるかというと、(繰り返しになりますが)正確には実験の計画書を見なければ分かりません。ただし、経験的にどちらの過ちを犯しているかはある程度、察しがついてしまいます。だから、たぶん質問者さんの場合だと擬似反復に気づかずに解析してしまっているのだと思えるのです(この場合は適切な処理を行えば問題を解決することはできる)。 ちなみに、2)の場合は解析方法としては間違っていなくても、実験計画の段階でサンプル設計について過ちを犯しています。不要に大きすぎるサンプルサイズは「有意でないのに有意であるという結論を導いてしまう(すなわち第一種の過誤を犯す確率が高くなる)」のです。

yowy
質問者

お礼

本当に色々とありがとうございます。 私も自信なくやっているもので、おそらく第1の原因なのでしょうね・・・ 実験計画がどこまでの詳細を申し上げればよろしいのか分かりませんが、出来る範囲でまとめてみました。既に沢山教えていただいておりますので、もしもこれ以上付き合いきれないという場合は仕方ありません。 今回の研究は、「高校生の動機減退説」についてのもので、 被験者45名に対し、1-5スケールの質問紙を配布したものです。 目的は、因子間に差はあるか、どの因子が学習者をより動機減退させるか、させないか、ですので、質問紙は 5つの因子からなり、各因子に4-6項目の質問をつけています。 解析方法は、各因子の合計点の平均の比較をしたかったので、一元配置の分散分析を行い、先日のようなF(4,1136)=9.201 sig.000 という結果が出ました。 以上が概要ですが、どう改善すればよいのでしょうか?できればよろしくお願いいたします

  • backs
  • ベストアンサー率50% (410/818)
回答No.3

細かいことですが、この場合は「カテゴリに含まれる項目」という言い方ではなく、「因子に含まれる質問項目」というべきです。繰り返しになりますが、因子(要因ともいう)の下位に水準(カテゴリ、属性ともいう)が存在しているのです。だから「1カテゴリ4項目」ではなくて「因子1における4つの質問項目」とか「因子1に属する4つの質問項目」と表現するのが誤解なく伝わるので適切でしょう。 通常は被験者ごとに各因子に含まれる質問項目の合計点を出して処理をすることが多いでしょう。 ただ結局は「何を比較したいのか」ということですから、 > 1カテゴリー 4項目 > 2カテゴリー 4項目 > 3カテゴリー 5項目 > 4カテゴリー 3項目 > 5カテゴリー 5項目 の各因子ごとの平均値に差があるかどうかを検定するのなら、各カテゴリに含まれる数項目の合計点を計算すればよいでしょう。そうではなくて、項目ごとに差が認められるかを検定したいなら項目ごとに行えばよろしい(こういうことはしませんがね)。

yowy
質問者

お礼

いろいろと丁寧にありがとうございました。 回答を頂いてから色々やってみたのですが、 とりあえず5因子の差を見たいので、1要因5水準のANOVAをかけてみたのですが、結果が F(4,1136)=9.201 sig.000 となり、見慣れない大きな数になったのですが、これは致命的に間違った方法をとっている可能性はあるのでしょうか。。。。?

  • backs
  • ベストアンサー率50% (410/818)
回答No.2

> 5つのカテゴリーで、どこかに差があるのか すでに述べたように1要因5水準の分散分析ですね。ちなみに、水準、カテゴリ、属性、レベルとかいろんな言い方がありますが、基本的にはどれも同じです(ややこしいですが)。 場合によっては多重比較を行う必要があるかもしれません。分散分析で全体に差が認められることを確認してから多重比較をおこなうのか、それとも最初から多重比較をおこなうのか、どちらがよいかは(投稿する論文であれば)投稿先の先行研究に従うべきでしょう。 > 3ヵ月後に再度同じアンケートを実施し、推移を見たい 質問紙などによるアンケートを行う場合、同一の被験者であることを確認するのは困難なので、こういうのはあまりおススメできませんね。もしこういうことをする場合は、回答者を特定できるようにインターネットなんかで必要なユーザIDみたいなものをあらかじめ割り当てておくことも考えたらよいかも(それでもやっぱり難しい)。 1回目の調査と2回目の調査をあたかも独立二標本として扱う場合が多いかなぁ。。。 理論的には経時測定データを扱う方法としては、1回目と2回目の観測値の差をとって分析することができます。

yowy
質問者

お礼

なるほどです。理解できました。どうもありがとうございます。 最後にもう一つだけお聞きしたいのですが、 1要因分散分析の方法ですが、 それは、各カテゴリー内で行えばよろしいのですか? つまり、 1カテゴリー 4項目 2カテゴリー 4項目 3カテゴリー 5項目 4カテゴリー 3項目 5カテゴリー 5項目 のようになっている場合、まず1カテゴリーの中で分散分析を行い、 次に2,3,4,・・・という形をとるものでしょうか? それとも、いっきにやる方法があるのでしょうか? 本当に初心者ですみません。 よろしくお願い致します

  • backs
  • ベストアンサー率50% (410/818)
回答No.1

> 5つの因子に対して、因子間に差があるかを一元分散分析を用いて分析したい 因子が5つあるのであれば、それは5要因の分散分析でしょう(因子と要因は同じ意味)。そして5要因の分散分析をしようとするのはちょっと無茶がある。 > 単に5つの水準のものをANOVAかけるのはやった事があるのですが、このようなケースが初めてでして 5つの水準のものを・・・ というのは、1要因の分散分析であって、その要因の水準が5水準であるものということなのでしょうね。また、このようなケースというのは具体的にどのようなケースなのですか? 因子には必ず水準が存在します。因子がいくつなのか、それぞれの因子の水準はいくつなのか、この点をはっきりとさせると良いと思いますよ。 もっとも文脈から察するに、質問者さんのやりたいことは結局5つの平均値を比較したいということなのでしょうから、典型的にいえば「5群の平均値の差の検定」になるわけですから、1要因(5水準)の分散分析を行うことになるでしょう。

yowy
質問者

補足

ご回答どうもありがとうございます。 私の説明不足でしたので、再度もう少し詳しく説明させてください そして、「要因」「水準」の言葉使いが曖昧でした。すみません 被験者55名に対し、「動機」についての26項目の1ー5スケールの評価のアンケートを実施しました。 アンケートは、5つ(各4~6項目の質問)のカテゴリーから構成されています。 ですので、分析時に、 5つのカテゴリーに分けて分析しようと考えているのですが、まず初めに、5つのカテゴリーで、どこかに差があるのか(どのカテゴリーが最も弱いか等)を調べたいのです。 この場合にとる方法としてはどういうものがあるのでしょうか? (ついでですが、3ヵ月後に再度同じアンケートを実施し、推移を見たいのですが、その時はどういう手法があるかもアドバイスいただければ幸いです) どうぞよろしくお願いいたします

関連するQ&A

  • ANOVA4の分散分析表の見方

    初めまして!ご覧頂きありがとうございます。 今回、2要因2水準被験者間内混合計画の実験を行い、ANOVA4で分散分析を行ったところ、結果の分散分析表中にerror[S(A)] 、error[BS(A)] という項目がありました。 errorなので誤差かと思ったのですが、S(A)、BS(A)の意味がよくわかりません。 Aは恐らく要因A、Bは要因Bだと思うのですが・・・。 ご存知の方、よろしくお願い致します。

  • 因子の構成項目を分散分析・多重比較するのは,いけないことでしょうか?

    こんにちは。なにとぞ,よろしくお願い致します。  質問ですが,(1)20項目4因子からなる尺度で,被験者の属性により,尺度総得点および因子得点ごとに分散分析・多重比較をおこないました。(2)そのなかで,特にある因子が興味深く,その5つの構成項目それぞれを,被験者の属性により分散分析・多重比較をおこないました。この一連の手順は,たとえば,多重性とかの問題があるのでしょうか?(2)の手順に問題があるなら,(1)も同じ手順ですが・・・雑誌の中で,(1)は使われているように思います。的外れの質問課も知れませんが,よろしくお願い致します。

  • アンケート分析

     たとえば,「職場の清掃状況」について,「4,3,2,1」(よくできている・できている・できていない・まったくできていない)の4段階評価で職員全員にアンケートをとったと仮定します。※清掃以外にも,4段階評価でアンケート項目が30ほどあります。  前年の清掃状況と比較をしたい(前年も同様のアンケートをとっている)のですが,どのような方法がのぞましいのでしょうか。  ※平均以外の方法があれば教えていただけないでしょうか。  ※集計・分析をしないといけないものがでてきて,困っているのですが,統計学を勉強したわけでもないので,ネットで少々検索をした程度の浅はかな知識しかありません。

  • 一元配置分散分析でよろしいのでしょうか?

    よろしくお願いいたします。 A町から抽出した被験者の年齢 ; 33,43,43,21,76,43 ・・・。 B町から抽出した被験者の年齢 ; 23,34,55,43,47,98,86,53・・・。 C町から抽出した被験者の年齢 : 45,42,57,35,65,48,37,27・・。 D町から抽出した被験者の年齢 ; ・・・。 E町から抽出した被験者の年齢 ;  ・・・・。 各群において平均年齢に差が無いことを示すのは、 一元配置分散分析でよろしいのでしょうか。ネットで一元配置分散 分析の使用例を調べてみたのですが、平均年齢に用いている ケースがなかったので質問させていただきました。 どうぞ、よろしくお願いいたします。

  • エクセルでANOVA

    3群比較の場合、ANOVAを使用することは理解できます。 エクセルの分散分析(一元配置)で、p<0.05となった後に各群間でのp値が知りたいとします。そこで、AB、BC、AC群の間で更にtTESTを行うというのは間違ってるんでしょうか? ちゃんとした統計ソフトはANOVAのみで、各群間のp値も算出されるのですか? 宜しく御願いします。

  • 2要因分散分析(RコマンダーとAnova4)

    標本数の異なる2要因の分散分析を、RコマンダーとAnova4の両方で行ったのですが、何故か結果が違ってしまいます。 全く同じデータを用いているはずなのに、何が問題なのでしょうか。 ちなみに要因(1)は被験者間要因、要因(2)は課題の条件による被験者内要因です。 ネットでしつこく検索してみたのですが、結局分からなかったので、質問させて下さい。 また、欠けている情報等があればご指摘下さい。 何卒ご協力お願い申し上げます。

  • アンケートの分析をしているのですが、

    アンケートの分析をしているのですが、 平均値により傾向を出す意外にどんな方法があるか教えて下さい。 重回帰分析・因子分析などの言葉がひっかかりましたが、 この方法ならば、どのように使うか例出していただけると光栄です。 ちなみにアンケートの内容は 成績と年齢・出身などの属性情報を取っています。 宜しく御願いします。

  • 分散分析について

    分散分析についての質問なのですが 被験者間要因のみに注目をし分析する場合 同じ被験者が、同じ実験を繰り返し得られた結果のデータは 各被験者ごとに結果の平均をとってから、分散分析をしても問題はないのでしょうか? 回答よろしくお願いします。

  • 因子分析とクラスタ分析とセグメント判別用の汎用設問化

    30項目、10段階評価(非常にそう思う~どちらでもない~まったくそう思わない)のアンケート設問をもとに、因子分析(回答者に各因子スコア付与)とクラスター分析を用いて回答者をセグメンテーションした結果があります。現在、セグメントは1,000名の回答結果に対して4セグメント生まれました。 そこで有識者の皆様に質問があります。 次回、また同じアンケート(30項目、10段階評価)を別の回答者に対して行った際、同じロジックになよってセグメントされるようにしたいのですが(アルゴリズムを公式化・設問を汎用化運用したいのですが)、その手順というのは、 (1)1,000名の元の回答者とセグメント(4分類)を紐付け (2)1,000名の元の「30項目10段階評価」の結果を説明変数とし、判別されたセグメント(4分類)を目的変数とした(非線形?)回帰分析式を求める (3)新たな(別の)回答者の「30項目10段階評価」の回答を、(2)で作成した回帰分析式に代入 (4)セグメント判別 という流れで当たっていますか? 何か、参考になるURLでもかまいませんので、ご教授いただけますでしょうか。 どうぞ、よろしくお願いいたします。

  • データの分析方法

     先日、41項目4件法(全く思わない、少し思う、まあまあ思う、強く思う)でアンケートを実施しました。41項目は第I因子6項目、第II因子9項目、第III因子16項目、第IV因子6項目、第V因子4項目に分けて分析をしようとしました。  各因子の平均を求めようとしたところ、第I~V因子まで各々違う数の項目なので、平均を出しても妥当性がないのではないかという疑問が浮かびました。検索をかけてみても、専門用語が多すぎて答えにたどり着くまでにかなり時間がかかりそうです。  そこで、このデータの平均をどのように分析したら、妥当性のあるデータを取り出せるのかを教えていただきたいと思いました。私は統計学にはまったくの素人ですが、どうかよろしくお願いいたします。