分散分析で水準の効果を母数と変量、どちらととらえるか?

このQ&Aのポイント
  • 分散分析において、水準の効果は母数や変量として取り扱われます。母数とは、人口統計学的なパラメーターであり、全集団の平均や分散を表します。
  • 一方、変量とは、サンプルデータにおける変数の値を表します。分散分析では、水準の効果を母数として扱うこともありますが、一般的には変量として扱われます。
  • モデル選択の際には、データの分布や目的に応じて適切な選択をする必要があります。また、分散分析においては、水準の効果が変量として扱われる場合でも、その解釈には注意が必要です。
回答を見る
  • ベストアンサー

分散分析で、水準の効果を母数と変量、どちらととらえるか?

分散分析で、水準の効果を母数と変量、どちらととらえるか? こんにちは。よろしくお願いします! まずこの質問の目的です。 「この分散分析は、こうゆうわけで変量モデルとして分析しよう。」というように、自身で、変量なのか母数なのか混合なのかを判断できるようになることが目的です。 そこで、ここからが質問になります。質問は3点あります。 1、そもそも「母数」「変量」という言葉はどのような意味でしょうか?教科書にのっているような説明をいくつか読んでみて、わかりませんでした。ですので、なるべくわかりやすく、できれば例を入れて説明していただけると幸いです。 2、どのモデルにするか判断をする際に、みなさんが気をつけていることは何でしょうか? 3、その他、なにか根本的に勘違いしているなど、なんでもかまいませんのでお気づきの点がありましたら、ご指摘おねがいします。 1点の質問についてのみの回答でも、回答の順序が質問の順序と違っていても、かまいません。よろしくお願いいたします!

質問者が選んだベストアンサー

  • ベストアンサー
  • backs
  • ベストアンサー率50% (410/818)
回答No.2

> 要因は「審査員の評価の甘さ、厳しさ」と「スケーターの実力」の2つ という要因がどういったものかよく分からないのですが(^_^;) もしある1人の審査員が複数人の演技を評価するのであれば(というか実際にそのようにするのですが)"審査員"というのは1つの変量効果でしょう。同時観測は物理学的に在り得ないので、1人目の評価、2人目の評価、、、と時間経過に伴っているでしょう? だかれこれも経時測定データですよ。 質問者さんが参照したであろう、とある本には「厳しい審査員と甘い審査員がいる」とありますけど、これは要因ではありませんね(著者の先生もそういう意図でいっているのではないでしょう)。厳しいか甘いかは平均値を見てそういっているだけです。というか評価の観点が違うので一概に平均値だけを見てその採点者が甘いかどうかなどナンセンス(苦笑) 例えばですが    藤越ほか「経時データ分析」オーム社 を読んでみたらどうでしょうか。例の本はたとえ話も説明もあまり上手でないような気がします(^_^;) > どのように固定効果/ランダム効果かを決めればよいでしょうか? 先ほど述べたように「対応あり」かどうかを見極めることです。スケートの例でも: S1はJ1, J2, J3, ...というそれぞれの"条件"の下で観測値が得られたと考えれば、これは経時測定データでしょう? 逆にJ1もS1, S2, ...というそれぞれの"条件"の下で観測値が得られたと考えるのです。そうすると、結局、SもJもどちらも変量効果だというわけです。 しかし、そもそもこのデータセットに対して分散分析を行うこと自体が実質的に何の意味もないことですから、やはり例として良くない。。。

onenootn
質問者

お礼

遅くなりまして申し訳ございません。 参照したであろう本、まさにその本だと思います。笑 時間のお話についてもっと知りたいので、明日近所の本屋さんで立ち読みしてきたいと思います! 丁寧なご説明ありがとうございました!

その他の回答 (1)

  • backs
  • ベストアンサー率50% (410/818)
回答No.1

例えば次のようなデータセット: Subjects = {投与前, 投与後1時間, 投与後3時間} Sub1 = {123, 110, 100} Sub2 = {98, 90, 100} Sub3 = {110, 120, 100} ・・・ があったとき、時間経過(水準: 投与前, 1時間後, 3時間後)と被験者という2つの要因がありますね? ここで時間経過は固定効果(母数効果)、被験者は変量効果(ランダム効果)です。要するに、いわゆる「対応ありのデータ」であるときに変量効果が現れるわけです。 数式による理解が難しい場合、とにかく経時測定データを扱う場合には"被験者"が必ず変量効果になるのだと覚えておけば(実質的に)ほとんど問題ないでしょう。 > どのモデルにするか判断をする際に 固定効果(母数効果)のみのモデル(分散分析モデル)であるか、それとも変量効果が組み込まれたモデル(線形混合効果モデル)であるかは"判断する"のではなく、"決まる"ものです。ただ、実際には前述したように時間経過に伴って繰り返し同一個体から観測値を得た場合に"個体(=被験者)"が変量効果になるので、線形混合効果モデルだと"判断"すればよいでしょう。

onenootn
質問者

お礼

ご回答ありがとうございます! 実践的でとてもわかりやすくて助かりました♪ 回答内容に関して質問があります。 時間経過があまり関係しないようなデータ、例えば、あるオリンピックのスケートの採点という以下のような場合、 特性値は、採点数、 要因は「審査員の評価の甘さ、厳しさ」と「スケーターの実力」の2つ どのように固定効果/ランダム効果かを決めればよいでしょうか? お時間ありましたら、ご回答よろしくお願いいたします。

関連するQ&A

  • 共分散分析(ANCOVA)で困っています

    共分散分析(ANCOVA)で分からない点があり困っています.  疫学研究系の国内誌に投稿したところ,査読者から,共分散分析のモデルについて再考すべしとの指摘がありました.  要因A(体操教室の参加者,不参加者)が従属変数Y(握力の強さ:連続変数)に及ぼす影響について,共変量X(年齢,性別,教育年数,喫煙)を投入した共分散分析のモデルにより検討しようとしています.  そこで質問です:  ・質問(1) 共変量Xは,従属変数Yとじっさいに有意な相関関係にあるものしかモデルに投入できないのでしょうか?    ・質問(2) 共変量Xのうち,要因Aと相関関係に有るもの,要因Aと相関関係に無いものの両方を混在させてモデルをつくることは妥当なのでしょうか?  ・質問(3) 査読者から,共分散分析を実施する上での前提を確認することとの指摘がありました.共分散分析を実施するうえで必ずチェックしなければいけない点について分かりやすく教えてください.  以上について,お教えいただければ幸いです.

  • 分散分析について

    統計初心者です。 分散分析についての質問です。 今実験データを分散分析にかけて主効果を見ようと試みています。 その中で要因が、「色1、色2、文字、環境」と 4要因あり4元配置で分析を行っています。 色1は、白、黒、灰で3水準、 色2は赤、青、黄、緑、白、黒、灰の7水準なのですが、 色1と色2が同じ色の組み合わせ (色1の白と、色2の白など) でのデータは存在していません。 つまり、色1には色2が6水準かかってくる。しかし、6水準は同じ種類ではない。といった状況です。 この状況で分散分析を行った場合、主効果として色1、色2は効いていると言えるのでしょうか? なんとなく腑に落ちません。よろしければどなたかよい方法を教えていただけると 大変助かります。 よろしくお願いいたします。

  • 多変量分散分析 Wilk's Λについて

    大学院の研究会で、論文講読の発表をするのですが、テーマの論文にWilk'sのΛについて、知識がないと意味が通らない下りがあります。 論文中には特に説明はありませんでした。私はこの論文で始めて目にしました。 多変量分散分析の結果を示した下りに表記してあります。 統計学ではメジャーなようですが、調べても一向にわかりません。 そこで、 1.定義と意味。 2.その数値の解釈(より大きいとき~~。小さいとき~~など)。 3.これを使用する意味と利点。 以上を教えていただきたく思います。よろしくお願いします。

  • 複数の変量についての検討

    同じ意味を持つ目的変量に対して、異なる観点の説明変量で考察したモデルがあります。その2つのモデルの関係の比較を行いたいのですが、どのような比較方法がありますか? 自分としては、2つの式の異なる説明変量を主成分分析を用いて主成分を導き出し、それらを比較することでお互いの関係を考えられると思ったのですがこの方法は可能でしょうか? 他に方法があるのなら助言してもらいたいです。 経験者がいらしたらうれしいです。よろしくお願いします。

  • 分析方法

    分析についてやり方が分からず困っています。 初歩的な質問で申し訳ありませんが、質問させてください。 私は、認知(2水準)×コーピング(2水準)を独立変数、抑うつ得点を従属変数として2要因分散分析を行おうと思っています。 しかし、分析のマニュアル本を見ても、2要因の分散分析は被験者間計画か混合計画しか載っていません。 そこで、2要因の分散分析(対応ある×対応ある)の分析の仕方について教えていただけると助かります。 よろしくお願いいたします。

  • 分散分析について

    分散分析についての質問なのですが 被験者間要因のみに注目をし分析する場合 同じ被験者が、同じ実験を繰り返し得られた結果のデータは 各被験者ごとに結果の平均をとってから、分散分析をしても問題はないのでしょうか? 回答よろしくお願いします。

  • 回帰分析と分散分析

    多変量解析の本を読んでおります。 記述に違和感(誤植)があったので、質問させていただきました。 疑問点は、回帰分析と分散分析のページ(p.111)です。以下原文より引用。  有意Fに書かれた値が0.05より小さくなる場合には、5%の確率でしか起こらないようなことが起こったとして、帰無仮説を否定します。この場合、「帰無仮説」は、「回帰分析があてはまらない」でしたから、これを否定するということは「回帰分析があてはまる」となります(厳密には「回帰分析が当てはまらないことはない」)。  有意Fに書かれた値が0.05より小さくなる場合には、「回帰分析が当てはまらない」という帰無仮説は採択されます。  このような検定の考え方で、有意Fの欄の値をαとするとき、 α>0.05 回帰直線は却下 α<0.05 回帰直線は採用  質問は2段落目の「有意Fに書かれた値が0.05より小さくなる場合には、「回帰分析が当てはまらない」という帰無仮説は採択されます。」の「帰無仮説は採択されます」の部分です。これは、「帰無仮説は棄却されます」ではないでしょうか。つまり、有意Fが0.05より小さい場合は、帰無仮説を棄却して、対立仮説を採択するという判断をするのではないでしょうか。私の考え方は間違っていますか。 出版社の訂正表にはこの部分に関しての訂正はありませんでした。 よろしくお願いします。 引用 意味がわかる多変量解析 石井俊全 ベレ出版 2014

  • 分散分析のNの数

    統計全体の知識がありませんが、なんとか本をみながら統計を進めている状態です。 どなたか教えて頂けないでしょうか? まず、2要因の分散分析をしようと思って、SPSSで本をよみながらすると、 一変量の分散分析にたどり着きました。(一変量??が気になるのですが・・) 背景としては、対応なしで等分散していない値を扱っています。 従属変数をストレス値としています。 2要因の水準(?)は、2×2です。 私のためにも、例で書くと、男・女×小学生・中学生とします。 結果として、交互作用(?)のところで優位確率が0.02と出ています。 単独、男女と、年齢だけでは有意差がでていません。 これは、どのように解釈すればいいのでしょうか? 結果として論文に書けるのでしょうか? 後、気になることとして、例えば女の小学生が2名しかおりません。 ※全体数は40です。 ご助言よろしくお願いいたします。

  • 2要因の分散分析での対応のあるデータ

    2要因の分散分析を行いたいのですが、対応の型について迷っています。 被験者には2回、A、Bという課題をしてもらったのですが、カウンターバランスをとるために、A→Bとやってもらった群と、B→Aとやってもらった群があります。そのため、SPSSの本を見てみると対応がある・ある、ない・ない、混合のどれでも違う型になってしまいます。 研究の主題はAとBの比較ですが、どちらが先かという順序でも差がありそうなので、一応は2要因の分散分析をやりたいです。分りにくい説明で申し訳ありませんが、何か助言をいただけたらありがたいです。

  • 共分散構造分析について

    非常に漠然とした質問で申し訳ありません。 統計学初心者で、各分析手法の勉強をしています。 そこで、共分散構造分析の概念がいまひとつわかりません。 と同時に、共分散構造分析の構造方程式モデルにてPATH係数を求める というのはどういうことなのでしょうか。 よくわからない者がよくわからない質問をして申し訳ありませんが どなたか教えて下さい。 よろしくお願いします。