• 締切済み

統計学なんですけど

統計学なんですけど、最近勉強をはじめた文系の人間です。 次のような記述研究をしたいのですが、データの分析方法がよく分かりません。 英語の先生が生徒の間違いに対してどのような指導をするか、と言うテーマで、ベテランの先生と新米先生の授業を比較するつもりです。あらかじめカテゴリーを6つ用意して、二人の先生の授業を観察しながら、そのカテゴリーにチェックを入れていきます。そしてそれぞれのカテゴリーごとの出現回数を求めます。 そこで、その結果を二人の先生で比較して、有意な差があるかどうかを見たいのですが、カイ二乗検定で良いのでしょうか?名義尺度なのでノンパラメトリック検定を使う、と本で読んだので。 ぜひ、教えていただきたいので、よろしくお願いします。

みんなの回答

noname#3495
noname#3495
回答No.2

私も少し…。テーマに関してはstomachmanさんが詳細に述べていますので、 使い方の面を。 χ2乗検定が使えるどうかは「出現回数」の捉え方によります。 1回と2回の差が2回と3回の差と等しいと考えられるならば、 尺度水準は間隔水準以上になりますのでχ2乗検定が使えます。 只そのとき判るのは、その2人の先生に対してのカテゴリーの差が 有意かどうかが判るだけなので、テーマにどの様に利用できるかは ちょっと思い付きません。 只、モンゴロイドとコーカソイドはパラメータを増やしすぎると 分類できなくなるそうです。盲滅法に変数を増やすのではなく、 自分のテーマに何が必要かを考えて適切な項目を吟味してみるのが よいと私も思います。 偉そうなことを書きました。参考になればと思います。

kmoioijpo
質問者

お礼

とりあえずカイ二乗検定がつかえるとわかっただけでも、うれしかったです。たしかにカテゴリーのどこに有意差があるかが分からないのは問題だと思いますが、現在の僕の乏しい知識ではそれしか思いつきましんでした。 アドバイスありがとうございます。

  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.1

僭越ながら、統計処理技法の問題以前に、何を測ろうとしているのか、その目的に於いて実験のデザインが適切か、そのへん再考なさってみるのも宜しいかと思います。  以下では「生徒の間違いに対してどのような指導をするか」ということが問いである、という前提としますが、  これ自体も再検討の余地があるかも。生徒の間違いに対して行う指導を「どのような指導」かで分類し、分類項目の発生頻度と「ベテランと新米」の違いとの相関を見ようということですから、「ベテランと新米では、生徒の間違いに対して、指導の行動が違うか」と言う意味だと解釈できます。しかし…  ベテランと新米の二人と仰いますが、この二人の違いはそれだけではない。だから例えば授業回数と行動との相関を、多数の教師の観察結果から証明しなくちゃ「ベテランと新米」という区分に意味があるとは言えません。言い換えれば観察対象がたった二人じゃ、ベテランも新米もなく、この場合には教師Aと教師Bの行動の違いを調べているに過ぎないのであって、その違いが何に(経験年数?準備に掛けた時間?語学力?性別?国籍?出身地?宗教?支持政党?声の大きさ?背の高さ?血糖値?体力?)由来するかについては何も言えない。言っちゃいけません。二人のデータから「だから新米にはこういう傾向があり…」なんて結論するのは、「だから自民党員は…」なんて結論するのと同様の、「統計の嘘」の典型です。  一歩間違えば似非科学に陥りかねない。そういう危ないテーマにニアミスしていること、認識していらっしゃれば良いのですが。  さて、次は実験デザインの話です。  生徒が間違える頻度、これがそもそも先生によってカナリ違うと思われます。そうすると、事象の母集団がそもそも共通でない可能性が大きい。同じ事態に二人の教師がどう対処するか、を比較しているのではない。  ここを無視して行動のカテゴリーにばかり注目すると、解釈不能になる。或いは因果関係を転倒して捉えてしまうという誤りに容易に陥りそうです。  生徒の間違いが発生する頻度を決める要因をざっと考えてみても、 (1)生徒がどの位分かってないか、 (2)生徒にどの位発表機会があるか、 (3)分かってない生徒と分かってる生徒のどちらに発表機会があるか。  さらにこの間違いに対して指導を行う頻度を決める要因としては、 (4)教師がどの位の頻度で間違いに気付くか、 (5)その間違いに対して、教師がどの位の頻度で反応するか、 などなどがすぐ思いつきます。  例えば(2)については、間違えさせる事を通して教える教授法を採るか、よく解説してから演習させる教授法かによって全然違うでしょう。(この意味で「英語」は適切な選択かどうか微妙です。)また(3)については、全体を底上げしようと考えている教師なのか、できる子中心で気持ちよく授業を進めたいのかでは、きっと全然違ってくるでしょう。つまり、同じ学級を対象にして((1)は共通)観察を行っても、発生する間違いの中身と頻度が教師によって全く違うということは容易に予想されます。  純粋に「生徒の間違いに対してどのような指導をするか」という観点に立つためには、((5)は指導の一種と考えることにしても)少なくとも(1)~(4)までの条件はコントロールしておかなくちゃいけない。この場合、(2)以降の要因はすべて教師の教授法の影響下にあるわけですから、単に多数の教師のデータを取っても均質化できないでしょう。まして僅か二人の教師を観察するのであれば ・授業中の発表回数を同じにし、しかも ・生徒に均等に発表機会を与える(乱数表をきちんと使って発表者を選ぶのが理想的ですが)、 ・教師が生徒の間違いに気付いたら(反応するしないにかかわらず)カウントして貰う、 というような制約を課すのでないと、複雑な現象のうちのどうでもいい一部分を観察していることになりかねません。  さらにカテゴリーの問題があります。6つの項目についてYes, Noを記録して、6次元の2値データを採るということだと思います。でもこの実験では観察と判定はヒトが行うんですから、カテゴリーの定義が適切かどうかが重要です。  カテゴリーをどう定めるか。つまり、観察者の主観が入りにくい具体的で明確な観察ポイントを使って定義できるか、これは何度か予備実験を行って慎重に検討すべき問題です。何人もの観察者が観察して、観察者によって分類がばらつく事象を詳しく調べる必要があるでしょう。  次に、二つのカテゴリーの間に相関が認められたとして、行動の特徴としての相関なのか、カテゴリーの設定に内在する相関なのかは、僅かな教師を観察したのでは区別できません。つまり、カテゴリー同士がどのぐらいカブッているか、ということが、結果を解釈をする段階では重要です。例えば 「ニヤリと笑って間違いを指摘したか」Yes/No 「ニンマリ笑って間違いを指摘したか」Yes/No なんてカテゴリーがあったとすると、試行を何度も繰り返せば両者は相関が大きくなるでしょ?比較的独立な特徴でなくては情報が少ない。  そうしますと、一回の指導の仕方を6つもの次元で綺麗に分類できるなんて、ホンマカイナ、と思えます。  最後に統計処理技術の話。最も簡単なのは、カテゴリー間の関係は考えずに、それぞれのカテゴリーごとにYes/Noの頻度を比べることです。H:「教師AとBとは、あるカテゴリーXについてYesの行動を取る確率は同じである」という帰無仮説を立てて、検定します。Hが棄却できれば「Hの否定」が言え、棄却できなければ何も言えない。それだけです。(統計の結論としてはそこで沈黙しなくてはならない。その先に続けて「だから…」と解釈を積み重ねることは、この実験では担保されない論述・考察に過ぎません。)  カテゴリー間の相互相関を調べると、カテゴリー同士の関係が見えてきます。二つのカテゴリーP,Qが同時にYesになる確率を調べ、「PとQは独立である」という帰無仮説を検定する訳ですね。P,Qは一緒にYesになる確率が高いことが言えたとしても、(既に述べたように)これがカテゴリーの類似性に起因するのか、教師の行動の特徴なのかは、高々二人を観察した位じゃまだ何も言えないでしょう。  なお、もし沢山の教師を観察して多変量解析を行えば、このあたりの関係を明確にできるかもしれません。また、教師の授業経験時間数も一緒に調べたとすると、行動から経験時間数を推定する実験式を構成する問題は数量化理論I類に該当します。でもこの実験式を、経験時間数から行動の発生頻度を予想するのに使ったら間違い。これをやりたかったら、行動の発生頻度を目的変数とする数量化理論III類の解析を行います。

kmoioijpo
質問者

お礼

なるほど。脱帽してしまいます。 たしかにこの実験と言うか記述研究は非常に詰めが甘いものでした。この結論に関して一般化するつもりはありませんが、それでもかなり統計的に危ういもであるとわかりました。実験そのものを再考したいとおもいます 実験で使用するカテゴリーは先行研究に基づいたものを用いる予定でしたが、ご指摘をいただいたようにさらに綿密な予備調査を行う事にします。観察自体は複数の観察者を置ければよいのですが、予算やスタッフの関係上それが出来ません。その分さらに綿密な予備調査を行う事にします。 ありがとうございました。

関連するQ&A

  • 統計学、何検定を使えばいいですか?

    統計学初心者です。 正常ラットと飢餓ラットの臓器の重量や長さを統計処理し、有意差があることを示したいのですが、何検定を使えばいいのか分かりません。 カイ2乗検定かとも思いましたが、違うような気がします。 何検定を使えばいいですか?教えてください、お願いします。

  • 統計の初歩の初歩です(文系)

    すみません、教えていただけますか?社会学、心理学系のアンケート調査の結果を分析しています。統計の初歩のことを伺いたいのですが… 2つの変数を使って、まずクロス集計を出した時にカイ二乗検定をみると有意ではありませんでした。 でも次に相関分析をして、 相関係数を出してみる有意になるんですが、良いのでしょうか?? つまり、カイ二乗検定が有意でなくても、相関分析で相関係数が有意であれば、 関連がありそうだと考えてよいですか?? よろしくお願いいたします。

  • ノンパラメトリック検定

    心理学でカイ2乗のノンパラメトリック検定分析をしたのですが、結果の書き方が分かりません。 どれも有意差が認められるものでしたが、普通なら「AよりBのほうがCの割合が有意に大きいことが示された」ですがこの場合はどう書けばいいのでしょうか? 観測度数と期待度数と残差や検定統計量は出ています。

  • 統計学についてお願いします。

    統計について素人です。 A群(n=30)とB群(n=40)を比較して有意差があるか調べたいと思います。 検定の順序としては、A群とB群は対応のあるデータではないです。 その為、まずは正規性の検定を行うことになるのでしょうか。 次に正規性があれば、F検定で等分散か確認し、等分散であればステューデントのt検定、等分散でなければウェルチのt検定ということになるのでしょうか。 そして正規性が無ければノンパラメトリック検定となるのでしょうか。 ここまでは合ってますか? それでここからが本題なのですが、私はSPSSやエクセル統計などの統計ソフトを持っていません。 普通のエクセルのみで、このA群とB群を比較して有意差があるか調べる方法を教えていただけませんでしょうか? 手順等できるだけ詳しく教えていただけますと幸いです。 よろしくお願いいたします。 (最悪、エクセル統計であれば購入できそうですが…)

  • 統計学の適合度検定についての質問です

    統計学初心者です。 観測度数が理論度数の誤差の範囲内かどうかを調べたいのですがどうしたらいいでしょうか? 適当な数値ですが、画像データのAの実測度数が理論度数の誤差の範囲内かどうかを検定するための具体的な計算方法を教えてください。 有意水準は5%、カイ二乗分布 カイ二乗検定で”全体”の検定は x^2=(60-50)^2/50+(20-30)^2/30+・・・+(2-1)^2/1 =6.8444・・・ となり、自由度4のカイ二乗分布、有意水準5%が9.49なので x^2<9.49 有意差はない(誤差の範囲内) というのでまずは合ってますでしょうか? 次にAのみの観測度数と理論度数を検定(誤差の範囲内かどうかを知りたい)したいのですが、 x^2=(60-50)^2/50+(40-50)^2/50 =4 自由度2-1=1のカイ二乗分布、有意水準5%が3.84なので x^2>3.84 有意差はあり(誤差の範囲外) AとB~Eの2個に分けて計算してみましたが、そもそもこの方法が合っているのかどうか分かりません。 アドバイスよろしくお願いします。

  • カイ二乗検定で処理したいのですがデータのとり方がわからず困っています。

    左利き手と右利き手の被験者における、左右の耳の聴力低下度を調べています。 目的は、左と右の利き手の被験者で利き手の違いに意味があるかどうかどうかを知りたいので、統計はカイ二乗検定を用いています。 聴力低下度の指標は、高音域、低音域の2項目あり、さらに左右の耳があるので、計4項目からなります。データは順位尺度です。 データ入力は、被験者が重複するいわゆる複数回答形式です。 統計処理するデータの扱い方をお教えいただけないでしょうか。 統計に用いるデータは生データを処理するのでしょうか? 順位尺度の生データ(例数)の統計結果は、 自由度   3 カイ二乗値 23.33 危険率   p=0.0001 生データのカイ二乗検定を行うと、検定は棄却され両グループ間で有意差が見られました。 表にして示す場合、生データはn(総例数)が異なるため両グループ間の比較にならないので、構成比率(例数/n*100)で示します。 構成比率のデータで検定すると 自由度   3 カイ二乗値 6.15 危険率   p=0.150 構成比率のデータを用いカイ二乗検定を行うと、検定は採択され両グループ間は差がありません。 統計処理は、生データ比較でしょうか? それとも表にあらわすような構成比率の比較でしょうか? どちらが適切なのでしょうか? どうぞ、よろしくお願い申し上げます。

  • SPSSのカイ二乗検定について

    初歩的な質問になりますがもうしわけありません。 卒論で分析をしているのですが知識がありません。 ある尺度によって分けた高群と低群の間に、質問に対する回答(質問が4つで回答が5つの選択肢からひとつを選ぶもの、のそれぞれについて)に有意な差があるかどうかを調べるために、SPSSを使ってカイ二乗検定を行いました。 結果で有意な差があるかどうかはどこを見ればよいのでしょうか。 統計の授業など取っておらず、大変初歩的な質問かと思うのですが申し訳ありません。 超文系人間で数字が苦手なので優しく教えていただけるとありがたいです。

  • カイ二乗検定の多重比較について

    SPSSで4×4の名義尺度のカイ二乗検定を行ったところ、Pearsonのカイ二乗検定で5%水準で有意差が出たと出力されました。 そこで質問です。 1.この結果は4×4のデータのどこかの組み合わせに差があるということを表している、と解釈していいのでしょうか? 2.差があるとすれば、どれとどれのデータの間の差なのか知りたいので、分散分析のように多重比較をする方法があるのでしょうか? ご指導お願いします。

  • 統計(多重比較)で困っています.

    統計初心者です。宜しくお願いします。 ある疾患の発症頻度を3種類の年齢層(A群、B群、C群)に分け、比較したいと思っています。 この3群間の群間比較を http://www.stattools.net/Multiprop_Pgm.php のサイトを利用してMarascuilo法を用いて行ないましたが、カイ二乗検定では3群間に有意差がでるものの、各群間(AB間、BC間、CA間)では有意差がでません。 これはどのようなことを意味しているのでしょうか? 詳しい方、よろしくお願いします。

  • エクセルでのカイ二乗検定の仕方について

    いつもご利用させて頂いております。 大変、親切に教えて頂けますので、ありがたいです。 さて、エクセルで、統計のカイ二乗検定のやり方を教えてください。 行いたいことは、 はじめる前と、終わりでの変化です。 カイ二乗検定で、「有意さがある」とうことは、どういうことでしょうか?? よろしくお願い致します。6才の子どもでも分かるようにお願い致します。 よろしくお願いします。