• 締切済み

統計いついての基本的な質問です

統計についての質問です。 ある患者さんを対象にした心理実験の論文で、数字列の復唱が何ケタまでできるか二人の被験者(AさんとBさん)に調べたものがありました。 2桁、3桁、4桁、5桁の数字をそれぞれ10回ずつ復唱させた結果(計40回)、Aさんは10/10, 8/10, 2/10, 0/10という成績でした。Bさんは10/10, 9/10, 5/10, 3/10という成績でした。 論文では、二人の成績には有意な差がある(χ2=6.17, p<.02)と結論しているのですが、この検査結果をどのようにχ二乗検定すれば同様の結果になるのでしょうか?よくわからず統計ソフトで数字を入れてみても違う結果になってしまうもので・・・ ただし5桁の検査結果は検定には含めなかったとも書いてあるのですが。。 素人質問で大変申し訳ないのですが、どなたかお教えいただければ幸いです。実は同じようなデータを解析しようとしていて困っています..

みんなの回答

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.4

No2です。 >つまり、一人を対象 特定の人を対象にする場合は、検定をする必要はありません。誰がやっても、同じ結果になるからです。ただ、測定日が違うと異なる結果がでる、というのであれば、たまたまその日に有意差が見つかったかも、というので 検定の要がありますが。  例えば、午前中で治療前は10点、午後の治療後は30点の一人なら、これは誰が判定しても効果有りです、しかし別の日にやると、治療前は20点、治療後は25点なら、日によって結果が違うので、偶然かもしれない、ということで、偶然の可能性を否定するので、有意差検定をする必要があります。 >2桁、3桁、4桁、5桁の数字を これでやると多重比較という検定になります。すると学会などでの質問は、「どのレベルで有意差があったのですか」というのが定番です。すると、2桁、3桁、・・・、と検定をする羽目になります(この質問は、何度か耳にしています)。  多重比較は、全体で有意差、という結論しか出せませんので、私はやりません。  さらに、検定では、特定の人、というのは対象にしません。  A群、B群について、無作為に抽出して、データを得るというのが原則です。たとえば、購買力を調べるときに、A群は10代だけを選び、B群は20代、というのは検定するまでもありません。ですから、検定の対象が特定の人、という作為が入ると、統計処理をするのは不適切なのですが。

shiga90
質問者

お礼

わかりやすい説明、ありがとうございます。 特定の人を対象に検定を行うのは不適切なのですね。 基本的なことがわかっていませんでした。 しかし、今回のような記憶検査では、施行のたびに成績は違いますし、条件の変更による成績の変化が偶然によるものではない、ということを示すために検定が必要なのかと思っておりました。 また、単純に2桁の成績と4桁の成績を比較することはできないので、多重比較も不適切なのかなと、何となく考えていました。難しい… 何度も丁寧にご説明いただき、誠にありがとうございました。 とても勉強になりました。

回答No.3

χ二乗検定は表の項目がそれぞれ独立である、という場合によく用いられていますので、こういうデータに用いるには確かに違和感があります。 ちなみに、私の計算では以下のような値になりましたが、結果は同じでしょうか? 2桁~5桁まで:3.377 2桁~4桁まで:0.989 3桁~5桁まで:2.712

shiga90
質問者

補足

回答ありがとうございます。 私の計算でも同様の結果になりました。(意味もわからず統計ソフトで処理しただけですが・・・) 論文の値とは異なり、有意差も出ないためおかしいと思ったのですが、やはりこのようなデータにカイ二乗検定は違和感があるものなのですね。 あまり統計についての記述がない文献だったのですが、私の勘違いもあるかもしれないので、もう一度読み直してみます。 ありがとうございました。

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.2

 私も初心者ですが、この方法は統計処理以前の問題があります。 すなわち、2桁はAさんが優れ、3桁はBさんが優れていた、の場合の判断は、どうされるのでしょうか。 >5桁の検査結果は検定には含めなかった なぜ含めないのか、理由が書いてありますか。それに納得できますか。実験から自己の都合で省く恣意的なデータ処理は、やってはならないことです。  極端ですが、1錠では効果があったが、2錠では死亡する人がいた時に、2錠のデータを隠すのは、犯罪ものです。 >二人の成績には有意な差がある(χ2=6.17, p<.02)と結論 おそらく間違っています。Aさんは100、80、20%、Bさんは100、90、50%の正解率では、差がありそうなのは4桁の20%と50%だけですから、計算したわけではないので、有意差は無いと思います。  3群の比較はやる能力がありませんが、2群はしょっちゅうしています。4桁だけの正解率の20%と50%をカイ2乗検定すると、χ2=0.879しかなく、有意差はありません。著者が「ある」と言っても、「もっとも差がありそうな3桁では無い」と反論しますが。 >実は同じようなデータを解析しようとしていて困っています.. 困るのは当然です。 1) 恣意的に5桁を外した 2) 検定の結果が怪しい 3) AさんとBさんの二人だけなら、検定しなくても必ず差がある  私なら、もっと簡単にしますが、学生か院生の印象があるので、横からの口出しは差し控えます。  ただ、AさんとBさんの二人だけでは、話になりません。たとえば、Aさんは東大卒、Bさんは中卒では、結論は見えています。中卒の人が優れているなら、論文にできます。  一人でやっている、なら、その旨書いて下さい。

shiga90
質問者

補足

詳しいご回答ありがとうございます。 実は説明を省略するために、実際の研究デザインをシンプルに変えて質問してしまいました。すみません。(原型がない程ゆがめてしまいました) この研究はある、ある種の記憶障害を持つ1症例を対象にしたもので、実は数唱ではなく、単語の即時再生(2単語、3単語、4単語、5単語)を行っています。検査バッテリーとして2つの異なる単語条件(片方は似た音韻の単語、片方は全く音韻の異なる単語)を提示した際の成績の違いを検討しています。 「Aさん」と呼んだのは、似た音韻の単語条件、「Bさん」は異なる音韻の単語条件です。つまり、一人を対象としています。(申し訳ありません) また、よく論文を読んでみると、5桁目をはずしたのはfloor effectのためだというような記載がありました。 (読み落としているのか)統計手法についての記載が殆どない英語論文だったのですが、やはり検定の結果は怪しいのでしょうか。 非常に参考になりました。ありがとうございます。

  • backs
  • ベストアンサー率50% (410/818)
回答No.1

一番、確かなのはその論文を提示することですね。 せめて自由度があれば、どんな分割表にまとめられたのか想像もつきますが、そもそもこのデータセットにカイ自乗検定(恐らく比率の差の検定)を適用するのはあまりおススメできません・・・ もしやるなら、ロジスティック曲線を当てはめて、切片や係数(直線でいえば傾き)が有意に異なるか?ということを確かめるべきでしょう。実際、提示された比率データをプロットしてみると、ロジスティック曲線が上手く当てはまりそうな感じですよ(というか、このような比率データは大概ロジスティック曲線に当てはまるようになっています)。

shiga90
質問者

お礼

御回答ありがとうございました。 やはりカイ二乗検定を用いるのは良くないのですね。 ロジスティック曲線を当てはめて比較、今から勉強してやってみようと思います。(統計ソフトはPRISM 5.01なのですが、簡単にできるものなのでしょうか。。) どうもありがとうございました。

関連するQ&A

  • 統計について質問があります.

    統計について質問があります. よろしければ教えて下さい. 実験条件は以下の通りです. 2種類のトレーニング器具を用いた場合に,何も用いない場合と比べて効果があるかという実験設定です. 被験者は同一被験者で,ランダムに全てのトレーニング器具を実施し,測定しています. 1.何も器具を用いない場合 2.トレーニング器具Aを用いた場合 3.トレーニング器具Bを用いた場合 この3条件の効果の差を検定したいのですが,この場合は繰り返しのある1元配置の分散分析を用いればよいのでしょうか?t検定を3回繰り返すことは問題なのでしょうか? 例えば,t検定の場合,1と2に差はあるが,分散分析を用いた場合では有意差は無い場合があります. この場合に,1と2だけで論文を書いた場合はトレーニング効果はあるが,3種全てで論文を書いた場合は効果が無いという結果になると解釈するのはどうも腑に落ちません. よろしければ教えて下さい.よろしくお願いします.

  • 統計での質問です.

    統計での質問です. 3つの環境の違う母集団A・B・Cがあり,ある検査結果で陽性がAでは8人中5人,Bでは12人中2人,Cでは10人中4人という結果でした. 少人数ではあるのですが,この3つの環境によって検査結果に影響があるのか有意差をみたいとおもうのですが,どのような統計処理をすればよろしいのでしょうか? どなたかご教授下さい.

  • SPSSでの統計

    卒業論文のアンケート結果の統計で悩んでいます。図書館で本を借りたり、インターネットで色々と調べたのですがSPSS(11,5 j for windows)での検定方法がよくわかりません。ある3つの大学で「朝食を食べる・食べない」という質問に対して、最初にノンパラメトリック検定で独立したk個の検定「Kruskal-Wallis検定」を選択して、この質問項目で有意差が確認できました。次に「Bonferroni検定」を行いました。するとa大学とb大学の間に有意差が確認できました。しかし、有意差が確認できてもaとb大学でどちらが朝食を食べるのが多いということが言えるのでしょうか?すいませんが、どなたか教えてください。

  • 世論調査の統計処理

    世論調査の統計処理  テレビで見る世論調査の結果が”支持率~ポイント低下”などと報道されるので,この数字の変化は本当に有意差があるのかNHKに問い合わせたところ有意差の検定をしないで”上昇、低下、大きい、小さい”と放送しているのだと回答あり,そんな結果を勝手に解釈して討論番組で政治家に意見を求めたりしていたのかと驚いてしまいました.  学術論文では統計結果の評価を有意差検定しないと門前払いが当たり前です.パーソナルコンピューターでもすぐできるくらいのの手間なのですが.マスメディアではなぜ統計結果を有意差検定しないのでしょうか?

  • 統計学、検定の問題について質問です。

    問、4人の被験者にテストを2回実施して個人ごとに成績を比較した結果、次のようになった。 +-++ ここで『+』と『-』はそれぞれ成績が向上した結果と低下した結果を表す。 (1)2回目のテストの成績は、1回目の成績よりも平均的によくなったかどうかを確かめたい。どのような種類の分布が利用できるか。分布の名称を記せ。 (2)差がないという仮説の検定を片側で行った場合のp値を求めよ。 以上の2問です。統計学の教科書を読んだのですが、分からないのでよろしくお願いします。出来れば説明も添えてくれると助かります。

  • 統計学に関する質問です。

    例えば、以下の検定を”1人の”被験者に行うことに問題はあるでしょうか? 「ベースライン期(ただ観察するのみの10日間)と介入期(治療を行う10日間)を設け、1日1回、一定時間における反応数を計測します。すると、ベースライン期に10個の測定値、介入期にも10個の測定値を得ます。前者10個の測定値の集まりを1標本、後者10個の測定値の集まりを1標本とし、それら2標本の統計学的検定(t検定なり、ノンパラメトリック検定なり)を行い、反応数が有意に多いかをみる(反応数が多い方が好ましいとする)」 最近、本で読んだ、「測定値の独立性」がどうも気になり、「1人の被験者内の2群を検定にかけることはできないのかな?」と思ってしまったことが質問の背景にあります。

  • 統計学についてお願いします。

    統計について素人です。 A群(n=30)とB群(n=40)を比較して有意差があるか調べたいと思います。 検定の順序としては、A群とB群は対応のあるデータではないです。 その為、まずは正規性の検定を行うことになるのでしょうか。 次に正規性があれば、F検定で等分散か確認し、等分散であればステューデントのt検定、等分散でなければウェルチのt検定ということになるのでしょうか。 そして正規性が無ければノンパラメトリック検定となるのでしょうか。 ここまでは合ってますか? それでここからが本題なのですが、私はSPSSやエクセル統計などの統計ソフトを持っていません。 普通のエクセルのみで、このA群とB群を比較して有意差があるか調べる方法を教えていただけませんでしょうか? 手順等できるだけ詳しく教えていただけますと幸いです。 よろしくお願いいたします。 (最悪、エクセル統計であれば購入できそうですが…)

  • 統計における危険率

     統計のことについては全くの素人なのですが、ふと思ったので質問させていただきます。  論文などで p<0.05で有意差を認めたので、AはBであるという結論である。  というように書いてありますが、これは逆に考えると、世の中の5%の論文の結論は間違っているかもしれない、ということなのでしょうか?

  • 統計学 検定

    統計学の検定について質問があります。 お手数ですが、まずは下記の問題を読んで頂けますでしょうか。 ____________________________ ある地域で100人に対して血液型の調査を行ったところ、 以下の表に書かれているような調査値を得ることが出来た 日本人のABO式血液型の分布はA型40% B型20% AB型10% O型30% である 血液型 A型  B型  AB型  O型  計 調査値 35人 21人 12人 32人 100人 期待値 40  20  10  30  100 この地域の血液型分布は日本人の血液型分布と有意差があるか検定せよ ________________________________ この問題はχ2検定で検定し、この地域の血液型の分布は、 日本の血液型分布と異なるのか検定することが出来ると言うものですが、 例えばこの中でA型のみを対象に有意差があるか検定したい場合は、 どのように検定したら良いのでしょうか? 同様にχ2検定でA型のみ検定すれば良いのでしょうか? それとも他にベストな検定方法があるのでしょうか? エクセルで行えるような検定があれば教えて頂きたいです。 統計を最近勉強し始めたばかりで分からないことばかりで困っております。 よろしくお願いします。

  • 統計学のF検定、T検定、有意差について

    統計学のF検定、T検定、有意差について教えてください。 ●F検定…分散の有意差を求める検定。有意差がない=等分散 ●T検定…等分散なデータ同士の有意差を求める検定 F検定を行う→等分散であればT検定を行える 【例】 データA、B、CについてF検定を行う。 データA、B間に有意差なし。その他の間には有意差あり。 よってデータA、Bは等分散。 データA、Bの平均値についてT検定を行える。 という認識で合っているでしょうか? ご回答よろしくお願いします。