クロス表、χ二乗検定の入力する数値の桁数について

このQ&Aのポイント
  • クロス表、χ二乗検定における数値の桁数について疑問があります。
  • 菌の殺菌剤の効果の違いを調べるために、クロス表、χ二乗検定を使用しています。
  • 細菌数の桁数を変換して検定を行うことで、有効な結果が得られる場合があるのでしょうか?
回答を見る
  • ベストアンサー

クロス表、χ二乗検定の入力する数値の桁数について。

この検定法で、二種類の菌の殺菌剤の効果の違いを見たいと思っています。 細菌数の数値は大抵、1×10の8乗などになりますので、このままソフトに入力して検定しました。すると、有効性がなさそうな細菌でもp値が有効になる場合がありました。 また、1×10の8乗を100×10の6乗と言うように、値を10の6乗に変換して、100や50などの数値を入力して検定をすると、何気なく検定がうまく数値として現れています。 そこで、この検定でこの効果の違いを見ていいのか?それとも数値を上記のように変換しても良いがどの桁までならば有効なのか?有効ならばなぜなのか?という事がふと疑問に思いまして、ここに記述しました。検定などに詳しい方、お教えいただければと思います。

質問者が選んだベストアンサー

  • ベストアンサー
  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.1

 スケールを変えると全然別の計算をやっていることになってしまうからだめ。サンプル数が多いと「効果は小さいが、有意差はある」という現象を検出できるようになります。例えば乳癌は左側の方が右に比べ0.0X%ほど多い。ほんのわずかの違いではあるが、確かに違いがある、という例です。  ただし、実験のやり方が適切ではなくて他の要因の影響を受けている、というおそれもあることは注意すべき。どんな原因によるかに関係なく、ともかく「結果にわずかながら有意な違いがある」ということがこの検定で検出されるからです。

aricoma
質問者

補足

良く考えましたら、オッズ比で計算すると良い事に気が付きました。スケールを返る事無く、また信頼区間も分かるので、おおよその見当がつくと思いました。一方、薬の評価では、カイ二乗検定で出している方が多いのですが、こういうサンプル数が多い場合はどうしているのでしょうか?参考意見を聞いてみたいです。どのような工夫をしているか?

関連するQ&A

  • かい二乗検定の求め方について 教えてください。

    37人のデータを集計しています。 かい二乗検定は、今回のデータと前回のデータを比較して 成果があるかどうかを調べるものです。 かい二乗検定の公式を教えてください。 また、かい二乗検定を始めて使う、初心者ですので、どのように数値を入力するのか、具体的に教えてください。 また、どのような数値が出たら、成果があり、どこからどこまでの範囲の時は、成果無しと判断するのでしょうか。 よろしくお願い致します。困っています。

  • カイ2乗検定の使い方とp値について

    アンケートを行いました。 結果の考察を行うにあたり、カイ2乗検定で優位差が認められるかを知りたいと思っています。 SPSSやエクセルでカイ2乗検定をしたところ、spssの場合「漸次有意確率(両側)」に「8.89E-13」や「5.964E-27」、エクセルの場合「p値」に「7.15688E-05」などアルファベットの入った数値が出てくることが多かったです。5%や1%水準で有意差が認められるかどうかを知りたかったのですが、この数値の意味が分かりません。 この様な数値が出てくるということは、どこかがおかしいのでしょうか? p値がおかしいこともあって、そもそもカイ2乗検定でよいのかが不安になりました。 「成績」と「開始時期」で、「開始時期が早いほど成績がよい」といったようなことが見たいと思っています。 成績は11項目、開始時期は12項目あります。SPSSで集計結果のクロス集計表を作るときにカイ2乗検定も行ったところ、値が350.994、自由度が110、確率(両側)が5.964E-27でした。 「開始時期が早いほど成績がよい」という結論を導き出したいのですが、この場合「カイ2乗検定で5%水準で有意差が認められた」となったらこの結論を導き出せるのでしょうか?例えば2つの項目の比較ではなく、11×12項目のカイ2乗検定で有意差が認められた場合、何に有意な差が認められたのかがよく分かりません。 クロス集計表を作成し、グラフにしたところ、開始時期によって差がありそうなのですが、単純なパーセントの数値の大小でしか分かりません。調査結果ではなく、卒業論文なので、ただ「これは何パーセントでこれは何パーセントだった。この時期以前に始めた人の方が高い成績を回答している割合が高い」のようなことだけでいいのか…と悩んでいます。 まとまりのない文章で、質問内容も多九手申し訳ありませんが困っています。よろしくお願いします。

  • カイ二乗検定を行いました。正しいでしょうか?

    Χ二乗検定を行いました。素人のため、上司に見せる前に間違っていないか 見ていただきたいです。 添付ファイルをご覧ください。 職場の年間インシデント件数が83件ありました。 エクセルを使用しグラフにしてみると、発生時間帯に差がある、 つまり、発生しやすい時間帯があるように思います。 そのため、素人のために検索を行いながら、 カイ二乗検定を行いました。 上の図のたて列は、 O(観測度数) E(期待度数) O-E (O-E)の二乗 (O-E)の二乗/E で並んでいます。 検定の結果は、 (1)自由度=12-1=11 (2)カイ二乗分布表から、自由度が11、p=0.05の値(有意水準5%)の値は、19.6751 (3)計算で出したカイ二乗値は52.2311 (3)そのため、有意水準5%で「発生時間帯に差は無い」という帰無仮説は棄却される。 つまり、インシデントが発生しやすい時間帯がある という結論が出たのですが、ここで皆さんの意見をお聞きしたいです。 (1)この検定は正しいか?間違いか? (2)正しい場合、8~9時台、16~17時台が、インシデントが発生しやすい時間帯と判断してよいのか? (3)検定は正しい、しかし、時間帯の判断はできない場合、なぜ判断できないのか? (4)検定が間違いの場合、どこに問題があるか? (5)より信頼度を上げる検定方法はあるか? 皆さんのお知恵を、よろしくお願いします。

  • ACCESSでの桁数を指定して数値を抜き出し、カンマ区切り表示にする方法

    ACCESSでのデータ変換について質問です。 下記のような半角20桁の数値が入力されているフィールドが1~10まであり、 これらの値の左側から7桁目までの数値を抜き出し、それら抜き出した 数値の1桁ごとに「,」で区切って表示したいと思っているのですが、 一括括変換する方法があれば教えて下さい。 例(1)12345678910000000000 →1,2,3,4,5,6,7 例(2)00000000001234567890 →0,0,0,0,0,0,0 例(3)00112233445566778899 →0,0,1,1,2,2,3 私は、アクセスに不慣れなので、数式を入力する方法も合わせて教えて いただけると大変助かります。 MID関数を使えばいいらしいのですが、ACCESSではどうすればよいのか分からないため質問させていただきました。 よろしくお願い致します。

  • χ2(カイ2乗)検定とフィッシャーの直接確率検定

    統計学の素人です。 医学の臨床試験のデータに、p値についてχ2(カイ2乗)検定とフィッシャーの直接確率検定のふたつが記載してありました。 p値<0.05で有意差がある、と聞いていますが、上記のふたつの検定方法では、ともにp値<0.05で有意差あり、と考えてよいのでしょうか? それとも検定方法によって異なるのでしょうか。 ネットで調べてみたのですが、難しくてわかりませんでした。 上記のふたつにつきまして、どのような値で有意差ありになるのか教えていただけますとたいへん助かります。よろしくお願いいたします。

  • 正規性の検定でのカイ2乗検定の自由度について

    エクセル統計p051に記されているものです。 標準化値(-1.2,-0.4,0.4,1.2,∞) 理論確率(0.1151,0.2295,0.3108,0.2295,0.1151) 観察度数(4,10,6,9,3) 期待度数(3.6822,7.3443,9.947,7.3443,3.6822)を 列に変換してください。 n=32のデータです。その正規性の検定をするためカイ2乗検定を行ったのですが、自由度が2になることが分かりません。よろしくお願いします。

  • カイ二乗検定で処理したいのですがデータのとり方がわからず困っています。

    左利き手と右利き手の被験者における、左右の耳の聴力低下度を調べています。 目的は、左と右の利き手の被験者で利き手の違いに意味があるかどうかどうかを知りたいので、統計はカイ二乗検定を用いています。 聴力低下度の指標は、高音域、低音域の2項目あり、さらに左右の耳があるので、計4項目からなります。データは順位尺度です。 データ入力は、被験者が重複するいわゆる複数回答形式です。 統計処理するデータの扱い方をお教えいただけないでしょうか。 統計に用いるデータは生データを処理するのでしょうか? 順位尺度の生データ(例数)の統計結果は、 自由度   3 カイ二乗値 23.33 危険率   p=0.0001 生データのカイ二乗検定を行うと、検定は棄却され両グループ間で有意差が見られました。 表にして示す場合、生データはn(総例数)が異なるため両グループ間の比較にならないので、構成比率(例数/n*100)で示します。 構成比率のデータで検定すると 自由度   3 カイ二乗値 6.15 危険率   p=0.150 構成比率のデータを用いカイ二乗検定を行うと、検定は採択され両グループ間は差がありません。 統計処理は、生データ比較でしょうか? それとも表にあらわすような構成比率の比較でしょうか? どちらが適切なのでしょうか? どうぞ、よろしくお願い申し上げます。

  • カイ二乗検定と下位検定 SPSS

    質問文が長く、そして多く大変恐縮ですが、自分でいろいろ調べていてもなかなか解答が見つかりません。どなたかアドバイスをお願いしますm(_ _)m 回答パターンが4つある質問(例えばア・イ・ウ・エ)をして、それぞれに対して得られた回答数が期待度数を有意に上回っているかを検定するのはカイ二乗ですよね? では下位検定としてア・イ・ウ・エのどれがどれを(有意に)上回っているかを調べるためには、観測度数を目で見るだけはダメですか?竹原卓真(2007)「SPSSのススメ」(p.202)には「ライアンの方法」や「ボンフェローニの方法」が下位検定の方法として紹介されています(確立した手法ではないようですが)。 ボンフェローニは分散分析の下位検定で多重比較をする際などに有意確率の補正をする方法だと思っていました。SPSSで上記のようなデータを用いてカイ二乗検定を行った後にボンフェローニ法を使った下位検定をするにはどうしたらいいのでしょうか?どこのタブをクリックしてもボンフェローニの「ボ」の字も出てきません。シンタックスの入力が必要ですか?またテューキーは使えますか? よろしくお願いしますm(_ _)m

  • 「重み付け」 と 「カイ二乗検定」 のことを教えてください。

    SPSSで心理学研究のデータ解析をしておりますが、とても基本的なことを教えていただきたいです。 質問がとんちんかんだったら申し訳ありませんm(_ _)m 1.「重み付けする」というのは、結局どういうことなのでしょうか?ふつうSPSSでは、変数データのパターンの度数をクロス集計で出し、それを「ケースの重み付け」で度数変数に設定するのだと思いますが、これをやると1つ1つの値はどのように算出されて出てくるということですか?度数変数を設定したケースの1つ1つの値は重みが付いたものに変換されるということですよね? 2.1つの名義変数(カテゴリーデータ)と1つの量的変数、これの組み合わせ(のパターン?)から、別の1つの変数を算出する方法はありますか? 2.2列×2行のデータではない(例えば5×5とか、3×2×5とか…?)場合、カイ二乗検定をするのは正しい手法ですか? どうぞよろしくお願いいたします。

  • カイ二乗検定について

    初歩的な質問ですいません。 カイ二乗検定のについての質問です。 期待度数の出し方なのですが、 列数や行数に関係なく、 列の合計*行の合計/総計 でよいのでしょうか。 2*2のクロスの時以外は、違う計算方法になる(その方法はよくわからない)といったことを人から聞いたのですが、ネットで調べても、2*2の表を例としてあげているものが殆どで、 http:www.ias.tokushima-u.ac.jp/linguistik/2005/joho/joho2005_chi.html に、2*4の表があったのですが、こちらでは、列の合計*行の合計/総計 になっていました。 統計というものについて、よくわかっておらず、どれが正しいのかさっぱりです。(数学もあまり習っていないので、情けないのですが、数学の記号もよくわかっていません・・・) また、期待度数は割り算があるので、小数点以下の値も出る場合もあると思うのですが、その場合、小数点何桁まで用いれば妥当なのかとか、 また、クロスではなく、1行の場合の期待度数はどうすればよいのかなどもわかりません。 質問ばかりですみません。 よろしくお願いします。