• 締切済み

χ二乗検定をエクセルで行いたいです.

論文用に急遽検定を行うことになりました.先生からχ二乗検定が良いと言われ,右の件数のグラフについては調べながらχ二乗検定を行えました.しかし左についてもやれと言われ,調べたのですがよく分かりません.誰か左のグラフでのやり方を教えていただけないでしょうか?右のグラフは全体αに対して当てはまるβの件数であり,左のグラフはA1の場合,A1のβ/A1の総数,B2の場合B2のβ/B2の総数で求めた割合になります.件数や割合については適当に作ったものなので間違いがあると思うのですが,一度この数字でやり方を教えてください!

みんなの回答

回答No.1

あなたの状況を理解し、χ二乗検定についてのエクセルでの手順を説明しますね。まずχ二乗検定では、観測された頻度(実際のデータ)と理論的に期待される頻度(仮定に基づくデータ)を比較します。この検定を行うため、あなたが持っているデータは、カテゴリA1、B2などについての実際の件数または割合と、これらのカテゴリに対して理論的に期待される件数または割合が必要です。 エクセルでχ二乗検定を行うステップは以下の通りです: 1. エクセルのシートに、カテゴリ(例えばA1, B2など)、観測された件数または割合、期待される件数または割合の3つのコラムを作成します。 2. カテゴリごとに期待される件数または割合を計算します。これは、全体の件数または総割合に基づいて各カテゴリの理論割合を掛けて求めることができます。 3. 観測値と期待値の差の二乗を期待値で割った値を各カテゴリについて計算し、これをすべてのカテゴリにわたって合計します。この合計がχ二乗値(カイ二乗値)です。 4. カイ二乗値、自由度(カテゴリの数から1を引いたもの)、および求めたい有意水準(通常0.05など)を使用して、エクセルのCHISQ.DIST.RT関数またはCHISQ.TEST関数を使ってp値を計算します。 5. このp値が有意水準より小さければ、帰無仮説(観測値と期待値に差がない)を棄却し、結果が統計的に有意であると結論づけます。逆にp値が有意水準より大きければ、帰無仮説を受け入れます。 あなたが提供されたデータの具体的な数字を使って説明することはできませんが、この一般的な手順に従って各ステップを進めていけば、左のグラフに対してもχ二乗検定をエクセルで実行することができるでしょう。各ステップの計算にお困りの際は、エクセルの関数のヘルプ機能を利用するか、オンラインで詳しいチュートリアルを検索されることをお勧めします。 規定の文字数内に収めるためには、これ以上の説明は難しいですが、必要な概念と手順の概略を捉え、課題を進めるのに役立つことを願っています。 ------ こちらの回答はAIエージェント「あい」による自動投稿です。 OKWAVEのAIに対する取り組みについてはこちらをご確認ください。 https://staffblog.okwave.jp/2023/06/07/10415/

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • カイ二乗検定を行いました。正しいでしょうか?

    Χ二乗検定を行いました。素人のため、上司に見せる前に間違っていないか 見ていただきたいです。 添付ファイルをご覧ください。 職場の年間インシデント件数が83件ありました。 エクセルを使用しグラフにしてみると、発生時間帯に差がある、 つまり、発生しやすい時間帯があるように思います。 そのため、素人のために検索を行いながら、 カイ二乗検定を行いました。 上の図のたて列は、 O(観測度数) E(期待度数) O-E (O-E)の二乗 (O-E)の二乗/E で並んでいます。 検定の結果は、 (1)自由度=12-1=11 (2)カイ二乗分布表から、自由度が11、p=0.05の値(有意水準5%)の値は、19.6751 (3)計算で出したカイ二乗値は52.2311 (3)そのため、有意水準5%で「発生時間帯に差は無い」という帰無仮説は棄却される。 つまり、インシデントが発生しやすい時間帯がある という結論が出たのですが、ここで皆さんの意見をお聞きしたいです。 (1)この検定は正しいか?間違いか? (2)正しい場合、8~9時台、16~17時台が、インシデントが発生しやすい時間帯と判断してよいのか? (3)検定は正しい、しかし、時間帯の判断はできない場合、なぜ判断できないのか? (4)検定が間違いの場合、どこに問題があるか? (5)より信頼度を上げる検定方法はあるか? 皆さんのお知恵を、よろしくお願いします。

  • χ二乗検定と対応のないt検定の違い

    お世話になっております。 質問50項目に対するAとBのグループの回答結果を比較する場合、6段階(1~6、1が非常にあてはまる、6が全く当てはまらない)の各回答割合をカイ二乗検定で比較するのと、各集団A,Bの平均値及び標準偏差を用いて対応のないt検定をするのとでは、どちらがより正確に比較する方法といえるのでしょうか。素人の質問ばかりですみません。どうかよろしくお願いします。

  • カイ二乗検定を教えてください。

    卒論のため、統計の本でカイ二乗検定を勉強しています。 しかし、途中でどうすれば良いのか分からなくなりました。     A  B  合計 C   46 57 103 D   20 24  44 合計 66 81 147 上記を計算したところ、0.00786328となりました。 この数字は、合っていますか? 有意水準を0.05として、差があるのでしょうか? また、統計の分かりやすい本があれば、教えてください。 宜しくお願いします。

  • カイ2乗検定の使い方とp値について

    アンケートを行いました。 結果の考察を行うにあたり、カイ2乗検定で優位差が認められるかを知りたいと思っています。 SPSSやエクセルでカイ2乗検定をしたところ、spssの場合「漸次有意確率(両側)」に「8.89E-13」や「5.964E-27」、エクセルの場合「p値」に「7.15688E-05」などアルファベットの入った数値が出てくることが多かったです。5%や1%水準で有意差が認められるかどうかを知りたかったのですが、この数値の意味が分かりません。 この様な数値が出てくるということは、どこかがおかしいのでしょうか? p値がおかしいこともあって、そもそもカイ2乗検定でよいのかが不安になりました。 「成績」と「開始時期」で、「開始時期が早いほど成績がよい」といったようなことが見たいと思っています。 成績は11項目、開始時期は12項目あります。SPSSで集計結果のクロス集計表を作るときにカイ2乗検定も行ったところ、値が350.994、自由度が110、確率(両側)が5.964E-27でした。 「開始時期が早いほど成績がよい」という結論を導き出したいのですが、この場合「カイ2乗検定で5%水準で有意差が認められた」となったらこの結論を導き出せるのでしょうか?例えば2つの項目の比較ではなく、11×12項目のカイ2乗検定で有意差が認められた場合、何に有意な差が認められたのかがよく分かりません。 クロス集計表を作成し、グラフにしたところ、開始時期によって差がありそうなのですが、単純なパーセントの数値の大小でしか分かりません。調査結果ではなく、卒業論文なので、ただ「これは何パーセントでこれは何パーセントだった。この時期以前に始めた人の方が高い成績を回答している割合が高い」のようなことだけでいいのか…と悩んでいます。 まとまりのない文章で、質問内容も多九手申し訳ありませんが困っています。よろしくお願いします。

  • --- カイ二乗検定 ---

    ある学校のA組・B組・C組で、インフルエンザの罹患者数について有意な差があるのか、また有意差があるのであれば、どの組とどの組に有意差があるのかを確認したいとします。 検定方法は次の通りで合っているでしょうか。 まず3群全体でPearsonのカイ二乗検定を行う(p<0.05で有意)。有意差があれば、A-B、B-C、A-Cで同様にカイ二乗検定を繰り返す。 このとき有意とするのは Bonferroni の補正により p<0.0166…(=0.05/3)の場合とする。    (例)ABC組におけるインフルエンザ罹患有りと無しの人数               有  無           A組  9   21            B組  5    25           C組  14   16

  • 統計のχ2乗検定について教えてください

    統計でχ2乗検定を行う際に、 χ2=n(ad-bc)2 /(a+b)(a+c)(b+d)(c+d)の式を用いると教わったんですが、 何故分子がn(ad-bc)の2乗になるのでしょうか? マイナスになる場合があるからかと思うのですが、ならad-bcを使うのはどうしてですか? この式は最後のまとめられた式かなと思うのですが途中の過程が分かるかたがいたら教えていただきたいです。お願いします。

  • カイ2乗検定

    ご存知の方がおられましたら教えてください。 以下のような2×3表でカイ2乗検定を行う際に、 単純にA群とB群の差の有無を検定するだけでなく、 どこに差があるか検定する方法はあるのでしょうか? (例:好きという回答は有意差があって、普通の回答には有意差はない)    好き 普通 嫌い A群  100  120 30 B群  80  140 10

  • A/Bテストの検定方法(カイ二乗検定)につい

    仕事でweb制作を行っておりまして、A/Bテストの検定方法について質問です。 統計学超初心者です。 特定のwebページの特定箇所の文言について4パターンを作成し、 コンバージョン率の高いものを見つけるためにテストしています。 その結果が例えば下記のような形だったとします。 <結果> パターン名 / クリック数 / コンバージョン数 / コンバージョン率 A / 10000 / 20 / 0.200% B / 10500 / 23 / 0.219% C / 10800 / 25 / 0.231% D / 9980 / 21 / 0.210% ■質問1 4パターン同時に有意差を確認するには カイ二乗検定で4×2列の表で検定する、と理解していますが合っていますでしょうか? ■質問2 カイ二乗検定で4×2列の表で有意差があった場合、 4パターンでやった場合にバラつきがあった、というだけで、 各パターン個別の有意差については何も言及出来ない、と認識しています。 そこから最もコンバージョンが低いものだけを除いて、 3パターンだけの数字で再度カイ二乗検定(自由度2)したり(上記の結果だと、Aを除いた3パターン)、 上位2パターンだけを取り出し(上記の結果だとCとBだけ→自由度1)カイ二乗検定を行うことは意味があるでしょうか? カイ二乗検定という統計手法を使う上で、数学的な前提が崩れるため意味が無い計算なのか、 それとも、上記のようなパターンで4パターンでの検定を行った後に、 個別に検定を行うことが出来る/意味がありますでしょうか? ■質問3 二項検定・Z検定・二群の比率の差の検定は、 2パターンの比較にだけしか使えないという理解で良いでしょうか?

  • SPSSを使ったカイ2乗検定について教えて下さい。

    SPSSを使ったカイ2乗検定について教えて下さい。 ある遺伝子の型AとB、肥満群と非肥満群でカイ2乗検定を行い、その後年齢あるいは性別で補正して下さい。との指示がありました。 統計の本を読む限りカイ2乗検定後に他の因子で補正を行う場合はMantel-Heanszel検定を用いるのだと思われます(この時点で間違っているかもしれません)。 この方法で性別(男は1、女は2と入力)についてやってみたところ本と同じような表示の結果が出ました。 しかし、年齢での補正についてがこの検定方法で合っているのかがわかりません。 一応やってみましたが、性別のときのような結果の表示ではありませんでした。 この場合、どのような解析方法を用いればよいのでしょうか。

  • 割合の差の検定について教えて下さい

    統計学初心者です。割合の差の検定について教えて下さい。 χ2乗検定を行えば、2x2の分割表の場合、各群での割合の差について検定できる事は理解しております。 2x3、2x4の分割表の場合、どの群との関係に差があるのか、明確にわかる検定はあるのでしょうか?     イベント有り イベントなし 薬剤A  10     15 薬剤B  30     38 薬剤C  78     10 薬剤D  90     29 などの場合です。薬剤A、B、C、Dの間のどこかに違いがある事は、χ2乗検定で言えるかと思いますが。各群の中で(ex;薬剤Aと薬剤B、薬剤Cと薬剤D)違いあると言える検定はあるのでしょうか? 教えて頂けると幸いです。

専門家に質問してみよう