• 締切済み

統計に関して質問です。

アンケートを用いて数量化二類を行おうと考えています。目的変数のカテゴリーは3つで説明変数を25こ用意しています。つまり3群数量化二類を行ないます。説明変数が多いため変数選択を行うために分割表によるカイ2乗検定を行い、有意な差があった説明変数を選び、数量化2類を行って、そのモデルが正しいかどうかをチェックするというやり方であってるでしょうか?

みんなの回答

回答No.1

企業でSQC推進を担当する者です。 どういうアンケート設計をしているか示さないと (つまり、何をやりたいのか)、 正しいかどうかは分かりませんよ。 ただ、各設問の答え方が5段階あるいは7段階評価になっていると、 類似の設問間で非常に自己相関が高くなるので、 判別分析や主成分分析は無力です。 そのために変数の絞り込みをするのでしょうが、それを補正しても 次に出てくるのは、評価が甘いか辛いか(第2主成分)です。 数量化II類では、そんなことしか分かりませんよ。 私だったら、対応分析か、多次元尺度構成法をやりますね。 3群に分かれてくるかどうか、わからないですけど。 それから、モデルの正しさを見極める方法は、 クロスバリデーションです。 最初から全てのパネルを分析に掛けてはいけません。 3割くらいは残しておいて、求めたモデルで残りが説明できるかどうかを検証します。 院生ではないから、知識が無いのは仕方ないですが、 指導教官は統計の専門家ですよね。 だったら、ここで聞かずに先生に聞いた方が良いのでは?

関連するQ&A

  • 統計の初歩の初歩です(文系)

    すみません、教えていただけますか?社会学、心理学系のアンケート調査の結果を分析しています。統計の初歩のことを伺いたいのですが… 2つの変数を使って、まずクロス集計を出した時にカイ二乗検定をみると有意ではありませんでした。 でも次に相関分析をして、 相関係数を出してみる有意になるんですが、良いのでしょうか?? つまり、カイ二乗検定が有意でなくても、相関分析で相関係数が有意であれば、 関連がありそうだと考えてよいですか?? よろしくお願いいたします。

  • カイ2乗検定

    ご存知の方がおられましたら教えてください。 以下のような2×3表でカイ2乗検定を行う際に、 単純にA群とB群の差の有無を検定するだけでなく、 どこに差があるか検定する方法はあるのでしょうか? (例:好きという回答は有意差があって、普通の回答には有意差はない)    好き 普通 嫌い A群  100  120 30 B群  80  140 10

  • 統計学の適合度検定についての質問です

    統計学初心者です。 観測度数が理論度数の誤差の範囲内かどうかを調べたいのですがどうしたらいいでしょうか? 適当な数値ですが、画像データのAの実測度数が理論度数の誤差の範囲内かどうかを検定するための具体的な計算方法を教えてください。 有意水準は5%、カイ二乗分布 カイ二乗検定で”全体”の検定は x^2=(60-50)^2/50+(20-30)^2/30+・・・+(2-1)^2/1 =6.8444・・・ となり、自由度4のカイ二乗分布、有意水準5%が9.49なので x^2<9.49 有意差はない(誤差の範囲内) というのでまずは合ってますでしょうか? 次にAのみの観測度数と理論度数を検定(誤差の範囲内かどうかを知りたい)したいのですが、 x^2=(60-50)^2/50+(40-50)^2/50 =4 自由度2-1=1のカイ二乗分布、有意水準5%が3.84なので x^2>3.84 有意差はあり(誤差の範囲外) AとB~Eの2個に分けて計算してみましたが、そもそもこの方法が合っているのかどうか分かりません。 アドバイスよろしくお願いします。

  • 質問紙のデータ分析について カイ二乗? 正確確率? Q?

    質問紙の検定で何を使えばよいのか困っています。 ご指導お願いいたします。 複数回答の質問形式なのですが,それぞれについて5つのグループ間で有意差があるかどうかを検定したいと思っております。 無制限質問形式なので,二項選択にてそれぞれ検定を行うつもりです。 検定法として,カイ二乗検定,フィッシャーの正確確率検定を考えたのですが,質問によっては度数が5以下のものもありますので,すべてにカイ二乗検定が使えるとはいえません。 かといって,正確確率検定も分割表が5×2になってしまうので使えない気がします。L×M分割表でやってみたのですが,結局カイ二乗ですし,残差分析についても二項選択で独立ではないので意味があるのかどうか。。。 そんなときに,先行研究で無制限質問形式・2グループ間の有意差の検定で,Q検定を使っているものがありまして,さらに混乱してしまいました。 統計の解説書や統計に関連したwebで,できる範囲で調べてみたのですが,どうにも判断しかねます。 どうかどうかご指導のほどよろしくお願いいたします。

  • カイ二乗検定 求めた値の扱い方

    2×2分割表のカイ二乗検定を行います。 手元のカイ二乗分布表では, 有意水準 10% 2.706 5% 3.841 2.5% 5.024 1% 6.635 となっています。 これらの値は片側検定で使用できるのでしょうか? それとも両側検定で使用できるのでしょうか? また,使用できない方で検定したい場合,どうすればよいのでしょうか?

  • 統計学、何検定を使えばいいですか?

    統計学初心者です。 正常ラットと飢餓ラットの臓器の重量や長さを統計処理し、有意差があることを示したいのですが、何検定を使えばいいのか分かりません。 カイ2乗検定かとも思いましたが、違うような気がします。 何検定を使えばいいですか?教えてください、お願いします。

  • 統計学なんですけど

    統計学なんですけど、最近勉強をはじめた文系の人間です。 次のような記述研究をしたいのですが、データの分析方法がよく分かりません。 英語の先生が生徒の間違いに対してどのような指導をするか、と言うテーマで、ベテランの先生と新米先生の授業を比較するつもりです。あらかじめカテゴリーを6つ用意して、二人の先生の授業を観察しながら、そのカテゴリーにチェックを入れていきます。そしてそれぞれのカテゴリーごとの出現回数を求めます。 そこで、その結果を二人の先生で比較して、有意な差があるかどうかを見たいのですが、カイ二乗検定で良いのでしょうか?名義尺度なのでノンパラメトリック検定を使う、と本で読んだので。 ぜひ、教えていただきたいので、よろしくお願いします。

  • 統計(多重比較)で困っています.

    統計初心者です。宜しくお願いします。 ある疾患の発症頻度を3種類の年齢層(A群、B群、C群)に分け、比較したいと思っています。 この3群間の群間比較を http://www.stattools.net/Multiprop_Pgm.php のサイトを利用してMarascuilo法を用いて行ないましたが、カイ二乗検定では3群間に有意差がでるものの、各群間(AB間、BC間、CA間)では有意差がでません。 これはどのようなことを意味しているのでしょうか? 詳しい方、よろしくお願いします。

  • カイ2乗検定の使い方とp値について

    アンケートを行いました。 結果の考察を行うにあたり、カイ2乗検定で優位差が認められるかを知りたいと思っています。 SPSSやエクセルでカイ2乗検定をしたところ、spssの場合「漸次有意確率(両側)」に「8.89E-13」や「5.964E-27」、エクセルの場合「p値」に「7.15688E-05」などアルファベットの入った数値が出てくることが多かったです。5%や1%水準で有意差が認められるかどうかを知りたかったのですが、この数値の意味が分かりません。 この様な数値が出てくるということは、どこかがおかしいのでしょうか? p値がおかしいこともあって、そもそもカイ2乗検定でよいのかが不安になりました。 「成績」と「開始時期」で、「開始時期が早いほど成績がよい」といったようなことが見たいと思っています。 成績は11項目、開始時期は12項目あります。SPSSで集計結果のクロス集計表を作るときにカイ2乗検定も行ったところ、値が350.994、自由度が110、確率(両側)が5.964E-27でした。 「開始時期が早いほど成績がよい」という結論を導き出したいのですが、この場合「カイ2乗検定で5%水準で有意差が認められた」となったらこの結論を導き出せるのでしょうか?例えば2つの項目の比較ではなく、11×12項目のカイ2乗検定で有意差が認められた場合、何に有意な差が認められたのかがよく分かりません。 クロス集計表を作成し、グラフにしたところ、開始時期によって差がありそうなのですが、単純なパーセントの数値の大小でしか分かりません。調査結果ではなく、卒業論文なので、ただ「これは何パーセントでこれは何パーセントだった。この時期以前に始めた人の方が高い成績を回答している割合が高い」のようなことだけでいいのか…と悩んでいます。 まとまりのない文章で、質問内容も多九手申し訳ありませんが困っています。よろしくお願いします。

  • どちらの統計処理を選ぶか

    ELIZA法で分析した添付データで、AとBに有意差があるかを検定したいのですが、カイ二乗検定にするか、マンウィットニーのU検定にするか迷っています。ちなみに、”-”はブランクの数値と同等かそれ以下です。カイ二乗検定では、A,Bそれぞれ、ー(シグナルのでなかった)の個数とシグナルのでた個数間で解析し、マンウィットニーのU検定では、A,Bそれぞれ、ー(シグナルのでなかった)を0、シグナルの出たものを1として処理します。よろしくご教示ください。