• 締切済み

適切な統計テストを教えてください。

疑問に思ったので質問させてください。 例として ある大学の高校別入学者数の統計的な相違を調べる時、ある高校Aと高校B(母数は違う)を調べる場合はカイ2乗で検定で可能ですが、多数の高校からなるリストを統計的に相違が出ないグループに分別するにはどのようなテストが考えられますか? グループA内の高校は相違なし。しかしグループAvsBでは有意義に相違ありのような形で。 クラスター分析になるのでしょうか? リスト内の高校数は統計上に適度に大きいとします(20-50)。 よろしくお願いします。

みんなの回答

  • backs
  • ベストアンサー率50% (410/818)
回答No.1

リストA{a高校,b高校,c高校}=東大合格者20名 リストB{a'高校,b'高校,c'高校}=東大合格者35名 リストC{a''高校,b''高校,c''高校}=東大合格者10名 となっていて,どのリストから多く合格者が出ているかということでいいのでしょうかね? これは難しく考えなくても,リスト間で度数に偏りがあるかどうかを検定すればよいのではないかと考えますがどうでしょう。同じようにリスト内で度数の分布に偏りがあるかどうか検定すればよいと思いますが?

wachacha2
質問者

補足

回答を有難うございます。 これは全体(本文ではリスト)をグループ分けするための統計方法の質問です。初めはグループ分けされておらず、統計的に有意なグループに振り分けるにはどうしたらよいのでしょう? もし宜しければ連続型の場合の統計方法も教えてください。

関連するQ&A

  • 統計の初歩の初歩です(文系)

    すみません、教えていただけますか?社会学、心理学系のアンケート調査の結果を分析しています。統計の初歩のことを伺いたいのですが… 2つの変数を使って、まずクロス集計を出した時にカイ二乗検定をみると有意ではありませんでした。 でも次に相関分析をして、 相関係数を出してみる有意になるんですが、良いのでしょうか?? つまり、カイ二乗検定が有意でなくても、相関分析で相関係数が有意であれば、 関連がありそうだと考えてよいですか?? よろしくお願いいたします。

  • 統計についての文を添削してください

    統計のことはぜんぜん理解していないものです。 どなたか私の文を添削していただけないでしょうか? 言葉遣いがおかしいとか、意味が違うとか指摘していただけると助かります。 サービスの品質改善というテーマで翻訳をしていたのですが、調査をおこないデータを整理して結論をだすために、統計の手法を使うことができる、という部分がでてきて困っています。 ネットでいろいろ学習??しましたが、あっているかどうかまったく自身がありません。 よろしくお願いいたします。 カイ二乗‐2つの変数の間での関連を決めるための統計技術。(1)観察されたデータが期待とマッチするかどうかを見る、(2)一方の変数の分布がもう一方の分布と関係があるかみる。 t-検定-サンプルが同じ人口から選べれているかを見るため、2つの個別サンプルの平均や割合を比較する統計技術。(3つ以上のサンプルの平均をテストするには、分散分析が使われます) 重回帰-複数の変数の値の変化によって、1つの変数の変化の値を予測するための統計技術です。 クラスタ分析-対象(学校/場所/物など)を特定された数の排他的グループ(内部的に同種)に分ける統計技術。 因子分析‐相関関係をもつ変数の大きなセットの要因を決める統計技術。 判別分析-人や物を2つ以上のカテゴリーに分類するための統計技術。 カイ二乗による相互作用の自動検出方法(CHAID)‐分岐方法を使って、因数のなかの相関と見つける統計技術。 以上です。

  • クラスタ分析後のカイ二乗分析

    クラスタ分析後のカイ二乗分析 SPSSを使ってカイ二乗検定をしようとしていますが、以下のようなケースについておたずねしたいと思います。 1000人の被験者をあるアンケートによって4つのクラスターに分け、そのクラスターごとに「喫煙の有無」の割合に差があるかどうか調べます。 しかし、各クラスターの人数がまちまちで、第一クラスタは100人、第二クラスタは200人、第三クラスタは500人、第四クラスタは200人に分かれました。 第一クラスタで「喫煙する」と答えた割合が80人だった場合、第一クラスタの喫煙率は80%と高くなりますが、全体から見ると8%という小さい数字になってしまいます。 第一クラスタの喫煙率が他のクラスタと比べて高いことを検定するには、どうすればいいでしょうか?

  • どちらの統計処理を選ぶか

    ELIZA法で分析した添付データで、AとBに有意差があるかを検定したいのですが、カイ二乗検定にするか、マンウィットニーのU検定にするか迷っています。ちなみに、”-”はブランクの数値と同等かそれ以下です。カイ二乗検定では、A,Bそれぞれ、ー(シグナルのでなかった)の個数とシグナルのでた個数間で解析し、マンウィットニーのU検定では、A,Bそれぞれ、ー(シグナルのでなかった)を0、シグナルの出たものを1として処理します。よろしくご教示ください。

  • 統計学、何検定を使えばいいですか?

    統計学初心者です。 正常ラットと飢餓ラットの臓器の重量や長さを統計処理し、有意差があることを示したいのですが、何検定を使えばいいのか分かりません。 カイ2乗検定かとも思いましたが、違うような気がします。 何検定を使えばいいですか?教えてください、お願いします。

  • 適合度検定について

    適合度検定について教えてください 測定結果の分布がある種の確立密度関数に従うかどうかをカイ二乗検定で調べます。測定値の度数と理論度数の比較です。このとき確立密度関数の母数によって、検定時の自由度が変わるといわれたのですが。 母数と自由度の関係を教えてください。 たとえば p(x)=(x/a)・exp{-x^2/(2a)}:2aがxの2乗平均 で示されるレイレイ分布の場合はどうなるのでしょうか。 いろいろ文献を調べたのですがわかりません。統計に関しては素人です、よろしく お願いします。

  • 統計 検定方法について

    質問紙調査結果のデータの検証として、検定を用いようと考えています。 しかし、統計学の勉強途中で適切な検定が分かりません。   帰無仮説 Aが高い(を選んだ)人は、Bも高い(を選ぶ) 対立仮説 AとBに関係はない Aを高いと選んだ人と、低いと選んだ人を分けて、 Bについてそれぞれ高いか低いかを集計した状態です。 どの検定を用いれば良いかが分かりません。 私はカイ二乗検定を使うと思ったのですが、期待値が分からなくて 考えているうちに混乱してきました。 よろしくお願いいたします。

  • A/Bテストの検定方法(カイ二乗検定)につい

    仕事でweb制作を行っておりまして、A/Bテストの検定方法について質問です。 統計学超初心者です。 特定のwebページの特定箇所の文言について4パターンを作成し、 コンバージョン率の高いものを見つけるためにテストしています。 その結果が例えば下記のような形だったとします。 <結果> パターン名 / クリック数 / コンバージョン数 / コンバージョン率 A / 10000 / 20 / 0.200% B / 10500 / 23 / 0.219% C / 10800 / 25 / 0.231% D / 9980 / 21 / 0.210% ■質問1 4パターン同時に有意差を確認するには カイ二乗検定で4×2列の表で検定する、と理解していますが合っていますでしょうか? ■質問2 カイ二乗検定で4×2列の表で有意差があった場合、 4パターンでやった場合にバラつきがあった、というだけで、 各パターン個別の有意差については何も言及出来ない、と認識しています。 そこから最もコンバージョンが低いものだけを除いて、 3パターンだけの数字で再度カイ二乗検定(自由度2)したり(上記の結果だと、Aを除いた3パターン)、 上位2パターンだけを取り出し(上記の結果だとCとBだけ→自由度1)カイ二乗検定を行うことは意味があるでしょうか? カイ二乗検定という統計手法を使う上で、数学的な前提が崩れるため意味が無い計算なのか、 それとも、上記のようなパターンで4パターンでの検定を行った後に、 個別に検定を行うことが出来る/意味がありますでしょうか? ■質問3 二項検定・Z検定・二群の比率の差の検定は、 2パターンの比較にだけしか使えないという理解で良いでしょうか?

  • Excel  :  統計解析の分析ツールについて

    質問に目を止めていただきありがとうございます。 血圧変化量と気温変化量の関係をExcelの統計解析で出したいと思っています。 Googleなどで【変化量 統計】とkey wordを打つと【共分散分析】を使用するのがいいという、サイトを何個か見て回ったのですが、理解できませんでした。 この【共分散分析】と言うのは変化量を導き出すのには最適な方法なのでしょうか? t-検定やカイ二乗検定の方法は、どうにかわかるのですが変化量を出すには向いてないでしょうか? その他、参考サイト等なんでも構いませんのでよろしくお願いします。 よろしくお願いします。

  • 【統計】こんなときはどっち?

       ~喫煙経験有りと無しの人数~              有   無      Aグループ  3   17       Bグループ  7     3      Cグループ  5     5 どの組とどの組に差が有るのかを見る場合、どちらが適切でしょうか?  1.カイ二乗検定を A-B, B-C, C-A で3回行い、p値が p<0.0166…(=0.05/3 ※ボンフェローニ補正)となる組合せを探す。  2.Fisher の正確確率検定を A-B, B-C, C-A で3回行い、p値が p<0.0166…となる組合せを探す。(期待度数が5未満となるため) どちらでもない場合、適切な検定方法を教えて頂けると有り難いです。 宜しくお願いします。