• ベストアンサー
  • 困ってます

excelの対応のないt検定について

こんにちは。統計について質問させてください。 対応のないt検定を行おうと思っているのですが、比較しようとしている集団Aと集団Bの被験者の人数が異なっています。(例 集団A=68名 集団B=48名) (1)この場合、t検定は行えますか? (2)エクセルで行う場合、データタブのデータ分析、t検定等分散を仮定した2標本による検定でよろしいでしょうか? 宜しくお願いいたします。

共感・応援の気持ちを伝えよう!

  • 回答数1
  • 閲覧数2917
  • ありがとう数1

質問者が選んだベストアンサー

  • ベストアンサー
  • 回答No.1
  • f272
  • ベストアンサー率45% (5184/11478)

http://www.geisya.or.jp/~mwm48961/statistics/bunsan1.htm この辺を見たら幸せになれるでしょう。

共感・感謝の気持ちを伝えよう!

質問者からのお礼

幸せになりました。ありがとうございます。しかし、[平均の差を比較する方法]の中の(2)データに対応がないときのt検定の項で、肝心な部分が「データの個数が等しいときも等しいときもある」とあり、データの個数が等しくなくてもいいんだろうな、とは文脈から思いましたが、少し不安になりました。

関連するQ&A

  • t検定について

    実験レポートなのですが、処理の仕方でわからないところがあるので教えてもらいたいです。 被験者はそれぞれ3名ずつのAとBの2群があります。それで、各被験者で、仮にXとYについてのデータが得られたとします。そこで、エクセルで、下記のようにまとめました。          X     Y A群・被験者1  60    50 A群・被験者2  40    20 A群・被験者3  55    70 B群・被験者4  45    70 B群・被験者5  35    50 B群・被験者6  50    40   それで本題なのですが、XとYについて、この2つに違いが見られるかを調べるため、t検定を行うのですが、 私は、等分散を仮定した2標本による検定というt検定を用いて、変数1に、A群のXの値3つ、変数2に、B群のXの値3つを入れて出したのですが、これだと自由度が4になりますよね。 実験助手の人が、自由度は2になると言っていたので、私のやり方が間違っていると思います。   XとYについて、この2つに違いが見られるかを調べる場合、どうやってt検定をしたらいいのでしょうか。 長文になりましたが、ご存知の方よろしくお願いします。

  • 統計解析 相場分析 T-検定 エクセル SPSS

    2つの母集団の平均差に有意差があるかを調べるためエクセルでT検定をしましたところ、ある異変に気づきました。 メニューの「ツール>分析ツール」で等分散を仮定した2標本による検定を選ぶと、"配列1"と"配列2"に各々の集団を入れることになります。ところが、それぞれの欄に入れる集団の順番を入れ替えると両側有意確率が.05以下だったものが、.05以上になってしまい、有意差の有無の結果が間逆になってしまいます。 分析の概要は以下のとおりです。 (F検定で等分散は確認済み) 標本1: 火曜日を除外した某先物の寄値-引値の価格差(デイトレードの成績) サンプル数→489個 (期間'00-'07年。母集団のサンプルは1970個) 平均値:647 標本2: 火曜日だけのデイトレ成績 サンプル数→88個 (期間'00-'07年。母集団のサンプルは1970個) 平均値:3215 2つの集団の平均差:2568 ****************************** 分析結果にみられる矛盾 >>>>>>>[標本1]を配列1にすえた場合<<<<<<< t-検定 : 等分散を仮定した2標本による検定 かよう以外 かよう 平均 646.8844483 3214.899617 分散 201365586.2 157505681.3 観測数 489 88 プールされた分散 194729391.9 仮説平均との差異 2568 自由度 575 t -3.178472095 P(T<=t) 片側 0.000780042 t 境界値 片側 1.647508725 P(T<=t) 両側 0.001560084 t 境界値 両側 1.964099283 >>>>>>>>[標本2]を配列1にすえた場合<<<<<<< t-検定 : 等分散を仮定した2標本による検定 かよう かよう以外 平均 3214.899617 646.8844483 分散 157505681.3 201365586.2 観測数 88 489 プールされた分散 194729391.9 仮説平均との差異 2568 自由度 575 t 9.38710200484845E-06(質問者が換算→0.00094%) P(T<=t) 片側 0.499996257 t 境界値 片側 1.647508725 P(T<=t) 両側 0.999992514 t 境界値 両側 1.964099283 ************************  以上のようにT値のあたい自体もかわってしまうのです。本で計算式を調べても違いは出ないはずなのに(統計初心者です。まちがってたらゴメンナサイ)どうしてでしょうか。サンプル数もしくは平均値の大きさによって、配列1,2に入れる順番を変えるべきなんでしょうか。おそらく右側検定とか、左側検定とかの概念と関係しているのかもしれませんが、本やネットで調べても判然としません。  ちなみに月、火、水、木、金と曜日別に成績をわけ、SPSSで一元配置の分散分析(ANOVA)、Welch検定, Brown-Forsythe検定, ボンフェローニの多重比較表でも確認したところ、曜日間に有意差はみられませんでした。  どうしてエクセルでは、配列の順番により結果が変化するのか、どなたさまかぜひ教えてください。統計初学者なので、珍妙なことを申し上げてるかもしれませんが寛大なご教示のほどよろしくお願いいたします。

  • t検定について教えてください

    エクセルの分析ツールを用いて、t-検定: 等分散を仮定した2標本による検定 を行いました。 結果で、P(T<=t) 両側 に 6.82420809647282E-07 と出てきました。 この数字の中に、E が表示されていますが、 Eは何を意味しているのでしょうか?

  • 検定について

     統計を独学で勉強しています。先日90人の被験者を対象に実験を行いました。同じ被験者に違う実験をして、ある刺激に反応した人の数を集計しました(たとえば「A実験:30人、B実験:45人」。  この人数の差を検定したいのですがいろいろな検定があってどれが適切かわかりません。本をみたら二項分布の正規近似を行うように書いてあったのですが、標本の人数が少なければ信頼性は低いようですが・・・  とりあえず正規近似で検定して結果は出たのですがいまいち理解できていません。他にどの検定がよいと思いますか?  また二項分布の正規近似をした場合、レポートにまとめる時どのように書けばよいでしょうか?

  • Excelでt検定を行うTTESTという関数

    Excelでt検定を行うTTESTという関数 の使い方についてわからないことがあります。 検定の種類で1-3の数字を選ばないといけないようで、helpを見ると下記のような説明が書かれているのですが、何のことかわかりません。それぞれどのような場合に使うのでしょうか?具体的な簡単な例で説明していただけると助かります。  1 対をなすデータの t 検定  2 等分散の 2 標本を対象とする t 検定  3 非等分散の 2 標本を対象とする t 検定

  • 統計_パラメトリック検定の仮定について

    パラメトリック検定をする上での仮定として、等分散・正規分布があります。 この等分散という点について質問させてください。 ある被験者集団の能力をある測度で測定し、全員分のデータでは正規分布でなかったとします。 ところが、当初の目的に沿って2群にわけたところ、各群でそれぞれ正規分布となりました。 この場合の比較について、パラメトリックな検定とノンパラではどちらが推奨されるでしょうか?

  • 層化比例無作為抽出時の検定などの方法

    とある書籍にて以下のことを学習しました。 ・層化比例無作為抽出法を用いて標本抽出をおこなった場合、標準誤差の算出には標本全体の分散ではなく、各層内分散の加重平均値を用いる。 ・よって、単純無作為抽出時に比較して標本誤差を低く抑えることができる(ことが多い)。 ここで質問なのですが・・・、 ・層化比例無作為抽出をおこなう場合、すべてのな区間推定や検定,果ては分析仮定で標準誤差を用いるすべての多変量解析において、一般的な統計ソフトを用いることは『正しくない』のでしょうか(大抵の統計ソフトは単純無作為抽出を仮定していると考えています)? ・『正しくない』とすれば、皆さんはどのように対処されてらっさるのでしょうか?ご自身でスクリプトを書いたりされているのでしょうか?それとも、「分析結果にさほど影響を与えるものでもないから統計ソフトで済ましている」といった感じなのでしょうか? 以上、どなたかおわかりの方がいらっしゃいましたら、ご教授いただけませんでしょうか? 宜しくお願いいたします。

  • 一元配置分散分析でよろしいのでしょうか?

    よろしくお願いいたします。 A町から抽出した被験者の年齢 ; 33,43,43,21,76,43 ・・・。 B町から抽出した被験者の年齢 ; 23,34,55,43,47,98,86,53・・・。 C町から抽出した被験者の年齢 : 45,42,57,35,65,48,37,27・・。 D町から抽出した被験者の年齢 ; ・・・。 E町から抽出した被験者の年齢 ;  ・・・・。 各群において平均年齢に差が無いことを示すのは、 一元配置分散分析でよろしいのでしょうか。ネットで一元配置分散 分析の使用例を調べてみたのですが、平均年齢に用いている ケースがなかったので質問させていただきました。 どうぞ、よろしくお願いいたします。

  • 3群の有意差検定について

    初めて質問致します。 統計学については素人ですので、的外れな質問でしたらすみません。 現在、A・B・Cの3群についてある値を算出し、その値によって3群が分類できるかどうかを検討しております。 A・B・Cはそれぞれ標本数が異なっており、対応はありません。 等分散性の検定→分散分析→多重比較という手順で以下のように行いました。 Levene検定(有意差なし)→一元配置分析(有意差あり)→Bonferroni検定 Levene検定(有意差あり)→kraskull- wallis検定(有意差あり)→Bonferroni検定 この検定方法(特にBonferroni検定の採用)は正しいのでしょうか。色々調べてみたのですが結論が出ないので質問させていただきました。 ご教授よろしくお願いします。

  • 多要因ノンパラメトリック検定について

    現在二値型(0,1)のデータを扱っております。課題に成功出来たか、出来なかったか、に関するデータです. そして、それに対して3要因(被験者内要因2,被験者間要因1)のノンパラメトリック検定を行いたいと思っているのですが、なかなか適当な検定を見つけられないでいます。普通に分散分析が適用できれば簡単なんですが... 多要因のノンパラメトリック検定についてご存じの方、どうぞおひまなときにでも,ご指導よろしくお願いします。