標本数の異なるもの同士の効果の検討

このQ&Aのポイント
  • 標本数の異なるもの同士を比較して、効果を検討する方法について質問があります。
  • 特定の問題が時間経過によって現れるため、その問題の解析を行っている中で、標本数の異なるもの同士を比較する必要が生じました。
  • しかし、まだ問題が顕在化していないものも含まれる可能性があるため、適切な分析方法についてアドバイスが欲しいです。
回答を見る
  • ベストアンサー

標本数の異なるもの同士の効果の検討

初めまして。 かなり急を要しているので、ご助言頂ければ幸いです。 ある製品に時間経過によって顕在化する問題があり、その問題発生状況の解析を 行っているのですが・・・・ とある時期に一斉に一つの仕様変更がなされ、現在発生が確認された物の製造時期を 仕様変更の前後に分けて分散分析を実施し、仕様変更の効果があるかないか 検討したいと思っています。 仕様変更の前後で発生数は大きく異なっています。 しかし、ある程度の時間をかけなければ顕在化しない問題のため、 (顕在化までの時間はまちまちです) まだ変更後のものは顕在化していないだけで内包されている可能性が高いです。 とりあえず対数正規分布になるようで、その標準偏差、平均も仕様変更前後で ぱっと見はあまり違いが無いように見えます。 ただ、件数が大きく違うため、山の高さが違うという感じです。 そこで分散分析を行って仕様変更の効果有無を判定しようと思ったのですが・・・ 以下2点質問です。 1.標本数が異なると分散分析はできませんか?  (「全体平均」と「条件ごとの平均の平均」が一致しない) 2.「まだ顕在化して無い」ようなものを内包している(これからでてくるのかもしれない)   ような現象に対しての分析方法として大きく間違っている、あるいは   こうしたほうが良いのでは?というアドバイスがあればよろしくお願いします。 統計は勉強を始めたばかりで・・・ 表現、語彙の選択が不適切であれば申し訳ありません。 どうぞよろしくお願いいたします

  • 科学
  • 回答数1
  • ありがとう数1

質問者が選んだベストアンサー

  • ベストアンサー
  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.1

1 ご研究は、一人でやっている。 さもないと指導者無視 2 外部に学会発表はしない。   さもないと謝辞などのマナー違反になるかも  上の条件を満たすなら、次の質問に応えて下さい。 1 問題の発生した、というのはどのように判断するのか。   基準値があって、それで判断するのか。   あるいは、ブザーがなるような仕掛けなのか 2 次の(  )を満たすことができませんか。   開始前  問題なしの数 ( )、問題ありの数 ( )    開始後  問題なしの数 ( )、問題ありの数 ( ) >以下2点質問です。 1.標本数が異なると分散分析はできませんか?  (「全体平均」と「条件ごとの平均の平均」が一致しない)   カッコ内は意味不明ですが、標本数が異なるのは、問題ありません。私の経験では、t-検定の対応のある場合です(理論的にあり得ない)。ただ、同数にした方が、有意差はでやすい。これは、同数にそろえろという意味ではなく、100匹のマウスを使うなどの場合は、50と50で実験した方が出やすい、という意味です。  データ数は、多ければ多いほど、差は出やすいのです。 2. 顕在化していない問題、というのは、統計学の想定外です。処理はできないと想います。  なにより、内包しているとの判断は、どのようにされたのでしょうか。実は、私も似たような問題で、頭を抱えています。

factory-second
質問者

お礼

1年近くもお礼が送れ、大変失礼しました。 上記、仕事の上での市場分析を行っていたため、回りに指導者や専門家がいない中だったもので、質問させていただいた次第でした。 kgu-2様に質問いただいた点を参考に再考してみましたが、やはりよくわからず・・・結果、この市場分析はそのままお流れになってしまいました。 ちなみに、内包している、というのは、製品である問題が発生するまでに2,3年の時間がかかる事がわかっており、その間にある現象が継続して累積していく事で、最終的に問題発生、となっているためです。 そのため、常に製品が生産されているならば、あと1年、あと半年・・・で発生するであろう問題予備軍が内包されているだろう、と言う意味です。 ご丁寧に回答いただいたにも拘らず、現実の方の処置に追われてほったらかしになってしまっていました。 大変失礼いたしました。 ご気分を害された事と思いますが、どうかご容赦ください。

関連するQ&A

  • 標本数の決め方

    整数10000個からなる母集団から5000個抜き出した標本の総和が500なら,母集団全体の総和は1000前後と推定でき,5000個の平均が500なら,母集団全体の平均も500前後と推定できると思います.このように総和は標本数に依存しますが,平均は標本数に依存しない性質があると思います.以下,操作Fは単なる平均ではないのですが,平均のように標本数に依存しない値を返す操作とします. N個のデータからなる母集団全体に操作Fを行った値をある誤差,ある信頼区間で推定したい場合,どのような考え方で標本数を決めればよいでしょうか.Fが単なる平均をとる操作,つまり母平均の推定の問題であれば分かるのでが,そうでない操作Fの場合についての質問です. よろしくお願いします.

  • 標本数が少ないときの検定の仕方

    まず、私が今、行おうとしている検定の仕方をご説明します。 1. 非常に時間のかかる測定結果が数件あり、そのうちの1件(標本A)が平均から大きく外れた値を示しています。おそらく測定時になにかの外乱があり、このような値を示したのでしょう。原因を追求するのは、困難なのでこの値をすててしまいたいところです。 2. そこで平均、分散、標準偏差を計算しました。*** 3. 標本が正規分布をなすことを仮定して、標本Aよりも大きな平均よりのずれを示す確率を正規分布確率表で確認したところ、16%と出ました。 4. と、いうことはそのような値が生じる確率は16%ある訳で、この値を捨てるのは適切ではない。うーん。残念。←今、ここ。 さて、お聞きしたいのは***の部分です。 今回の場合、この異常値・標本Aを平均、分散、標準偏差の計算に用いることで、大きくこれらの値が変わってしまっています。 たとえば、標本Aを取り除いた上で、平均、分散、標準偏差の計算を行ってみると、標本Aの値が生じ得る確率は0.04%になります。ということはなにか変なことが起こったんだろうね、ということでこの値は捨てていいことになると思います。 しかし、異常値かもしれない値を、最初から取り除いて(つまり特別扱いして)行う検定というのもなんだか、ズルをしているようで変な気がします。 このような計算の仕方(検定の対象となる異常値をあらかじめ除いて検定を行うやりかた)は統計上、正しい手順なのでしょうか? そもそも標本数が少ないときにはもっと別の手順で検定を行うべきなのでしょうか? なにぶん、素人なので定義に反した用語の使い方をしているかも知れませんが、何卒よろしくお願いいたします。

  • 標本平均値の確率の求め方

    平均50、分散10000の母集団からの100個の無作為標本に基づく標本平均値かま45を下回る確率 という問題が分かりません! エクセルは使うのでしょうか?? よろしくお願いします。

  • 標本のサンプルサイズ

    標本数20、標本分散s^2=10とする。 帰無仮説:s^2=σ^2、有意水準α=5%で検定する。 母分散σ^2=20である場合、帰無仮説が90%の確率で 棄却されるには標本数はいくつ以上にすればよいか? この問題がわからず困っています。資料を探してみたのですが、 正規分布に従う場合の母平均についてのサンプルサイズ決定法しか見つかりませんでした。考え方・計算法程度だけでも構いませんので、どなたか教えてください。

  • 正規分布からの標本

    正規分布からの標本 母平均・母分散・がわかっている正規母集団からある大きさnの標本を抽出したとき、どのようにして標本平均が存在する場の確立を求めるのでしょうか? 例えば、母平均μ=4、母分散σ^2=15の正規母集団から大きさn=10の標本を抽出したとき、標本平均Xが3と6の間にある確率は? という感じです。 また、この問題に付随して標準分散s^2がaを超える確率が0.05となるような定数aの値を求めよ。というときに、どのようにして定数aを求めるのでしょうか。

  • ANOVA(分散分析)の標本人数に関して

    標本人数の異なる4つのクラス 1)クラスA 50名 2)クラスB 70名 3)クラスC 40名 4)クラスD 65名  の「テストの平均点」を分散分析 してく思うのですが、標本人数が 違っても問題ないでしょうか?  

  • 標本数の求め方についての疑問

    標本数の求め方についての疑問 二つの問題があったのですが、 【例】ある工場で生産される製品の重さを無作為抽出した標本で検査したい。予備調査の結果、この製品の重さには約10(g)の標準偏差があることが分かっている。信頼度95%で誤差の範囲を1(g)以内で推定するには,標本の大きさを何個にすればよいか. (解答)誤差 =z・σ/√n  つまり、式は 1.96・10/√n=1 n≧= 384.16 … 385個   と書かれています。次に、 【1】母標準偏差30(g)である大量の玉葱から標本を無作為抽出する。母平均の95%信頼区間の幅(つまり、誤差の2倍)を3(g)以下で得るには,標本の大きさを何個にすればよいか。 (解答)誤差×2=z・σ・2/√n つまり、標本数を求める式は 1.96・30・2/√n=3 n≧1537個 とありました。 ここで疑問なのですが、なぜ【例】の問題では、誤差×2(z・σ・2/√n)ということをしないのでしょうか。統計初心者なので詳しく解説して頂けると助かります。

  • 標本平均と分散について

    こんばんは。先日もお世話になったshingetsuです。 今回また数学でわからない問題があったのでアドバイスをいただきたく、質問させていただきました。よろしくお願いします。 今回、標本平均とその分散について勉強しているのですが、確認問題をしているところ、わからない公式(?)がでてきたのです。 問題の中でE(m)=μ、E(s2乗)=σ2乗を例題を用いて証明しているのですが、この問題でV(s2乗)=σ2乗という始めてみる式が登場し、成り立つか証明しなくてはいけないのですが、このVとはなんでしょうか?これは標本分散と母分散の何を成り立たせる式なのでしょうか? よろしくお願いします。 また、質問内容に不備がありましたらご指摘お願いします。

  • 標本平均、分散、期待値・・・混乱しています。。。

    統計の勉強をしていますが、 標本平均、分散、期待値とたくさん用語が出てきて、計算の仕方も混乱しています。 まず、標本平均x’(’は上の棒線) の期待値E[x']とは何を表しているのでしょうか? E[x]=npとの違いは?  pは確率 nは個数? あと、標本平均の分散V[x']=σ^2/nと 分散V[x]=npq  の違いが解りません。 i番目のV[xi]やE[xi]と言うのも出てきて更に混乱しています。 問題によって表し方が違うのでしょうか?

  • 標本数をもとめる問題が解けません。。

    √n(Xバー-μ)/σが標準正規分布に従うことを利用すると、信頼係数95%、E=|Xバー-μ|としてn≧(1.96/E)^2×σ^2を得る。 いま、学生の突き当たり小遣い額を(5,000~30,000)の区間にあるものとして、平均的な月当たり小遣い額を±3,000円の誤差で調査するためには、標本数は最低どのくらい必要か? という問題が解けずにいます。 どなたか分かる方がいらっしゃいましたら是非教えてください。 よろしくお願いします。