- 締切済み
【統計】データの信頼度
ある実験を行います。 1回だけでは、信頼性に欠けるので、複数回行います。 たとえば、実験を、n回行い、以下のような結果が出たとします。 1回目 3.532532 2回目 3.542352 3回目 3.864845 4回目 3.754677 5回目 4.001333 ・ ・ ・ この時、n回の結果の平均をとることにしたいのですが、このnをどのように定めれば、十分信頼できるデータとなるのかを教えてください。つまり、何回、実験を行えば良いかです。 もちろん、nは大きいに越したことはないと思いますが、1回の実験に要する時間が非常に大きいため、ある程度のところで妥協する必要があります・・・。 また、上記はあくまでも例ですので、一般的な法則?みたいなものが、あれば教えて下さい。 よろしくお願いいたします。
- reine1
- お礼率76% (83/109)
- 数学・算数
- 回答数4
- ありがとう数1
- みんなの回答 (4)
- 専門家の回答
みんなの回答
- takurinta
- ベストアンサー率71% (64/90)
一般論はありません。「十分信頼できる」を自ら定義して、それに必要な回数の測定を繰り返すしかないです。 誤差の大きさが事前に分かっているなら、平均値の誤差については測定回数をnとすると、元の誤差のおよそ1/√n倍になるので、平均値の信頼区間が適当な範囲に収まるようにnを決められますが、それが分かっていないなら、パイロット的に何度か測定して分布や誤差の大きさを見積もってから、本番に取り掛かるしか手はないです。 同様の測定をしている文献をサーベイして分布や誤差の大きさを見積もるところから始めるのが、一般的には最初のステップになるかと思います。
- 佐藤 志緒(@g4330)
- ベストアンサー率18% (840/4653)
少ない回数で、効率よく、誤差の影響を排除して、実験したいなら実験計画法を勉強してください。
- nekonynan
- ベストアンサー率31% (1565/4897)
実験は多くの誤差がるから統計で処理できません 温度変化などで誤差が変化しますから・・・・・・
- 佐藤 志緒(@g4330)
- ベストアンサー率18% (840/4653)
統計の話は複雑ですが、大雑把に十分信頼できると言えるのはn=50からです。
補足
回答ありがとうございます。 詳しく教えて下さい。
関連するQ&A
- 統計学的に信頼のあ有効率は、全体の何%あればよいか
こんにちは。 表題の件ですが、自分が知りたいのは 例えば、100人に「ゲームのマリオが好きかどうか」のアンケートを取り その中の有る一定の割合(例えば30%とか)でサンプルデータとして無作為に抜き出して その結果を全体の結果として結論付けたい場合 一定の信用度がある状態というのは、抜き出す割合が何%程度あれば 満たせるのでしょうか。 上記の例ですと、例えばデータの信頼度を80%とするには 抜き出すデータを30%が必要、など。 もちろん、アンケートの対象者によって ゲームについての質問の場合、 ・小学生男子に聞いたケース ・お年寄りも含めて聞いたケース では、意味も信頼度も変わってくるでしょうが、 「一般的に」という意味で構いませんので、 全体の何割があると信頼がおけるのか、というのを知りたいと思います。 もしお教えいただけるのであれば できればその事例の根拠や事例など、併せて教えてもらえると助かります。 よろしくお願いいたします。
- ベストアンサー
- 数学・算数
- データの整理と平均値のまとめ方
よろしくお願いします。 現在、実験を行っており、データの整理をしているのですが、まとめ方で困っているので質問させていただきました。 9000ほどの母集団から100個取り出し、帯電量測定をします。正規分布であることを確認し、同じ実験を3回繰り返します。 このような実験を数種類行い、どのように変化したか(平均帯電量やバラつき具合など)を報告しようと思っています。 ところが、この実験はばらつきが大きく、サンプリングの計算をすると100個では平均の誤差(平均と標本平均の差)が大きくなっていしまいます。 100個以上の測定では大幅な時間がかかり実験としても成り立たず、効率が悪くなるため、また、他の数種類の実験結果との比較のために同じ100個で統一するために、100個で行いました。(100個でも誤差が大きくなる、というだけの話なので問題はないと思います) ですが、同じ実験を3回行った結果について疑問点が出てきました。 実験から得られた標本平均Xbarと標準偏差σを、 Xbar-k*√(σ^2*(N-n)/n/(N-1)) < μ < Xbar+k*√(σ^2*(N-n)/n/(N-1)) (信頼係数K、母集団N、標本数n) の式に用いて平均の範囲を出せると思います。(誤差が大きいということはこの範囲が大きくなるということですよね) 同じ実験を行って誤差の違い(平均μから近いか遠いか)はあれど、平均μの値はかならずどの実験でも範囲内に入るはずですよね。 ですが、3回行った実験のうち、範囲が重ならない結果(重複する範囲がない)が出てきました。3回すべて重ならなかったり、2個だけ重なって残り1個は重ならなかったりしました。重なれば少なくともその範囲に平均μがあると思っているのですが・・・ 最初はこの3回行った同じ実験でそれぞれ得られた平均の範囲から平均の範囲をある程度決められるかなと思っていました。(誤差が大きくても) 原因として何が考えられるか考えたのですが、 1. 3回の実験のうち、測定中に触ったり何かしてちゃんと測定を行えなかったなど何らかの影響でちゃんとしたデータではない実験があるため。 2. 実は同一条件ではなかった(異なる実験扱いで比較できない) どのようにデータをまとめていいか困っています。すべてのデータを載せるのも要領の関係で難しいので、まとめたいと思うのですが・・・ 自分の統計の勉強不足なのでしょうか。 それか、Xbar±3*σで範囲を決めようかとも迷っています。 何か「ここは間違ってるよ」とか「こういう風にしたら?」などありましたら書き込んでいただけないでしょうか? わかりづらい質問でお手数おかけしますが、ご教授いただけますでしょうか。 よろしくお願いします。
- ベストアンサー
- 物理学
- データ間に差がないことを統計的に述べるには?
データ間に差がないことを統計的に述べたい場合,どのような検定手法を実施すればよいのか? ということで,悩んでいます. 例としまして,以下のような条件で実験を行い,実験の結果を統計的にみて差がない(差がみられない?)と述べたい場合,3要因の分散分析を実施すればよいのでしょうか?御教示・御助言よろしくお願いします. 例) 2つの異なる六面サイコロ(サイコロA,サイコロB)を,朝昼晩に600回ずつ振り,サイコロの目を記録した. この結果をもとに,何らかの統計手法を実施し,サイコロAとサイコロBに差がないことを述べたい. 私の予想では3要因の分散分析を行い,有意差が見られなければ,2つのサイコロに差がない(差がみられない?)といえる,と予想しているのですが誤っていますでしょうか?
- ベストアンサー
- 数学・算数
- 統計学≪信頼区間の幅≫の問題。
統計学≪信頼区間の幅≫の問題。 母分散σ^2=9の正規母集団から大きさnの標本を抽出して母平均μの信頼係数99%の信頼区間を求めたい。その幅を1以下にするにはnをいくつ以上にすべきか。 という問題です。 excelでどれを使っていいかわからないし、手書きで途中の説明も加えよ、ということなんです。 excelのものをどう手書きで途中を加えればよいでしょうか。 答えも含めて解説していただけるとありがたいです。 よろしくお願いいたします。
- ベストアンサー
- 数学・算数
- データの処理について
実験結果(滴定量)から標準偏差を出し、信頼区間(信頼限界)をもとめたんですが、信頼区間の領域が広いという事は何を意味しているんでしょうか?? 信頼区間の式は下記です。 μ=平均値±ts/√n
- 締切済み
- 生物学
- 平均値を求めるための統計的な最低データ数
FXという投資での話なんですが、統計的なというか信頼性が高い平均スプレッドと平均スワップを求めたいのですが、最低どの程度のデータ数が必要なんでしょうか? スプレッドは、買値と売値の差のことで、簡単に言うと手数料のようなものです。 基本的には、土曜日の大部分と日曜日以外は24時間動いています。 そのスプレッドを記録する方法があるのですが、秒未満単位で記録されます。 そして、1日当たりの平均スプレッドを表示できます。 イレギュラーな数値もあるのですが、それを含めてもわずかな時間のため含めても構わないと思います。 スワップは、金利のようなもので1日ごとに変化します。 これはそれほど変化がないように感じます。 そこで、1日当たりの平均スプレッドを1つのデータとし、信頼性が高い(統計的な)平均スプレッドを求めるために最低どの程度のデータ数が必要でしょうか? また、1日のスワップを1つのデータとし、信頼性が高い(統計的な)平均スワップを求めるために最低どの程度のデータ数が必要でしょうか? もちろん、データ数が多ければ多いほど信頼性が高くなるのは分かりますが、最低どの程度のデータ数があればいいのか知りたいです。 平均スプレッドと、平均スワップを求めるために、それぞれ最低どの程度データ数が必要か教えてください。 回答よろしくお願いします。
- ベストアンサー
- 数学・算数
- 統計学 データ 正規化 標準偏差 平均
現在あるデータを正規化することを考えています. 状況を,簡単に説明します. あるデータ集合A(A(0)~A(n)⊆A)があるとし,その平均をμ(A),標準偏差をσ(A)とし, Aを正規化したデータをNormalized(A(n))とすると,正規化を表す式は以下のように, Normalized(A(n)) = (A(n) - μ(A))/σ(A) となると思いますが, 上記の正規化式を以下のようにすることは統計的に正しいのでしょうか? Normalized(A(n)) = (A(n) - μ(A))/σ(A) *2 Normalized(A(n)) = (A(n) - μ(A))/σ(A) *3 私としては,データには実際は,大きく平均から大きく離れた数値があることもあるため, この方がよりデータとしては-1~1にまとまるので,良いように感じるのですが.
- ベストアンサー
- 数学・算数
- 統計学の質問なんですが・・
ある問題で 1)正規母集団N(μ.0.25)からn=25のランダムサンプルを検出し。 x*=18.26(平均の意)を得た。母平均95%信頼区間を求めよ。また、90%信頼区間を求めよ。 2)ある製品の検査の所要時間は正規分布すると言われている。大きさのランダムサンプルについて 12.4 13.5 12.7 14.1 13.8 14.1 12.0 12.87 13.1 15.4 のデータを得た。母平均95%の信頼区間を求めよ。 について分かる方がいらっしゃれば教えてください。お願いいたします。
- ベストアンサー
- 数学・算数
お礼
回答有難う御座います。 申し訳ありません。 言葉を誤りました。 実験ではなく、測定とします。 多少、統計学的な話があっても大丈夫です。 どうか、お願いいたします。