• ベストアンサー

棄却検定できないかけ離れた値の扱いについて。

X線回折実験でKClを測定し、波長を決定する途中でわからないことがあったので質問させてください。 全部で8つの2θを得ました。 それぞれについて波長を計算し、平均値、標準偏差を求めました。 そして、99%信頼限界(平均値±(t*標準偏差)/n^1/2)を求めたら、 8つのうち3つがその範囲外の値になってしまいました。 波長を求めているのでそれほど大きな差は無いのですが、 一応のため棄却検定も行いましたが、結果は棄却できず。。。 このような時、99%信頼限界の範囲外の値についてどのように考えればよいのでしょうか? 範囲外の値が正しいかどうか、まともかどうかの判断はどのようにすれば良いのでしょうか? 最後にもうひとつ。 平均値±標準偏差には全測定値の68.3% 平均値±2*標準偏差には95.5% 平均値±3*標準偏差には99.7%が存在している というのは、99%信頼限界とどのように違うのですか? 最終的に波長はこうだ!と決定するとき、上記の表し方ではダメなのですか?

質問者が選んだベストアンサー

  • ベストアンサー
  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.2

 8つのデータから平均と標準偏差を計算した。で、8つのデータそれぞれについて、平均との差をとってみたら、標準偏差の何倍も離れたデータが3個も入っていた。ぬわんじゃ、こりゃー!! ということですね。  この事からまず言えるのは、「これらのデータは、データから算出した平均値mと標準偏差σで決まる正規分布に従ってはいない」ということです。というのは、帰無仮説「これらのデータは、データから算出した平均値mと標準偏差σで決まる正規分布に従う」を考えると、8個中3個ものデータがそんなに離れた値になる確率は極めて小さい。だから、この帰無仮説は(ごく僅かな危険率で)棄却されます。  しかしながら、データがおかしいということには必ずしもならないし、データが正規分布に従っていない、と断定することもできません。なぜなら、たまたま8個中5個のデータが互いにものすごく近い値だったために、標準偏差が実際の分布よりうんと小さく算出されたのかも知れないでしょ。  少ない個数のデータから推定した平均値・標準偏差が真の平均値・標準偏差からどれだけずれうるか、という「平均値や標準偏差の推定誤差」を考慮するにはt分布、F分布を利用します。ここで説明するのはかったるいので推計学の教科書を見てください。  一方、X線回折実験では、始める前に誤差の分布(標準偏差も含めて)が理論的に予想できるはずです。(ってか、誤差の予想の計算をしないで実験するのは、本来おかしいんですけどね。)で、その予想値を使って検定をやったらどうなりますでしょうか。

全文を見る
すると、全ての回答が全文表示されます。

その他の回答 (2)

  • usokoku
  • ベストアンサー率29% (744/2561)
回答No.3

20年ほどやっていないので、変な内容になってしまうかもしれません(数学の進歩が早いので)。 8つの値から3つを棄却する、なんて検定あったのかしら。両側に1個とか、片側二個ならば棄却検定できるのですが。 試料台の設定の仕方の関係で、同一方向へほぼ同じ角度ずれることがあります。この補正は可能ですか。 今の機械ですと、粉末法でしょう(写真フィルムを現像して、、、なんてやっていたら示された数値が出ないと思いますので)。すると、はいこうせいの問題があります。なれない方ですと、へんなはいこうせいがでて特定のピークか小さくなったり、ブローになったり、非対称性(隣接ピー四区に注意、KCLの数値を覚えていませんので)になったりします。はいこうせいを確認してください(各ピークがどの面になっているか、面同士の関係から誤差が導けないか)。 フィルムを使った場合、SとかMとかの数量化をどう使っていますか、数量化の影響が強く出てしまうのですが。 強度をCPSで使っている場合には、測定精度を確認してください。X線はまともにやって5%の精度があるかにいか、1%の精度を得るにはかなり苦労しますから(機械が新しい場合は改善されているかもしれません)。

全文を見る
すると、全ての回答が全文表示されます。
  • goma_2000
  • ベストアンサー率48% (62/129)
回答No.1

信頼限界は平均値の信頼区間のことです。 平均値が含まれる範囲をあらわします。 これは、点推定ではなく区間推定を行なっているということですね。 平均値±標準偏差のはなしは、(正規分布を仮定すれば) データはその範囲にその確率で含まれるという話です。 データの範囲と平均値の範囲の違いですね。 ここを混乱しているのではないでしょうか。 平均値の信頼区間の方が当然小さいので、 棄却されなかったのならデータがその中に含まれなくても 気にしなくて大丈夫です。 区間推定、信頼区間などでぐぐって見てください。

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • 棄却域の求め方について

    統計学の問題 多くの人口を持つある都市の中学一年生に平均50点になるようなテストを一斉に行った。その生徒から100人を任意抽出したところ平均点が52.2標準偏差値は10.5だった。(全受験生の得点平均は50点である)という仮説を全受験生の平均点をμとして検定する。 優位水準は0.05におく。 (1)帰無仮説Ho対立説H1をあらわせ。 (2)検定領域の棄却域をもとめよ。 (3)データから検定統計量の実現値をもとめよ。 (3).(4)の検定の結果Hoは棄却されるか? という問題がわからず悩んでいます教えてくださるかたいたらどうぞよろしくお願いします。

  • t検定の棄却域について

    t検定の棄却域について 現在t検定について勉強していまして、演習問題で訳が分からなくなったので質問させていただきます。 問題としては 次のデータは平均値が5.333である集団から抜き出したデータである。このデータの平均が母集団の平均と一致しているかどうか、t検定を用いて有意水準を5%として確かめよ。ただしデータは正規分布に従う。 データ:8,9,6,10,12,8,7,9 というものなのですが実際にこのデータについていろいろ計算してみたところ 平均値8.625、分散3.411、標準偏差1.847、自由度7、t値5.042となりました。 両側検定で棄却域を考えました。 しかしそれの設定の仕方がわかりませんでした。 まずExcelのTINV関数で求めてみたのですが2.365となり、(u<=-2.365 && u>=2.365)が確率5%の領域としました。 これは例題を参考にして求めてみました。 しかし例題と違ってこの問題には正規分布に従うという条件が付いていたので http://www.kwansei.ac.jp/hs/z90010/sugakuc/toukei/kihon0/basic0.htmを参考に正規分布で考えてみたところ 正規分布で5%になるためにはz=1.96で、さらに問題設定からμ=5.333、σ=1.847としてuを求めると u=8.953となりました。 そのため(u<=-8.953 && u>=8.953)が確率5%の領域としました。 t分布で考えるとt値>棄却域となり 正規分布で考えるとt値<棄却域となってしまいました。 ここで混乱し始めたのですが、問題設定どおり正規分布で考え、帰無仮説を棄却できないという結論(抜きだしたデータの平均値は母集団の平均値と一致しないとは否定できない)でよろしいのでしょうか? 長文となりましたがよろしくお願いします。

  • 棄却後の平均の求め方(エクセル)

    例えば、5つの数字があります。 A1:0.1、A2:0.6、A3:0.2、A4:0.3、A5:0.4 平均「AVERAGE(A1:A5)」は0.32になります。 標準偏差「STDEV(A1:A5)」:0.19を求め(σ:シグマ) 平均±σの範囲内にある値の平均を求めたいと思っています。 つまり「平均-σ:0.13~平均+σ:0.51」の範囲内にある数字の平均です。 求めたい結果は、A3:0.2,A4:0.3,A5:0.4の平均で0.3となるのですが、 これらを自動的にマクロか何かで計算させる方法はあるのでしょうか? (「ある範囲内にある数字を平均化」又は「ある範囲外の数字を棄却して平均化」) ご存じの方教えて下さい。 宜しくお願いします。

  • スミルノフ-グラベス棄却検定、両側検定について

    現在必要にせまられ、 スミルノフーグラベスの棄却検定を勉強しています。 有意点tの求め方について、わからなくなりました。 調査していると 有意点tを求める際のt分布で 両側検定を採用しているものと、片側検定を採用しているものとが あるようです。両者で有意点がやや異なるのですが。。。 このような棄却検定で、両側検定を行う意味がよくわかりません。 たとえばn=5で、3、3、3、3、14というデータ群があった場合 14は、あきらかに平均値より高い値のはずです。 つまり、棄却検定を行う場合は 「上側確率」あるいは「下側確率」が対象であることがはっきりするはずで、両方を含めて検定する必要性が感じられないのです。 棄却検定に両側検定を適用する意味があるのでしょうか。 統計に明るくなく、素人くさい質問ですみません。 もしよろしければ、詳しい方、おしえていただけませんでしょうか。

  • これはどういう意味ですか(泣)

    帰無仮説 2つの標本の平均値は等しい。 標本数1 6 平均値1 8.46 標準偏差1 4.002 標本数2 6 平均値2 21.82 標準偏差2 8.145 有意水準 0.05 検定方法 両側検定 F値 4.14217085610118 確率 0.0724572476022886 t値 3.60605002946898 確率 0.00479946268108932 自由度 10 結論 等分散の仮定は棄却されませんでした。 帰無仮説は有意水準 0.05 で棄却されました。 自由度 10 におけるPの値は 0.00479946268108932 です。 ある実験の前後の統計を出したいので、統計ソフトで計算した結果、よくわからない言葉が出てきてしまいました(泣) ちなみに標本数・平均値・標準偏差1が実験前で、標本数・平均値・標準偏差2が実験後の結果です。 5%有意差があるかないかを調べたいのですが・・この結論の日本語がよくわかりません。 どなたか詳しく説明していただけませんか。 バカですみません。

  • 標本数が少ないときの検定の仕方

    まず、私が今、行おうとしている検定の仕方をご説明します。 1. 非常に時間のかかる測定結果が数件あり、そのうちの1件(標本A)が平均から大きく外れた値を示しています。おそらく測定時になにかの外乱があり、このような値を示したのでしょう。原因を追求するのは、困難なのでこの値をすててしまいたいところです。 2. そこで平均、分散、標準偏差を計算しました。*** 3. 標本が正規分布をなすことを仮定して、標本Aよりも大きな平均よりのずれを示す確率を正規分布確率表で確認したところ、16%と出ました。 4. と、いうことはそのような値が生じる確率は16%ある訳で、この値を捨てるのは適切ではない。うーん。残念。←今、ここ。 さて、お聞きしたいのは***の部分です。 今回の場合、この異常値・標本Aを平均、分散、標準偏差の計算に用いることで、大きくこれらの値が変わってしまっています。 たとえば、標本Aを取り除いた上で、平均、分散、標準偏差の計算を行ってみると、標本Aの値が生じ得る確率は0.04%になります。ということはなにか変なことが起こったんだろうね、ということでこの値は捨てていいことになると思います。 しかし、異常値かもしれない値を、最初から取り除いて(つまり特別扱いして)行う検定というのもなんだか、ズルをしているようで変な気がします。 このような計算の仕方(検定の対象となる異常値をあらかじめ除いて検定を行うやりかた)は統計上、正しい手順なのでしょうか? そもそも標本数が少ないときにはもっと別の手順で検定を行うべきなのでしょうか? なにぶん、素人なので定義に反した用語の使い方をしているかも知れませんが、何卒よろしくお願いいたします。

  • t-検定は元データがなくても検定可能ですか?

    ある理由で、その実験の生データが現在手元にありません。 手元にあるデータはその実験における、n数、平均値、標準誤差、標準偏差 しかありません。このような状況で2群についてt-検定を行うことは可能でしょうか? 申し訳ありませんが回答よろしくお願いします。

  • マンホイットニーのU検定について教えてください。

    過去の論文と今回私たちが測定した結果との間に有意差があるかを知るために、検定を行いたいです。測定した値が等分散を示さないだろうから、studentのt検定を使用するのは不適切だろうとのご指摘を受けました。 そこで、マンホイットニーのU検定を使おうかと思うのですが、過去の論文で分かっているデータが平均値と標準偏差のみなのですが、マンホイットニーのU検定を行うことは可能なのでしょうか?ちなみにデータ数(n)は私たちが30、過去の論文は18です。 統計学は正直、初心者です。 ご教授ください。

  • 実験精度の検定について

    熱電対温度計というものを用いて液体の沸点を測定する、という実験を行っているのですが、測定条件や環境を変化させた際に温度計の精度が変化します。温度計の精度が良くなった、または悪くなったということを論理的に言うために統計的な処理をしなければならないのですが、各測定条件におけるデータ群のどういった点を比較すればよいのでしょうか?標準偏差や平均値、有意差検定をどうのこうの・・・とするらしいのですがいまいちピンと来ません。誰かアドバイスお願いします。

  • SPSSでのt検定の仕方

     SPSSを用いて、過去のデータと測定値を2つの母平均の差の検定を行いたいのですが、過去のデータは平均値、標準偏差、N数しか分かりません。どのようにしたらよいでしょうか?