• ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:Excel2000でのT検定について 統計)

Excel2000でのT検定について 統計

zinchanの回答

  • zinchan
  • ベストアンサー率49% (97/197)
回答No.2

 早速のご挨拶、恐れ入ります。  さて、お礼の項3~4行目のことについて、一言申し上げたく、再度おじゃまします。  抽出したデータを、何の原因解明もせず、また、数学(統計)的な検討も行わず、棄却してしまってはいけません。  十分精査して、なぜ外れ値が生じたのかをひもといてみなければいけません。  例えば、抽出条件や環境条件が異なっていたとか、余計な反応をさせてしまったとか、もしくは複数の異なる母集団からとったものかもしれないですし、記載間違いであるかもしれません。  それらを検討して、原因を探ってください。原因が判明すれば訂正できるものは訂正して、そうでなければさらにスミルノフ・グラブス検定で外れ値を棄却してよいものかを検定し、なるべく慎重的に棄却してください。  それらを検討せず、都合の悪そうなデータを棄却してしまうくらいなら、再抽出して新たにデータを揃えるようにして下さい。  再度そういうことが見られるようであれば、場合によっては、その外れ値は何か意味があり、とんでもない発見になるかもしれないのです。  あと、同条件と仮定できる場合において抽出されたデータを分けて検定するのは意味がありませんし、いけません。  例えば、正規分布している1つの集団において、それを平均より高いものと低いものに分けて検定する意味がありますか。もしくはデータの外れ値と、そうでないものとを比較することに意味がありますか。検定すれば有意差が出ますが、その有意差に何の意味があるのでしょう。  具体的に例えば、全く同じ環境条件で大根を栽培したとき、肥料の多少による2つの群の収量の差を検定することは意味がありますが、大根の特に大きいもの2本と、その他の大根を比べることで、何が得られるのでしょう。大きい大根は他の大根に比べて有意に大きかったか否かと言うだけで、そこから肥料の多少による効果を判断することができないのと同じ事です。  なお、当初抽出したデータに、改めて新たに抽出したデータを加えて(合算して)検定しては行けません。  なぜなら、当初抽出したときと、改めて抽出したときでは、たとえまったく同じ条件に設定したつもりであったとしても経時的には別の試験であり、細かく言えば、改めて行った抽出法は、まったく同じ条件を保っているとは言い切れません。たとえ話が同じでは芸がないので、魚の成育調査で例えると、人工環境施設で、前回と同じ条件による餌条件、水温で成育したつもりでも、餌の質まで全く同じか、水温の分布範囲が前回と全く同じかとは言い切れないでしょう。  いっときに多数揃えて同時に調査すれば、それらの条件は全く同じと言っても良いですが、時期を変えての調査はあくまでも別の試験として捉えねばなりません。  実験や調査では、事前にサンプル数の確保目標数や、検定法をあらかじめ決めておき、それから実験・調査に移り、必要なサンプル数がとれてから、当初の検定法で検定し、有意差を見、十分な検討を行った後に効果を判定し、結論を得る流れで行います。  統計の検定法は、極めて多数のデータを集めれば、有意差がだんだん出やすくなってしまうため、有意差が出るまでデータを集めるとかも、ルール違反です。  よって、通常は予備実験(調査)を行って後、必要サンプルを集め、本実験(調査)に入り、データを得、検定するというようにしなければ、信頼に足る結論を導き出すことができません。  検定とは、実験(調査)前から検討して始めておかねばならないものです。  あと、何かを抽出するときに最も大事で、大変なことがあります。  それは、無作為(ランダム)に抽出(設定)するということです。つまり、母集団からむらなく抽出することが、全ての実験・調査、全ての検定法における大前提です。これができてないと、実験・調査自体が無意味なものになります。  実験における無作為配置や乱塊法・調査地点のランダム抽出、世論調査の2段階層別抽出など、信頼性を高めるための最適な手段を選択して、抽出するよう心がけていただけますことをお願いいたします。  頑張ってください。

araiguruma
質問者

お礼

再度迅速な助言ありがとうございます。おっしゃるとおり、ランダムな検体の選抜が不充分だったと思います。外れた値を呈した原因もわかっておりますので、それを盛り込み再度実験を行いたいと思っております。大変参考になる助言ありがとうございました。  なお、またまた質問して申し訳ないのですが、以前某研究所にて動物実験を行い、その臓器のデータ処理を手伝いました。その際に2検体程データを除いた記憶がございます。検体数は100位あったのですが、この場合、動物なので様々な相互作用があるので、元々病気であったとか、測定ミスである可能性が高いということで、除くよう指示されたように記憶しております。その2検体を除いた結果、有意差がでました。このような場合はやはりデータに絵心を加えたことになるのでしょうか?

関連するQ&A

  • t検定分析について

    まず、私の質問を見ていた方にお礼を申し上げます。 ありがとうございます。 Microsoft Excelの分析ツール使用しています。 『t検定 : 一対の標本による平均の差の検定分析』を使用して有意差を見たいと思っています。 このツールを使用すると『P(T<=t) 片側の値』と『P(T<=t) 両側の値』の2つが出てくるのですが、どちらを参考にすればいいのでしょうか? 検定の有意水準は0.05を使用しています。 まだ、統計に関して初心者なのでご指導よろしくお願いします。

  • 対応のあるt検定の結果の見方

    下記のような結果が出ました。 ・統計的に有意かどうかを見るには、どこを見ればいいんですか? ・それ以外の項目はどのように見たらいいんですか? ・論文には、どのように書くんでしょうか? 教えてください。 t-検定 : 一対の標本による平均の検定ツール 変数 1    変数 2 平均 0.961538462 0.935897436 分散 0.037462537 0.060772561 観測数 78      78 ピアソン相関      0.219838047 仮説平均との差異 0 自由度 77 t 0.81473499 P(T<=t) 片側 0.208868395 t 境界値 片側 1.664884621 P(T<=t) 両側 0.41773679 t 境界値 両側 1.991256795

  • 統計学 プログラムの処理計測データのt検定

    t検定、平均の検定についてです プログラムの処理計測のデータ100個取りました。 同じ計測プログラムでデータを取ったので 対応があるt検定とみて、 取ったデータをエクセルで一対の標本による平均の検定 を行なったところ、一番下のようになりました 質問は(1)、P(T<=t) 両側の値が0に近い値となっているのですが この場合 帰無仮説(H0):「2群間に差がない」と仮定する。 対立仮説(H1):「2群間に差がある」と仮定する として、P(T<=t) 両側 1.8672E-171 ---------(1)<0.05 より2つの母集合の平均値に有意差があると判断できる と考えてよいのでしょうか? t-検定 : 一対の標本による平均の検定 有意水準α=0.05 変数 1 変数 2 平均 1321.87973 293.041754 分散 42.3286546 368.4568926 観測数 100 100 ピアソン相関 0.04224447 仮説平均との差異 0 自由度 99 t 514.2684974 P(T<=t) 片側 9.3362E-172 t 境界値 片側 1.660391157 P(T<=t) 両側 1.8672E-171 ---------(1) t 境界値 両側 1.9842169

  • ●excelのt検定の結果確認方法

    レベルの低い質問ですが、宜しくお願いします。あるサンプルを5回測定したデータの平均値と1回測定のデータで差があるかないかを調べるために、excelの分析ツールよりt検定を行いました。が、t検定自体いまいちよく解かっていません。有意水準を5%とし両側検定で考えます。t 境界値 両側(2.045229611)>t(0.296893746)であれば、「差がない」といえると思いますが、その差がないと言える確率は下記表のどこでわかる(もしくはどう計算をすれば、確率を出せる)のでしょうか? すみませんが宜しくお願いいたします。 t-検定 : 一対の標本による平均の検定 変数 1      変数 2 平均 0.358166667 0.358133333 分散 1.24713E-06 9.47126E-07 観測数 30 30 ピアソン相関 0.83550416 仮説平均との差異 0 自由度 29 t 0.296893746 P(T<=t) 片側 0.384331892 t 境界値 片側 1.699126996 P(T<=t) 両側 0.768663784 t 境界値 両側 2.045229611

  • 統計解析 相場分析 T-検定 エクセル SPSS

    2つの母集団の平均差に有意差があるかを調べるためエクセルでT検定をしましたところ、ある異変に気づきました。 メニューの「ツール>分析ツール」で等分散を仮定した2標本による検定を選ぶと、"配列1"と"配列2"に各々の集団を入れることになります。ところが、それぞれの欄に入れる集団の順番を入れ替えると両側有意確率が.05以下だったものが、.05以上になってしまい、有意差の有無の結果が間逆になってしまいます。 分析の概要は以下のとおりです。 (F検定で等分散は確認済み) 標本1: 火曜日を除外した某先物の寄値-引値の価格差(デイトレードの成績) サンプル数→489個 (期間'00-'07年。母集団のサンプルは1970個) 平均値:647 標本2: 火曜日だけのデイトレ成績 サンプル数→88個 (期間'00-'07年。母集団のサンプルは1970個) 平均値:3215 2つの集団の平均差:2568 ****************************** 分析結果にみられる矛盾 >>>>>>>[標本1]を配列1にすえた場合<<<<<<< t-検定 : 等分散を仮定した2標本による検定 かよう以外 かよう 平均 646.8844483 3214.899617 分散 201365586.2 157505681.3 観測数 489 88 プールされた分散 194729391.9 仮説平均との差異 2568 自由度 575 t -3.178472095 P(T<=t) 片側 0.000780042 t 境界値 片側 1.647508725 P(T<=t) 両側 0.001560084 t 境界値 両側 1.964099283 >>>>>>>>[標本2]を配列1にすえた場合<<<<<<< t-検定 : 等分散を仮定した2標本による検定 かよう かよう以外 平均 3214.899617 646.8844483 分散 157505681.3 201365586.2 観測数 88 489 プールされた分散 194729391.9 仮説平均との差異 2568 自由度 575 t 9.38710200484845E-06(質問者が換算→0.00094%) P(T<=t) 片側 0.499996257 t 境界値 片側 1.647508725 P(T<=t) 両側 0.999992514 t 境界値 両側 1.964099283 ************************  以上のようにT値のあたい自体もかわってしまうのです。本で計算式を調べても違いは出ないはずなのに(統計初心者です。まちがってたらゴメンナサイ)どうしてでしょうか。サンプル数もしくは平均値の大きさによって、配列1,2に入れる順番を変えるべきなんでしょうか。おそらく右側検定とか、左側検定とかの概念と関係しているのかもしれませんが、本やネットで調べても判然としません。  ちなみに月、火、水、木、金と曜日別に成績をわけ、SPSSで一元配置の分散分析(ANOVA)、Welch検定, Brown-Forsythe検定, ボンフェローニの多重比較表でも確認したところ、曜日間に有意差はみられませんでした。  どうしてエクセルでは、配列の順番により結果が変化するのか、どなたさまかぜひ教えてください。統計初学者なので、珍妙なことを申し上げてるかもしれませんが寛大なご教示のほどよろしくお願いいたします。

  • t検定について教えて下さい(Excel)

    質問内容をご覧頂いてありがとうございます。 どちらか一方でも回答いただけると幸いです。 質問1 t検定:等分散を仮定した2標本による検定を行なおうとしたところ、「仮説平均との差異」を入力する欄が出てきます。この欄はどういった場合に入力するのでしょうか?それぞれの標本の平均の値は0.654と0.695なのですが、その差の0.041を入力するのでしょうか?それとも0を記入し、帰無仮説として平均が等しいとして、有意な差がでたならば帰無仮説は棄却できる(つまり平均は等しくない)といえるようにするのでしょうか? 質問2 t検定:等分散を仮定した2標本による検定を行ったところ(仮説平均の差異の欄には0を記入)、P(T<=t) 片側とP(T<=t) 両側の値がそれぞれ3.4E-13、6.80E-13という値になりました。このE-13の意味がわかりません。どういう意味なのでしょうか? わかりづらい文章で申し訳ありませんが、よろしくお願いします。

  • t検定について教えてください

    エクセルの分析ツールを用いて、t-検定: 等分散を仮定した2標本による検定 を行いました。 結果で、P(T<=t) 両側 に 6.82420809647282E-07 と出てきました。 この数字の中に、E が表示されていますが、 Eは何を意味しているのでしょうか?

  • 【統計】T検定の有意確率

    SPSSを用いてデータの男女差を見るためにT検定を行いました。 結果,有意確立(両側)が「.000」となったのですが, これは,男女差が有意でないと見てよいのでしょうか?

  • 統計学のF検定、T検定、有意差について

    統計学のF検定、T検定、有意差について教えてください。 ●F検定…分散の有意差を求める検定。有意差がない=等分散 ●T検定…等分散なデータ同士の有意差を求める検定 F検定を行う→等分散であればT検定を行える 【例】 データA、B、CについてF検定を行う。 データA、B間に有意差なし。その他の間には有意差あり。 よってデータA、Bは等分散。 データA、Bの平均値についてT検定を行える。 という認識で合っているでしょうか? ご回答よろしくお願いします。

  • 統計学の検定について

    標本15個の観測度数と期待度数を有意水準5%で検定する、という問題なのですが どのような仮説を立て、検定統計量Tを決めたらよいでしょうか?