• 締切済み

統計でつかう「有意差」

グラフなどに使われているP<0.05などと書かれている場合の 「有意差」の言葉の意味が分かりません・・。 統計上偶然とは思えない可能性がある と辞書に書いているのは何度も読んだのですが 「有意差がある」というのは 違いがあると理解すればいいんですか??? おばかな私に分かりやすい回答をいただければと思います。

みんなの回答

回答No.10
回答No.9

たとえば,100回勝負して,45勝55敗だったとします. この時,相手は「オレのほうが強い」と言うでしょう. その時,あなたが「実力が同じでも,偶然でこのくらいのばらつきは出る」と主張したら,相手は,「その偶然は何パーセントだよ?」と言うかもしれません. それは,計算可能です. あなたは,その確率が何%なら,相手のほうが強いと納得できますか. その偶然が5%未満だったら,実力差ありとしようというのが,通り相場になっています. この時の5%を有意水準と言い,計算した確率が5%を切っていたら,実力に「有意差あり」ということになります. 今はやりのざっくりした説明でした.

回答No.8

統計では、ある二つのデータに差があるかどうかを調べるとき、直接「差がある」ことを立証するのではなく、 (1)二つのデータに差がない(ただの偶然)と仮定する。 (2)それがある低い確率Pでしか起こらない(=偶然とは思えない)ことを示して、(1)の仮定を否定する。 という方法をとります。「有意差がある」とは、(2)が成り立つ、すなわち「差がないとすると、非常にまれな偶然である」ことをいいます。 このとき、確率Pを有意水準といって、0.05=5%や、0.01=1%がよく使われます。 なぜこのような方法をとるのかというと、(1)の仮定が正しいにもかかわらず、これを否定してしまう確率(ただの偶然を差があると間違える確率)が、有意水準Pと等しくなるためです。逆に、(1)の仮定が間違っているにもかかわらず、これを否定しない確率(差があるのに偶然と間違える確率)は、Pより高くなり、また場合によって変動します。 統計的には、ただの偶然を差があると判断してしまうほうが問題になることが多いので、このような方法をとります。

  • puusannya
  • ベストアンサー率41% (59/142)
回答No.7

あまり詳しいことを知っているわけではありませんので申し訳ありませんが、私は次のように理解しています。 検定や推定をするときには、有意水準が決められます。 その有意水準に当てはめて、雑な言い方になりますが、 有意水準内にあれば×、信頼区間内にあれば○ と結論が出されます。 このように有意水準を考えて判断をした結果、違いがあると結論づけられたときに、 有意差があるといい、差がないと結論付けたときには、有意差がない、というのではないでしょうか。 すなわち、有意水準の範囲を考慮して考えると差があるといえる、 あるいは差があるとはいえない、ということなのではないでしょうか。. 「有意水準が5%」なら、「95%の確率で差があるといえる」ということでしょうか。 違っていたらごめんなさい。

回答No.6

逆に、「有意さがない」とは、「違い、差がない」のではなくて、「このデータからでは違い、差があるとは結論できない」という意味です。 実際にはまったく差がないかもしれませんし、たとえば・・赤:白=1億:1億+1という微小な差があるかもしれませんし、赤:白=3:2というかなり大きな差が在るかもしれません。

回答No.5

「有意差がある」というのは、「違いがあって、その違いが偶然で起きたものとは考えにくいから、差があるとして扱ってもよかろう」と考えるのがよろしいのでは。P<0.05というのは、「この違いが偶然で起きたものであるとするなら、そういう偶然が起きる確率Pが0.05より小さい」という意味です。(つまり、結果があくまで偶然に起きたという危険(可能性)が、小なりとはいえ在るわけです。) 具体例をあげましょうか。とある会社が、麦の肥料について新製品を開発し、試験をしているとしましょう。当然、当社従来品と新製品で、収穫量を比較することになります。 帰無仮説(群間に差が無いと言う仮説)とは、この場合、「当社従来品の肥料を与えた場合と、新製品の肥料を与えた場合とで、収穫量に差は無い」という仮説になります。 さて、当社従来品の肥料を与えた場合と、新製品の肥料を与えた場合とで、収穫量を比較したとき、以下の結果になったとします。 小麦、従来品:101,101,97,91,101,91,92,102・・・平均97.0 小麦、新製品:101,92,104,104,96,100,94,95・・・平均98.3 大麦、従来品:104,103,100,101,103,104,101,104・・・平均102.5 大麦、新製品:108,108,108,106,105,108,108,109・・・平均107.5 小麦の場合、「どちらの肥料でも、収穫量に差は無い」場合でも、偶然このような結果になる可能性は多々ありますので、「どちらの肥料でも収穫量に差はあるとはいえない」(つまり、差はあるかもしれないが、同じとして扱ってもよかろう)=「有意差はない」という結論になります。 大麦の場合、「どちらの肥料でも、収穫量に差は無い」場合では、偶然このような結果になる可能性がほとんど無い(P<0.05なら5%以下でしか起き得ない)ので、「肥料間で収穫量に差があるとはいえる」(つまり、明白な差があると思えるので、差があるとして扱ってもよかろう)=「有意差がある」という結論になります。

  • dunnett
  • ベストアンサー率24% (16/66)
回答No.4

帰無説(群間に差が無いと言う仮説,統計解析ではこの仮説を立てる)を5%以下で捨てる.ということになります.ここ半世紀,生物から得られる統計学的差は5%で設定されています.つまり20回に1回の間違いは許しましょうと云うことです.もうひとつの考え方は,同じ調査を100回したら同様な結果が95回得られると云うことです.リスクとベネフィットによって有意水準が設定されます.おそらく飛行機の墜落・精密基盤の間違いなどは5%よりきわめて小さいP<0.000001と設定されいてるでしょう.統計の分野によって確率(P)は異なります.有意水準値は何%?という事は以下に示します. 水準のとり方については,5%にするか1%にするかまた0.1%にするか,どう決めるかという問題である.一般的には,前述の0.05, 0.01or0.001とるが,有意水準値を何%に設定するのが望ましいのかは,推計学の問題ではなく,人生観・社会観・自然科学の問題である.たとえ同じ1%水準といっても,それが赤血球数の差が認められるかどうかの場合の危険率と飛行機が墜落する危険率とでは,おのずから異なることが理解できよう.つまり,危険率を何%にするかは,仮説が正しいにも関わらず仮説を捨ててしまうという誤りを犯した時に,こうむる損害の重大さによって決めるべきである.生物統計解析では,有意水準値の境界をここ半世紀のあいだ国際的に5%水準としている. なぜ生物試験では5%の危険率を採用するのか? 1)統計が育てられた農学の領域では,大学を出て20年くらいは現役で実務に就く.種子を蒔き収穫を調べるという試験では,1年単位である.そこで長い研究生活のうち,1回位の言い過ぎは,人の常として許してよかろう.20回に1回ということで5%の線が認知された. 2)八百長賭博の心理的な研究から,そうはざらにないという基準がおおよそ5%になる. 3)碁でもテニスでもよいが,ほぼ互角と思える相手と何回か勝負し,続けて負けたとする.この時何回続けて負けたら相手の方が強いと認めるだろうか.人の性格にもよるが,3回で認める人は少ないだろう.3回ぐらいなら,互角の相手に続けて負けることが珍しくない.それが4回続けて負けたとなると大抵の人は弱気になるに違いない.更に5回となるとどうであろうか,5回続けて負けたら,互角という帰無仮説を棄却して,相手が強いことを認めるのが常識な判断であろう.相手が互角の時に1回負ける確率は1/2である.5回続けて負ける確率は (1/2)5=0.03, すなわち3%程度である.すなわち,「5回続けて負けたら,相手が強いと認める」という判断基準では,本当は互角なのに相手が強いと判断する確率,第一種の過誤の確率が5%程度はあることになる.  2回続けて負ける確率は, (1/2)2=25%, 3回続けて負ける確率は, (1/2)3=12.5%,4回続けて負ける確率は, (1/2)4= 6.3%,5回続けて負ける確率は, (1/2)5= 3.2% となります. 統計解析の結果,P<0.05を優先してはいけません.統計学的にP<0.05の場合でも,調査した人が生物学的に差が無ければ,勇気を持って差が無いと言って下さい.

  • age_momo
  • ベストアンサー率52% (327/622)
回答No.3

統計では、ある事柄が偶然発生する確率(有意確率)を求めて それが偶然起こったのか何らかの必然なのかを結論つけます。 その時の偶然-必然の境目を決めます。その値を有意水準と 言い、それより小さい確率になると有意差がある、有意である といいます。つまり偶然起こったこととは考えにくい事が 起こってますよと言ってます。 P<0.05とはある事柄が偶然起こる確率が5%未満と言うことです。 (Pはprobabilty=確率の頭文字です) 有意水準を決める時には5%や1%が良く選択されます。 サイコロを5回振って出目が全部1になる確率は0.00013ほどです。 まともなサイコロでも起こりうることですが、どうも怪しい ですよね。だからまともなサイコロの出目とは有意差があるの です。偶然起こりうることではなく、イカサマと言う必然が ありそうですね。 ここで出した確率0.00013はまともなサイコロで1が5連続ででる 確率ですが、同時に『このサイコロはイカサマだ』と決め付けた 時に間違う確率でもあります。そのためこれは危険率とも呼ばれます。 統計では通常5%や1%未満なら間違う確率を断った上で、結論を つけます。

  • tatsumi01
  • ベストアンサー率30% (976/3185)
回答No.2

見た感じで結論を下してはいけないことは沢山あります。 変な例ですが、オリンピックや世界陸上の短距離で決勝に並ぶのは国籍によらずほとんど黒人です。これから、黒人は足が速いと結論できるでしょうか。 ある家族で4人の子供が全員女の子だったとして、この父親からは男子は生まれないと結論して良いでしょうか。 そのとき、確率的にそんな現象が起きるかどうか検証します。有意差というのは、確率的な変動に比べて意味があるほど変動があるか、を調べます。 子供の性別では、生まれる子供の性別の確率は男女1/2と仮定し、4人全員が女性という事象がどれほど起きるか計算します。この場合は確率0.0625ですから、それほど希なことではない(P=0.05というほど希ではない)と結論します。 オリンピックの決勝での黒人選手、これは確率的に起きることかどうかは私にはわかりません。

  • mizuc44y
  • ベストアンサー率47% (24/51)
回答No.1

有意差というのは、違いがある"可能性"があるということです。 あくまで可能性です。断定はできません。 P<0.05は有意水準5%を意味します。有意水準5%とは、5%の"確率"で評価に差があるとは言えない、ということを示します。 確率なので可能性です。

関連するQ&A

  • 有意差って何ですか??

    今卒論で統計に初めて挑戦して、悪戦苦闘しています。 検定のやり方は本を見て、その通りにやればなんとかできるのですが、肝心の有意差の意味がよくわかりません…。本も色々読んだのですが、いまいち理解できませんでした。こんな統計初心者の私に、有意差の意味をかみくだいて教えてください!!(>_<)

  • 有意差

    農学を学んでいます。しかし実験などをすると「有意差」があるのかないのか、という結果の処理がつきものです。統計学を全く勉強していないのでT検定からp値をだして有意差を求める方法がよく分かりません。 対応がある場合のT検定をして、有意差がある(p<0.05)と求める過程(計算式)を教えていただけるとありがたいです・・・。 

  • 統計学で質問します

    最近統計解析について学んでいますが。 たびたび有意差があるとか有意差がないとかの言葉が出てきます。 自分の理解では有意差があるというの偶然の可能性が大きいので、信頼できないデータ 有意差がないというのは偶然の可能性が小さいので、信頼できるデータ であるという感覚ですが。 この理解で合ってますでしょうか? よろしくお願いします。

  • 統計の有意差について教えて下さい。

    仮説検定で、P値を求めて有意差云々を、95%信頼区間で見る場合、「0」を跨ぐと有意差無しと言っている参考書や、「1」を跨ぐと有意差無しと言う人が有り、どちらが正しいのか、よく判りません。教えて下さい。

  • 有意差って…

    はじめまして!大学で心理学を学び始めた者です。統計も始めたばかりで、まだホンットに右も左もわからない初心者中の初心者です(>_<;) 初めてレポートを書かなければならないんですが、分析の説明も少ししかありませんでした。。。 そこで、色々試行錯誤しているのですが、大きな疑問が… 多重比較とかの有意差…って、限界水準がいくつなら有意差なしになるんでしょうか??どこにも載っていない気がします。 Pr=0.01042 なら、5%水準で有意差あり p adj=0.34なら、有意差なし としていますが、間違ってますか?? 結構困ってます。どなたか救いの手をお願いします。m(>_<)m 多分私は根本の意味が分かっていないのだと思いますが…汗

  • 有意差をだすための統計処理について教えて下さい

    エクセルで統計的に有意差があるかどうかを検定したいのですが、統計について全くの素人でどの統計処理をすればいいのかよくわかりません。 統計処理したいデータは (例 ある病気にかかった患者120人の年齢と患者の病気の重篤度を5段階に分けて調査した グレード1 10人 グレード2 20人 グレード3 40人 グレード4 20人 グレード5 30人 それぞれのグレードと年齢に相関があるのか調べたいのですが、どのような統計処理をすれば有意差があるかどうか調べられるのかわかりません。 ネット上で統計について調べてみたのですが、似たような例を見つけられずよくわかりませんでした。 統計について詳しい方がいたらご教授下さい。 ソフトはエクセルのOffice2007を使っています。 よろしくお願いします。

  • 統計的有意差のp値について

    統計のp値についてなのですが,計算したら0.04になりました.この場合,危険率は4%でしょうか?それとも,有意水準5%に従い,危険率は5%ということになるのでしょうか?

  • 「有意差」について

    ある認知心理学の実験で統計がでました。 ストループ実験という実験なのですが、統計はでまして、統計については詳しく触れられていないのですがレポートを書く必要上、以下の式の読み方のみ教えてください。 ●ストループ効果(前半)t(9)=2.38,p<.0.5 ●ストループ効果(後半)t(9)=4.08,p<.0.1 ■逆ストループ効果(前半)t(9)=2.96,p<.0.5 ■逆ストループ効果(後半)t(9)=1.82,ns それぞれについて有意差があったか、ないかです。 記号の読み方なのですが(9)は人数のことだったと思うのですが、t、p、nsは何のことを示しているのでしょうか? ストループ効果については「効果があった」、逆ストループについてはそれが「見られていない」そうなのですがどの部分を指しているのでしょう?また「見られていない」というのは「有意差なし」と称するのでしょうか? 簡単な解説でよろしいので、この式の読み方を素人にわかる程度に教えていただければと思います。宜しくお願いします。

  • 「有意差検定」とは

    「有意差検定」「統計学的有意性の評価」とは、どうすればよいのでしょうか。 平均値、標準偏差、標準誤差が求まっているので、以下の手順を踏むとよいと調べたら出てきました。 が、何をどうすればよいのかわかりません。 (ちなみに今回行った実験は、マウスに局所麻酔薬を注射して痛み刺激を与え、痛がらなかった回数を記録する、というものです) ① 仮説設定: まず、研究の対象に応じて帰無仮説(H0)と対立仮説(H1)を設定します。例えば、2つのサンプル間の平均値に差があるかどうかを検定する場合、次のように設定できます。 帰無仮説 (H0): 2つのサンプルの平均値は等しい。 対立仮説 (H1): 2つのサンプルの平均値は等しくない(または、ある特定の差がある)。 ② 統計検定の選択: 2つのサンプル間で平均値の差を評価する場合、独立な2標本t検定が適しています。ただし、データの性質や仮説に応じて、他の統計検定を選択することもあります。 ③ t検定の実行: 選択したt検定を実行し、結果を得ます。t検定は、2つのサンプルの平均値の差が統計的に有意かどうかを評価します。結果には、t値(t-statistic)とp値(p-value)が含まれます。 ④ 結果の解釈: 得られたp値を帰無仮説が成立する確率と比較します。通常、あらかじめ設定した有意水準(例: 0.05)と比較して、p値が有意水準未満であれば、帰無仮説を棄却し、対立仮説を採択します。これは、2つのサンプル間に統計的に有意な平均値の差があることを示唆します。 どんな些細なことでも教えていただきたいです。 どうぞよろしくお願いいたします。

  • 「有意差がない」

    「1要因のANOVAで、A群とB群の間には有意差がなかった」ということを示したいのですが、検定してみたところp値が0.07で、有意傾向にあるとも解釈できる値になりました。 この場合でも、α=0.05と定めていれば有意差は無かったと断言していいと思いますか??