統計学でp値の意味についての説明

このQ&Aのポイント
  • 統計学のp値について説明がありますが理解できません。p値は帰無仮説の信頼性評価であり、この評価に関わらず帰無仮説が真であるおおよその確率を示します。
  • 具体的な例を挙げると、標本平均が999以下となる確率が26%だとすると、この26%がp値であり、帰無仮説の信頼性評価の一種です。
  • 逆にp値の意味するところは、帰無仮説を棄却した場合に正しく、かつ過ちを犯す確率が26%であるということです。つまり、帰無仮説の信頼性評価として26%の確率で正しい判断を下すことができます。
回答を見る
  • ベストアンサー

すみません、統計学でp値の意味がよくわかりません

統計学のp値の説明で以下のような記載があり何度読んでも調べてみても理解できませんでした。(説明不足であったため追加しました。) 「・帰無仮説 H0 μ≧1000  ・対立仮説 H1 μ<1000 このとき実際μ=1000のとき標本数が30とすると、標本平均が999以下となる確率はいくらだろうか。この疑問への答えはH0の信頼性評価と考えられる。これに注意すべき点は2つある。 ・この問いはH0にとって都合が悪いかさらに都合の悪い証拠の得られる確率を求めている。その理由は連続分布の場合確率は範囲のもった値にしか計算できないためである。ここではH0に都合の悪い標本平均の範囲として999以下をとりあげる ・仮定されている条件はH0ではμ≧1000と述べているにもかかわらずμ=1000である。μ=1000と仮定する理由はH0に最も有利になるように疑いをかけるからである この疑問への答えが26%であったとする。標本数が30で実際にμ=1000であったときに標本平均が999以下となる可能性26%であるということだ。 この26%のことをp値と呼び、H0の信頼性評価の一種である。26%という信頼性評価はその評価に関わらずH0が真であるおおよその確率である。逆にその証拠を踏まえると粗粗74%の信頼性でH0が偽だといえるその意味するところはH0を棄却した場合におおむね74%の確率で正しくおおむね26%の確率で過ちを犯すことである」 ここで26%は999以下となる確率であるのになぜH0の真である確率となるのか理解できません。 H0は1000以上なので逆に偽である確率となるのではないのでしょうか? もしわかりましたら教えて頂けたら幸いです。よろしくお願いいたします。(長くなって申し訳ございません) (なお使用した参考書はビジネス統計学上 P320です)

質問者が選んだベストアンサー

  • ベストアンサー
noname#227064
noname#227064
回答No.1

前の質問(qa5135522)で > 確かに逆になっているようです。 と回答しましたが、今回の質問とあわせて読み直してみると、この文だけは間違っていることに気がつきました。 質問文では999を例に出していますが、これが990、980であった場合p値はどうなっていくでしょうか? 標本平均が低くなるにつれp値もそれに伴い低くなっていくはずです。 当然、標本平均が低いほどμ≧1000というのは考えにくくなりますので、その信頼性も低くなります。 p値も信頼性も標本平均が低くなるにつれて低くなっていくので、p値と信頼性を同一視しているのです。 ただし、前回も書きましたが、p値がH0が真であるおおよその確率というのは正しくありません。

rigu120
質問者

お礼

ありがとうございます!

関連するQ&A

  • 統計学でよくわからないポイントがあります。。

    統計学のp値の説明で以下のような記載があり何度読んでも調べてみても理解できませんでした。 「帰無仮説 H0 μ≧1000 対立仮説 H1 μ<1000 このとき実際μ=1000のとき標本数が30とすると、標本平均が999以下となる確率が26%であったとします。 この26%のことをp値と呼び、H0の信頼性評価の一種である。26%という信頼性評価はその評価に関わらずH0が真であるおおよその確率である。」 ここで26%は999以下となる確率であるのになぜH0の真である確率となるのか理解できません。 H0は1000以上なので逆に偽である確率となるのではないのでしょうか? もしわかりましたら教えて頂けたら幸いです。。

  • 統計学3

    以前にも似たような質問をして今回もその回答のようにやってみましたが、やっぱりうまくいきません。毎度申し訳ありませんがまた教えてください。 課題 8.  S 社の14インチ液晶ディスプレイ(A-xyz) 13 台の寿命を測定したところ,次の結果を得た.   寿命時間が指数分布に従うものと仮定して,平均寿命時間 t に関する 帰無仮説 H0: t=7942.00,対立仮説 H1: t<7942.00 を,有意水準 0.04 で検定せよ. また,平均寿命時間 t に関する下側信頼区間を信頼度 0.96 で構成せよ.    27847 6482 18846 8828 1778 6545 15847 5200 5443 9570 9870 1999 4086 検定統計量= 臨界値(棄却域の端の値)= 帰無仮説 H0は 棄却される,or棄却されない 信頼区間 ( 0 , ] ただし,検定統計量=2×標本数×標本平均÷(帰無仮説の元での平均寿命)

  • 社会統計について質問です。

    友人に社会統計学について、質問を受けました。 私は心理学科なので、心理統計しか分からず、困っています。 どなたか助けてください。 以下のような問題です。 体重に関して正規分布N(μ,σ二乗)に従う母集団から、無作為抽出によって以下の16の標本を得た。 62,50,60,48,62,59,36,64,64,62,87,63,75,27,65,76 (1)標本平均、不偏標本分散、不偏標本標準偏差を求めよ。 (2)母平均の最尤推定値(最尤推定量の実現値)を求めよ。 (3)母分散は既知とする。このとき標本平均の標本分布はどのような分布に従うか。「確立変数~確率分布」という形式で答えよ。 (4)母分散は未知であるとする。このとき、母平均の95%信頼区間を求めよ。 (5)母平均は未知であるとする。帰無仮説をHo:μ=52としたとき、適切な検定統計量を求め、5%水準両側検定、1%水準両側検定、5%水準右片側検定、1% 水準右片側検定をそれぞれ実施せよ。 (7)さらに、体重に関して正規分布する別の母集団から、無作為抽出して以下の16の標本を得た。2つの母集団の母分散は未知であるが、母分散は同じであると仮定して良い。「2つの母平均は等しい」を帰無仮説として、母平均の差に関する5%水準両側検定を実施せよ。(ヒント:t0.025(30)=2.042) 65,60,57,76,79,72,57,75,54,75,42,77,38,48,71,78 よろしくお願いします。

  • これはどういう意味ですか(泣)

    帰無仮説 2つの標本の平均値は等しい。 標本数1 6 平均値1 8.46 標準偏差1 4.002 標本数2 6 平均値2 21.82 標準偏差2 8.145 有意水準 0.05 検定方法 両側検定 F値 4.14217085610118 確率 0.0724572476022886 t値 3.60605002946898 確率 0.00479946268108932 自由度 10 結論 等分散の仮定は棄却されませんでした。 帰無仮説は有意水準 0.05 で棄却されました。 自由度 10 におけるPの値は 0.00479946268108932 です。 ある実験の前後の統計を出したいので、統計ソフトで計算した結果、よくわからない言葉が出てきてしまいました(泣) ちなみに標本数・平均値・標準偏差1が実験前で、標本数・平均値・標準偏差2が実験後の結果です。 5%有意差があるかないかを調べたいのですが・・この結論の日本語がよくわかりません。 どなたか詳しく説明していただけませんか。 バカですみません。

  • 統計学の仮説検定は、両側検定しかありえないのでは?

    統計学の仮説検定では、両側検定しかありえないのではないかと考えますが、ご意見をお聞かせ下さい。 コイン投げにおいて、表が出る確率をP(H)、裏が出る確率をP(T)とします。 帰無仮説が「P(H)=0.5」である場合、対立仮説を「表が出やすい。P(H)>0.5」とすると片側検定、「コインに偏りがある。P(H)>0.5またはP(T)>0.5」とすると両側検定と説明されます。帰無仮説は同じだでれども、対立仮説が何であるかによって片側検定か両側検定かが決まる、という説明が少なくとも2つの教科書に書かれています。 しかし私は、帰無仮説と対立仮説は互いに排反で、かつ2者で標本空間をカバーし尽くせる(起こりうる全ての事象をカバーできる)ものでなければいけない、と思います。 帰無仮説「P(H)=0.5」に対する対立仮説は「コインに偏りがある。P(H)>0.5またはP(T)>0.5」であるべきだと考えます。そして、「P(H)=0.5」とP(H)の値が特定の1つの値であれば、コインを投げる回数が決まれば(例えば10回)、表が出る回数(0~10回)の確率分布を得ることが可能なので、検定できるわけです。 対立仮説を「表が出やすい。P(H)>0.5」とするのであれば、帰無仮説は「P(H)<=0.5」であるべきだと思います。そうでないと標本空間をもれなく考慮したことになりません。ところが、P(H)=0.5はさておき、P(H)<0.5のもとでは、P(H)の値が無数にあります。ということは、例えば10回中表が0回の確率は無数にあります。10回中表が1回の確率も同様です。したがって、表が出る回数(0~10回)の確率分布を得ることができないので、検定できません。 以上の理由で、統計学の仮説検定では、両側検定しかありえないのではないかと考えますが、ご意見をお聞かせ下さい。

  • 社会統計について質問です。

    大学生です。社会学部の友人に統計学の課題について、助けを求められたのですが、これが私にもさっぱり分かりません。どなたか私達を助けて下さい。以下のような課題です。 母平均μ、母分散σ二乗を持つ正規分布でない母集団から、標本数900のデータを得たところ、標本平均は92、不偏標本分散は100であった。この場合、大標本であると見なして良い。ただし、母分散は未知である。 (1)仮説検定に用いる統計量は何か。また、その統計量は近似的にどのような分布に従うか。 (2)母平均の99%信頼区間を求めよ。 (3)帰無仮説をHo:μ=90としたとき、適切な検定統計量を求め、5%水準両側検定、1%水準両側検定、5%水準右片側検定、1%水準右片側検定をそれぞれ実施せよ。 よろしくお願いします。

  • 統計の問題です。

    統計の問題です。 答えがなく困っています。よろしくお願いします。 x1,x2,…,xnが平均μ、分散1の正規分布N(μ,1)をしている母集団からの大きさnの無作為標本であるとする。xバー=Σ[i=1→n](xi/n)と置く。 標準正規分布上側確率0.025の点は1.96であることを用いよ。 1)xバーの標本分布を与えよ。 2)μの95%信頼区間を求めよ。 3)帰無仮説H0:μ=μ0を対立仮説H1:μ≠μ0に対して有意水準0,05で検定するときの棄却域を求めよ。 4)3)の検定問題において、xバーの値を固定した時、棄却されないμ0の値の全体と2)の信頼区間との関係を述べなさい。 一応解いた答えを載せますが、全部自信がないです。 1)f(xバー)=1/√2πexp(-(x-μ)^2/2) 2)P(|(xバー-μ)/1|=0.95 よって、μ-1.96≦xバー≦μ+1.96 3)棄却域Rは、R<-1.96,1.96<R

  • 統計学

    統計学についての質問です。 平均u(ミュウ)、分散σ^2(シグマの2乗)の正規母集団から大きさ4の無作為標本の平均(標本平均)をX(Xバーのこと)とするとき、  確率P(|X(Xバー)-u|<σ)の値を求めよ。 まったく分からないので誰か助けてください・・・。

  • 「有意差検定」とは

    「有意差検定」「統計学的有意性の評価」とは、どうすればよいのでしょうか。 平均値、標準偏差、標準誤差が求まっているので、以下の手順を踏むとよいと調べたら出てきました。 が、何をどうすればよいのかわかりません。 (ちなみに今回行った実験は、マウスに局所麻酔薬を注射して痛み刺激を与え、痛がらなかった回数を記録する、というものです) ① 仮説設定: まず、研究の対象に応じて帰無仮説(H0)と対立仮説(H1)を設定します。例えば、2つのサンプル間の平均値に差があるかどうかを検定する場合、次のように設定できます。 帰無仮説 (H0): 2つのサンプルの平均値は等しい。 対立仮説 (H1): 2つのサンプルの平均値は等しくない(または、ある特定の差がある)。 ② 統計検定の選択: 2つのサンプル間で平均値の差を評価する場合、独立な2標本t検定が適しています。ただし、データの性質や仮説に応じて、他の統計検定を選択することもあります。 ③ t検定の実行: 選択したt検定を実行し、結果を得ます。t検定は、2つのサンプルの平均値の差が統計的に有意かどうかを評価します。結果には、t値(t-statistic)とp値(p-value)が含まれます。 ④ 結果の解釈: 得られたp値を帰無仮説が成立する確率と比較します。通常、あらかじめ設定した有意水準(例: 0.05)と比較して、p値が有意水準未満であれば、帰無仮説を棄却し、対立仮説を採択します。これは、2つのサンプル間に統計的に有意な平均値の差があることを示唆します。 どんな些細なことでも教えていただきたいです。 どうぞよろしくお願いいたします。

  • 統計学のついて2つ質問が…

    自分で解けずに困っています。教えていただけないでしょうか? 1.標準偏差σ=40の無限母集団から大きさ400の標本を無作為抽出し、その標本平均を求めたら、x=54.1であった。これにより H0:μ=60 (帰無仮説)、H1:μ<60 (対立仮説)を有意水準を5%として検定しなさい。 2.下記のデータについて、x上のyの単純正規線形回帰模型を仮定し、   (1)β、α、rの2乗、σ、σβの値を計算せよ。   (2)βのt値を求め、βが統計的に有意な値かどうかを判定せよ。 2はExcelの「回帰分析」を使っても解けるらしいのですが今までExcelがないので分かりません。一応、インストールはされてます。 文章が分かりにくいかもしれないですが教えていただけないでしょうか?よろしくお願いします。 くだらない質問で申し訳ありません…