• ベストアンサー

検定におけるp値(p_value)の解釈の仕方について

shigure2005と申します。 現在二変数の独立を帰無仮説としたカイ二乗適合度 検定を行っているのですが、この際に求められる p_valueは帰無仮説を棄却する以外の目的に使う ことはできないのでしょうか? 具体的には、p_valueが小さい変数の組ほど相関が 強いとし、p_valueの値をもとに変数の組にランクを つけてそれを次の解析で利用するということです。 どうぞよろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • goma_2000
  • ベストアンサー率48% (62/129)
回答No.3

最初に述べたように、 「厳密には元の仮説の正しさを証明するものではありませんが(これに関しては色々議論があるところだと思いますが)、一つの指標になるでしょう。」 ということです。つまり正論としてはそうですね。 しかし、 「本来の検定の意味からは、設定した有意水準を越えるかどうかで判断しますが、この判断をきつくしたとすれば上のように解釈できますよね。」 ということです。 つまり、より有意水準の規準を厳しくした時にそれでも独立でないといえるもから順に変数を取り出してくれば、それは従属度の強い変数から取り出したと解釈できますよね。 また、標本数に関しては、一般的に 「データ数が多くなるとデータ間の意味のない小さなズレまで検出してしまうことがあり、逆にデータ数が小さくなると、意味のある差を検出できない」 という問題があります。 #余談ですが Neyman-Pearson派では、p値は優位か優位でないかを見る指標として用いますが、Fisher派では、仮説とデータとのズレとして積極的にこれを解釈します。 #最後に もし気になるようなら、最初に紹介したAICなどの情報量基準を用いて判断するのがよいでしょう。計算自体は簡単ですのでね。

shigure2005
質問者

お礼

ご回答ありがとうございます。 なるほど・・・学問の派閥によっても考え方が 違ってくるんですね。数学は何もかも厳密に 決まっているというようなイメージの元に文献を 調べていたので、混乱しておりました。 goma_2000さんのおっしゃった「有意水準の移行」という 考えもやっとわかりました。 物分りの悪いところを懇切丁寧にご指導いただき、 どうもありがとうございました。また、質問を 伺うことがあるかもしれませんが、どうぞよろしく お願いします。

全文を見る
すると、全ての回答が全文表示されます。

その他の回答 (2)

  • goma_2000
  • ベストアンサー率48% (62/129)
回答No.2

帰無仮説と対立仮説の2値という言い方にちょっと引っかかりますが。。。 独立性の検定の場合には、独立であるという仮説を検定し、もし独立であると仮定した時に、測定結果(分割表)が得られる確率がp値になります。 ですので、p値が小さいということはそれだけ独立モデルでは無いということです。独立モデルではないということが従属モデルであるということとして独立性の検定の結果のp値を解釈すれば、p値が小さいほど良いということになります。 本来の検定の意味からは、設定した有意水準を越えるかどうかで判断しますが、この判断をきつくしたとすれば上のように解釈できますよね。 ですので、 「AとCの方が、AとBよりも関係性が深い」とp_valueの 値のみからいえるのでしょうか? そういうことです。

shigure2005
質問者

お礼

ご回答ありがとうございます。 質問を書き込んでからいろいろと本・ネットで 探してみたのですが、以下のようなHPを見つけました。 http://www.novartis.co.jp/ebm/03.html ここに書かれている「3.p値のもつ意味と標本数」の 「したがって、p値が小さいからといって、2グループ間の 母平均値の差が大きいとか、母相関係数が大きいとか を示している訳ではない。」 という記述を読むとまた迷ってきてしまったのです。 ここに書かれているのは、母平均や相関係数ですが、 カイ二乗検定にもあてはまる気がしてきたのです。 概念的にどうも同じことを何度も伺うようで申し訳 ないのですが、この記述に関してどのように解釈 すればいいのか教えていただけると幸いです。

全文を見る
すると、全ての回答が全文表示されます。
  • goma_2000
  • ベストアンサー率48% (62/129)
回答No.1

p値の意味は、帰無仮説が正しいとした時に、そのデータが得られる確率ですよね。それが少ない(P値が小さい)ということは、その帰無仮説とはあっていないということです。ですので、厳密には元の仮説の正しさを証明するものではありませんが(これに関しては色々議論があるところだと思いますが)、一つの指標になるでしょう。実際問題としては、使ってます。 独立性の検定にはカイ2乗検定以外にもAICやBICなどを用いた方法があります。 共立出版 情報量統計学 坂本慶行ほか著 が参考になるかと思います。

shigure2005
質問者

お礼

ご回答ありがとうございます。お礼が遅くなってしまい 申し訳ございません。 データが得られる「確率」ということは、帰無仮説と 対立仮説という「二値の判別に用いる材料」という 意味合いしかp_Valueにはないのでしょうか? AとB、AとCそれぞれについて独立性を帰無仮説とした 適合度検定をしたとき、そのp_valueがそれぞれ 0.001と0.0001だったら、帰無仮説の棄却だけでなく、 「AとCの方が、AとBよりも関係性が深い」とp_valueの 値のみからいえるのでしょうか? 度重なる質問で恐縮ですが、どうぞよろしくお願いします。

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • 適合度の検定について教えてください!

    統計を学んでいます。 先生がおらず誰かに聞くことができないので、 参考書等を参考に学んでいますが、 適合度の検定にて煮詰まっています(><) 以下の(1)(2)についてご教示いただけますでしょうか。 (1)【仮説の設定】 帰無仮説…差(違い)がない、という内容を持ってくることが一般的 対立仮説…差がある【両側検定】、検定量AよりBの方が大きい(小さい)【片側検定】 ■カイ二乗値が理論値より大きい場合→帰無仮説の棄却 小さい場合→帰無仮説は棄却できない ということで間違っていないでしょうか。 (2)【適合度の検定】 標本調査の調査とりまとめにおいて、国勢調査の年齢別人口構成比率と有効票の年齢別構成比率対象者の年齢分布を比較し、有効票の回答者が調査対象を代表しているかを確認したい。 ■帰無仮説…有効票の回答者が調査対象を代表している(国勢調査の構成比率と差がない) ■カイ二乗値が理論値より大きい場合→帰無仮説の棄却→国勢調査の構成比率と差がある 小さい場合→帰無仮説は棄却できない→差があるとは言えない 年齢・■国勢調査 ・■標本調査結果 ■期待値 20-29歳■169,369 14.8%■ 3,236 15.0% ■ 3189.6 30-39歳 ■193,792 17.0% ■3,703 17.2% ■3649.5 40-49歳 ■172,233 15.1% ■3,291 15.3% ■3243.5 50-59歳 ■219,559 19.2% ■3,723 17.3% ■4134.8 60-64歳 ■103,743 9.1% ■2,024 9.4% ■1953.7 65歳以上 ■283,479 24.8% ■5,531 25.7%■5338.5 合計 ■1,142,175 100.0%■ 21,510 100.0% ■21,510 カイ二乗値:52.7 理論値(自由度5、危険率5%):11.07 結果 帰無仮説を棄却(国勢調査の構成比率と差がある) カイ二乗値ですが、標本数が多ければ多いほど、帰無仮説を棄却せざるを得ないように思うのは、単なる思い込みでしょうか。一般的にサンプルが多いほど、母集団に値が近づくと思う(思いたい)ですが…(この例も、割合だけみれば「母集団を代表している」と言いたいのですが…)。 「母集団を代表している」というのはかなりハードルの高い精度(期待値と回答者数の差が限りなく小さい)が求められるということなのでしょうか。。 (1)(2)に関し、ご意見を頂ければと思います。 (1)も関連しますが特にお伺いしたいのは(2)です。 (2)に関して回答とその理由をお教え頂けると大変助かります。 よろしくお願いします。

  • 帰無仮説 統計 p値

    コインを5回続けて投げて5回とも表がでるとする。 このコインは偏っているといえるか? 通常偏っていると考えて 偏っていない という帰無仮説をたてて、0,5の5乗で約3パーセント P<0.05となっているため仮説は棄却 コインは偏っている。 r=0.90 (P<0.001) 相関係数は0.90と計算された。相関がないのに偶然r=0.90 となる確率は0.001以下 のようにp値を理解しています。 コインと同様にAとBは相関がないという帰無仮説をたて、計算し偶然r=0.90 になるのは P<0.001という結論を出し、 これだけ確率が低いのだからAとBは相関がないを棄却し、相関係数は0.90は偶然ではない ということでしょうか? 偏っていないのに偶然5回とも表になる確率は5パーセント以下(3パーセント)だから偏っていない という帰無仮説を棄却し コインは偏っているという結論ですが、P<0.05という決まりがありこれ以下なら帰無仮説は棄却できるということですか? 通常偏っていなと考えて 偏っている という帰無仮説をたててしまったらどうなるのでしょうか?

  • 仮説検定とカイ二乗検定の使い分けについて

    すみません、統計学を学び始めたばかりで、仮説検定とカイ二乗検定の使い分けについて少々混乱しております。 私の理解では、 仮説検定ではHoを立てるときに実際に調べたい事項の逆接をHoとして立て、それが棄却されればH1の実際に調べたかった事項が正しかった証明される。 カイ二乗検定では、実際に調べたい事項をHoとし、その結果が棄却されるか否かを検定する だと思っているのですが、間違っているでしょうか? なお、これにより、p値から判断する基準が、 仮説検定→p値が小さいほどHoが正しくない可能性が高い カイ二乗検定→p値が大きいほどHoが正しくない可能性が高い ということになると思うのですが、合っていますでしょうか。。。? 問題が出たときの仮説の立て方がだんだんとわからなくなってきてしまい、ますます頭がこんがらがっています。 どなたかアドバイスをいただけるとありがたいです。

  • カイ二乗検定及びG検定について

    カイ二乗検定もしくはG検定を用いて適合性の検定を行おうと思っているのですが、以下の判断が出来ず困っております。 ・自由度が大きすぎる(10000以上)場合もカイ二乗検定及びG検定を用いて良いか なお、帰無仮説で想定する分布は多項分布、サンプル数は30から100程度を想定しています。 ご回答をよろしくお願いいたします。

  • カイ二乗による適合度検定におけるカイ二乗値の分布

    カイ二乗による適合度検定で、期待度数と観測度数の差からカイ二乗値を計算するんですが、帰無仮説が正しい(すべての期待度数が観測度数と一致する)場合は、この検定統計量のカイ二乗値の分布はその自由度のカイ二乗分布になります。 帰無仮説が正しくなく、実際にある乖離(たとえば効果量w=0.3とか)があった場合、計算された検定統計量のカイ二乗値はどんな分布をすると理論的には言えるのでしょうか? 全体の総度数によってもかわるように思うのですが、いまいちわかりません。 平均の差の検定ではたとえば、t検定統計量が帰無仮説が成立しない場合非心t分布をとるのですが、カイ二乗検定ではこれは非心カイ二乗分布なのでしょうか? であったらその非心パラメタはどういうものなのでしょうか? カイ二乗による適合度検定で、検出力の計算をどうやるんだろうかと考えていたら、こういう疑問がわきました。

  • 正規性の検定について

    正規性の検定において、例えば5%未満で有意な時には「有意に正規分布に従わない」と判断できると思います。 この場合の帰無仮説はどうなるのでしょうか? t検定では例えば「両者に差がない」という帰無仮説を立て、p=0.02ならば棄却でき、「5%未満で有意に差がある」といえ、もしp=0.07となったら、「有意に差があるとは言えない」 この考え方で言うと、正規性の検定の場合、帰無仮説は「正規分布しない」となって、これを棄却して「正規分布する」と結論付けるような気がするのですが、この考えは根本的に間違っていますか? ごちゃごちゃして、分からなくなってしまいました。 どなたか詳しい方、お願いします。

  • 回帰係数が1かどうかの検定

    変数xが1増えると変数yも1増える、という仮説を検定した研究で、1に近い回帰係数が得られてt値も低い(例えば1未満)という結果から、この仮説は支持できるというのがありました。これって統計的に正しい推論なのでしょうか。通常だと、例えば係数が正という仮説を検定するために、係数ゼロという帰無仮説を立ててt値が2未満であれば帰無仮説を受容(対立仮説は棄却)し、そして結論を保留する、ということになりますね。ですから先の場合も現状ではなにも言えないということになると思うのですが、それでは係数が1という仮説はどのようにして検定すれば良いのでしょうか。あるいは帰無仮説はどのように立てるのが良いのでしょうか(一般的なのでしょうか)。

  • 仮説の設定の仕方

    カイ二乗で検定する時の仮説の設定方法について混乱しています。 例えば、食中毒の原因を調査する問題があります。そこで、 食べた/食べない 発症/非発症というグループの検定をしたい。 帰無仮説:食べた/食べないのグループは発症/非発症とは関連がない 対立仮説:            〃         関連がある これで間違いがないでしょうか? また食中毒に限らず、カイ二乗の場合は必ず帰無仮説は[○○と○○は関連がない]という設定にしてしまってよいのでしょうか? 私が混乱しているのはその対象内容によって帰無仮説と対立仮説が入れ替わるのかそれともどの条件においても上記の通りに設定して良いのかどうかがわかりません。統計が得意な方、是非教えてください。

  • 統計学の検定のもんだいです。

    前回分 すいません、タイプミスがございました、ご容赦をおねがいします。 検定の問題です。答えも知りたいですけど 自身の考え方が正解かどうか 知りたいです。ご指導宜しくお願いします。 健常者のIgG値の平均値は1180(mg/100ml)であることが知られているとする。A病院における透析患者のIgG値(mg/100ml)の平均値は健常者の平均値と異なっていると言えるか、[A]のデータを用いて有意水準0.05で検定せよ A:1326 1418 1820 1516 1635 1720 1580 1452 1600 (1)帰無仮説と対立仮説を記すこと。 (2)有意水準0.05として、この検定の棄却域を求める(両側検定を行う)。 (1)棄却域を求めるためのRのコマンドを記すこと。 (2)求められた棄却域を T>a, T<b という形で記すこと。ここで、a,bは具体的な値。 (3)検定のための統計量の値を求めるRのコマンドを記すこと。 (4)統計量の値を記すこと。 (5)棄却域と比較することにより帰無仮説を棄却するか採択するか決め、結果を記すこと。 (6)最初に与えられた質問(最初の文章)に解答せよ。 (7)p値を求めるRのコマンドと結果の値を記すこと。 (8)p値の結果の値から帰無仮説を棄却するか採択するか決め、結果を記すこと。

  • 検定の問題です。恐れ入りますご享受を依頼します。

    A :1326 1418 1820 1516 1635 1720 1580 1452 1600 健常者のIgG値の平均値は1180(mg/100ml)であることが知られているとする。A病院における透析患者のIgG値(mg/100ml)の平均値は健常者の平均値と異なっていると言えるか、上記[A]のデータを用いて有意水準0.05で検定せよ (1)帰無仮説と対立仮説を記すこと。 (2)有意水準0.05として、この検定の棄却域を求める(両側検定を行う)。 (1)棄却域を求めるためのRのコマンドを記すこと。 (2)求められた棄却域を T>a, T<b という形で記すこと。ここで、a,bは具体的な値。 (3)検定のための統計量の値を求めるRのコマンドを記すこと。 (4)統計量の値を記すこと。 (5)棄却域と比較することにより帰無仮説を棄却するか採択するか決め、結果を記すこと。 (6)最初に与えられた質問(最初の文章)に解答せよ。 (7)p値を求めるRのコマンドと結果の値を記すこと。 (8)p値の結果の値から帰無仮説を棄却するか採択するか決め、結果を記すこと。

このQ&Aのポイント
  • 映画『親密な他人』(2022年3月5日公開)について、黒沢あすかさんから質問があります。
  • この映画で黒沢さんが演じる恵と神尾楓珠さんが演じる雄二は、本当の家族ではないが母子のような関係になります。
  • 皆さんはそういった母子の関係を受け入れることができますか?ご回答をお待ちしています。
回答を見る