• ベストアンサー

相関係数の推定値(estimate)とは?

疫学調査の論文(呼吸器症状と肺機能検査値の相関を見ています)で、相関係数の推定値(estimate)が出てきたのですが、これは何を意味するのですか? また、そこでのp値の意味も、簡単に教えてください。

  • tana2
  • お礼率83% (104/124)

質問者が選んだベストアンサー

  • ベストアンサー
  • solla
  • ベストアンサー率59% (45/76)
回答No.2

本来、我々が知りたいのは想定した母集団(日本人全体とか、ある疾患を持った人の全体とか、それは研究によって異なります)における呼吸器症状と肺機能検査値の関係性です。しかし通常は母集団というのは非常に人数が大きく、その全ての対象を測定することは不可能です。そこで疫学調査では少数の標本をランダムに選んでその標本における関係性を調べることによって、母集団における関係性を推定します。 相関係数の推定値とは、標本における相関係数(標本相関係数)が母集団における相関係数(母相関係数)の推定値であるという意味で用いられています。直感的に言えばランダムに抜き出した標本における関係性は母集団における関係性をよく反映しているだろうということです。 しかし標本に基づく推定は、標本を選ぶ過程が確率的なプロセスですので、100%確実なことは言えません。もしかしたら母集団では関係性が無い(すなわち、母相関係数 = 0 である)のに、たまたま今回集めた標本では関係性が出てしまった(標本相関係数≠0 である)という可能性を否定できません。統計学を用いるとどのくらいの確率でそのような可能性があるのかを計算することができます。それがp値です。 つまり、例えば標本相関係数が0.43になったとすると、母相関係数も概ね0.43であって母集団においても関係性はあるだろう、と推定するのですが、本当は母集団では関係性は無いのにそのように誤って推定している可能性が確率pであるわけです。そこで通常はこのp値がある程度小さい(一般的は0.05未満)場合にのみ、すなわち間違いを犯している確率がある程度小さい場合にのみ、「母集団でも関係性がある」と結論します。 これが所謂「統計学的検定」といわれるものです。 こういったことは、疫学や初等的な統計学のテキストにある程度は書かれていますから、疫学の論文を読まれるのであれば一度そういったものに目を通されることをお勧めします。

tana2
質問者

お礼

なるほど、丁寧なご解説で大変良く分かりました。 確かに、すこし勉強不足です。これから勉強致します。ありがとうございました。

その他の回答 (1)

noname#21649
noname#21649
回答No.1

前後関係をみないと怪しげな内容にしか過ぎないのですが 相関計数が0.9???と推定され(求められ)た。危険率p% でR検定をする の意味ではありませんか。「データから推定した」という言葉が「データから計算で求めた」という意味で良く使われますから。

tana2
質問者

お礼

ん~、難しいですね。説明不足だったでしょうか? ありがとうございました。

関連するQ&A

  • 相関係数についてくるP値とは何ですか?

    相関係数についてくるP値の意味がわかりません。 r=0.90 (P<0.001) や P=0.05で相関がない という表現は何を意味しているのでしょうか? またMS Excelを使ってのP値の計算方法を教えてください。 よろしくお願い致します。

  • 正規分布でないときピアソンの相関係数を使いたいのですが。

    文献には、ピアソンの相関係数は ・連続変数 ・正規分布に従う。 時に使い、それ以外はスピアマンの順位相関係数を使うとありますが、正規分布をとらないときピアソンの相関係数を使うと問題がありますか?心理学では正規分布の条件は無視した論文もあると聞いたことがあるのですが。どうしてもピアソンで行いたいので、もし、無視できるくぐりぬけかたがあれば教えてください。 都市の「汚染物質排出量」と「イオン濃度」のあいだで相関係数を調べました。 サンプル数は29で「イオン濃度」はおおまかに正規分布をとるのですが「汚染物質排出量」では中央が少なく正規分布をとりませんでした。 相関係数はそれぞれ、ピアソンは、0.67で、スピアマンでは0.56です。 ともにp<0.01水準で有意でした。 どうか、分かる方がいましたら教えてください。お願いします。

  • スピアマンの順位相関係数について教えてください

    論文を書いておりますがスピアマンの順位相関係数での相関のあるなしが次のデータから言って良いのかどうかを教えてください 実際のものとは違いますが、たとえば 変数1を身長として、変数2を最近体のだるさがないを「0」すこしあるを「1」かなりあるを「2」とした時に「身長と体のだるさ」に相関があるかどうかをスピアマンの順位相関係数で言えるのかどうか? このデータで 変数1を身長、変数2をだるさなし群を「0」少しでもあるとかなりあるをあわせて症状がある群を「1」として、対応のないt検定をおこなったところ優位な差がでなかったので他の統計処理を行えば差がでるのか知りたいです。 統計は初心者中の初心者です。 t検定もyou tubeに出てた方法をそのままエクセル2010でおこなっただけです。 これがスピアマンや他の統計処理ができそうなら大学の図書館の統計処理ソフトで行う考えです。

  • 決定係数の大文字・小文字

    教えてください. あまり単位等の表記を細かく気にしない分野に属しています. 先日,決定係数をR^2で表現していた論文を投稿した際,“統計記号は通常小文字です”と指摘がありました.相関係数はr,重相関係数はRで表現していましたが…決定係数に関しては,気にしたことがなかったのですが,やはり小文字なのでしょうか?? あと,P値についても同様の指摘がありましたが,こちらも小文字でしょうか?? ちなみに,当分野の他の論文を見ると,決定係数およびP値とも,小文字の場合もありますが,大文字の場合が多いです.

  • 教育心理系の論文で・・・

    とっても初心者で申し訳ないのですが、もおもと文系なもので本を読んでもよくわからないのです。教えてください。 教育心理系の論文で見かける相関係数の表で、 *p<0.5  ***p<0.01 とよく見かけます。どういう意味でしょうか? 相関係数が1に近ければ相関が強いのはわかります。 *印はどういう意味があるのでしょうか? またエクセルでこの*印を求められますか? 急いでいて文章がおかしいですが、なにとぞよろしくお願いします。

  • 推定区間について

    統計学の区間推定の問題について質問です。 ある生産現場で100個の製品を抽出して検査したところ、4個の不良品が見つかった。 この生産工場での不良率(P)を信用係数95%で区間推定せよ。 (注)√0.04×√0.96=0.196 この問題を教えて欲しいです!

  • 最尤推定法について

    最尤法を勉強しています。 当方、確率・統計が苦手でして、できれば初心者にわかるように解説お願いします。初歩的なことなのかもしれませんが、 最尤推定法: 未知の母数pをいろいろ変化させて,調査して得られた実際のデータが起こる確率が1番大きくなるようなpの値を用いて母数の推定値とする方法 (http://izumi-math.jp/T_Syoda/estimate.pdfを参考にしました) とありますが、どうしてこのときのpを最良推定値として良いのでしょうか?これがわかれば、データの分布がこの問題のようにベルヌーイ施行だろうが、あるいはガウス分布であろうが理解できると思うのです。wikiの方も確認していますが、結局、根本は同じだと思います。 理解している方、よろしくお願い致します。

  • 統計学の信頼係数について

    こんにちは、 統計学の区間推定?のところを勉強していたのですが、信頼係数というのがよくわかりません。信頼係数の定義というか意味はわかるんですけど、問題で出てきたときにどうやって求めたらよいのかがわからないんです。 例えば、Aクラスにおいて178人中42人が自転車通学の場合、自転車通学の生徒の比率を信頼係数90%で区間推定しなさいといわれた場合、 標本比率はp'=42/178=0.326(すいませんpハットの記号が出ないのでp'にしてあります) 信頼係数は90%=0.9=1-0.1 ここまではいいんですが、 この次の式が、 p'±z(0.05)√{p'(1-p')/n}=0.236±1.64√… となっていて……? このz(0.05)というのは、先ほどの信頼係数90% = 0.9 = 1-0.1 の0.1を2で割って出てきた0.05を使っているんですよね? だからもし信頼係数が95%なら95%=0.95=1-0.05よりz(0.025) ですよね?あってるでしょうか… それで、このz(0.05)とかz(0.025)とかいったものの実際の数値はどうやって出したらいいんでしょうか。標準正規分布表を使うんだろうとは思うんですけど、実際分布表の0.05のところを見てみても値は1.64にはなっていないし…。教えてください。よろしくお願いします。 ※わたしの教科書に載っていた表は原点からのF(x)までの確率を示すやつでした。↓ここのと同じです http://www.mbanavi.com/school/stat60.htm

  • 相関関係の計算結果 p値=0.70のとき

    相関関係の解釈に関して質問です。 エクセルにいれたアドインソフト(4steps)を用いてN=8で2項目の相関関係を、ピアソンの相関係数を用いて求めました。 r=0.6860 p=0.70といった結果がでました。 統計に関してかなり疎いのですが、r値はどうも意見がまちまちですが「多少正の相関がある」といったところかと考えました。 しかし、今回の結果だと、p>0.05でした。自分でいろいろ調べた限りではp値から有意なデータと言えないという意味だと解釈しました。 ところで、研究発表などで、0.05<p<0.10のときに有意差はなかったが、傾向があったとする発現を耳にします。 では、かなり苦しいかもしれませんが、今回のデータを「有意な結果とは言えないが、正の相関を示す傾向にあった」と解釈するのは可能でしょうか?

  • 2つの正規母集団に関する統計量の分布&推定

    (1)二つの標本平均をX、Yとしたとき、X-Yの標準偏差は?という問題の解き方はわかるのですが、3X-2Yのときどうやったら良いのでしょうか?(2)320名を標本抽出したとき検査の陽性率は67.8%であった。陽性率Pを信頼係数95%で区間推定すると~となる、という問題はどうやって解けばよいのでしょうか。統計学初心者ですが教えてください!