• ベストアンサー

〔統計〕相関性について

以下の問題を統計学的に考察するには、どのような手法を用いればいいのでしょうか? 【問題】ダニアレルギーの症状をもつ100人をランダムサンプリングして、スクラッチテスト(アレルギーをもつか調べる簡単なテスト)を行ったところ、陽性80人・陰性20人であった。次にダニアレルギーの症状をもたない100人にテストを行ったら陽性10人・陰性90人であった。アレルギー症状とスクラッチテストの結果には相関性があるか。

質問者が選んだベストアンサー

  • ベストアンサー
  • selfer
  • ベストアンサー率76% (104/136)
回答No.2

こんにちは. 問題をクロス集計表としてまとめると,       陽性  陰性 症状あり  80  20 症状なし  10  90 …の,ようになるわけですね? 症状あり/なし,陽性/陰性の尺度は名義尺度なわけですから,名義尺度×名義尺度用の相関係数である,連関係数を算出することで, > アレルギー症状とスクラッチテストの結果には相関性があるか。 …を調べることが出来ると思います. 連関係数については,下記参考urlに,過去の私の回答例を示しておきます(基本的にはχ2検定をベースにして数値を算出するものです). なお,このような問題に対してはNo.1さんが指摘されているようにχ2検定で「アレルギーを持つ人と持たない人との間の陽性率に有意差があるかどうか」を調べることが出来ます.これに対して連関係数を求めるメリットは,単なるχ2検定では「単に差があるか,ないか」の情報しか得られませんが,連関係数の場合は「アレルギー症状とスクラッチテストの結果には,【どの程度の】相関性があるか」を見ることが出来ます.その意味では,連関係数を求めるメリットはあると思います. なお,上記の回答は統計学的に考えた場合ですが,スクラッチテストの検査の妥当性・信頼性を求める目的のもとであれば,No.1さんが挙げられているような,検査の妥当性・信頼性を求めるための専用の指標を使う方がよいと思います.

参考URL:
http://oshiete1.goo.ne.jp/kotaeru.php3?q=316865
pe-shinsama
質問者

お礼

ありがとうございました! 参考URLの方の説明とてもわかりやすかったです。

その他の回答 (1)

noname#8027
noname#8027
回答No.1

相関というと、??ですが、カイ2乗テストをすれば、 ダニアレルギーを持つ人と持たない人ではスクラッチテストの陽性率に有意に差がある という結論は出ると思います。 しかし、むしろ、疫学的に、「スクラッチテストをダニアレルギーのスクリーニングテストに用いると、感度80%であった」など、「感度」「特異度」「陽性反応的中率」「陰性反応的中率」などを用いるのが良いのではないでしょうか?

pe-shinsama
質問者

お礼

ありがとうございました! とても参考になりました。

関連するQ&A

  • 相関・無相関の例外事象について

    統計についての質問です. 相関があると見えて実は相関がない.逆に,相関がないと見えて実は相関があるというような事象について,事例を挙げ,仲介される,あるいは仲介されない要因を鑑みつつ考察せよ. という問題を出され,仲介?鑑みつつ?などほとんど分からないのでもし良かったらどんな例があるのかだけでもご教授頂ければ幸いです.よろしくお願いします.

  • 相関を求める時の、はずれ値のはずし方

    こんにちは 現在、ある2つのデータの相関関係を調べています。 そのデータを散布図にしたところ、数個はずれ値が確認できました。 これのはずし方をご質問させてください。 はずれ値のはずし方について、標準偏差を考えるやり方などがありますが、そういった統計的手法ではなく、単に『はずしてみて分析してみた』というのは、ありなのでしょうか? 私は、この2つのデータの相関があることを言いたいだけで、それ以上に詳しい分析を行うつもりはありません。 しかし、統計的におかしはことはしたくありません。 そこで、話の流れとして、 『散布図を作って、相関係数を求めてみた。相関があった。けれど、はずれ値もあった』  ↓ 『はずれ値っぽいのを外してみて、相関係数を求めてみた。やっぱり相関があった』  ↓ 『いずれにせよ、相関はある』 はずす値がはずれ値であるかどうかが、主観によってしまうので、統計的にどうなのかな?と思ったので、ご質問させていただきました。 けれど、結局、はずしても、はずさなくても相関があるのなら、統計的にも話しの流れ的にも問題はないのでしょうか……。

  • 質的データと量的データの相関について

    例えば性別のような質的なデータとテストの点数などの連続変数からなる量的データの間の相関をみるということは出来るのでしょうか??統計の本には相関の結果が書いてあるのですが、結果の読み取り方と計算の仕方がわかりません。基本的な質問ですみませんが、どなたか教えていただけませんか?? 宜しくお願いいたします。

  • 統計学に関する質問

    こんにちは。 統計データを得たのですが、それに関する質問です。 (数値は実際とは変えてあります) ある病気を持つ60名に、その病気を検出するための2種の検査(検査A、検査B)を行いました。 1.検査Aが陽性、検査Bも陽性 ⇒6名 2.検査Aが陽性、検査Bが陰性 ⇒24名 3.検査Aが陰性、検査Bは陽性 ⇒1名 4.検査Aが陰性、検査Bも陰性 ⇒29名 以上の結果から、ポイントと思われる点を抽出しました。 1)この病気を検査Aは50パーセント検出しているが、検査Bは約12パーセントしか検出できていない。検出力は検査Aの方が高い。 2)検査Aで陽性として検出される30名のうち、検査Bではその80パーセントを検出できていない。 3)検査Aで陽性ならば、検査Bでも約98パーセントは陰性だ。 質問です。 質問1.以上はただ単に表を言葉で説明しただけですが、上記のポイントをより客観的に示すために適した統計解析手法があるのでしょうか。 質問2.今回の研究に似た事象を表現するのに、統計学の文献では「感度」「特異度」などの用語が出てきましたが、今回の場合、例えば偽陽性等が不明です。これらの用語では説明不可ですか? 以上、よろしくお願いします。

  • 相関分析と重回帰分析

    大学3回生で、来年度の卒論のために先行研究を読んでいます。 私が書く卒論では統計分析が必要なのですが、 先行研究を読んでいて疑問に思ったことがあるので、質問させてください。 ある論文で、変数間の相関を分析した後、重回帰分析を行っていました。 ところが、相関分析において相関の出ていない変数に対しても重回帰分析を行っており、 その結果、 「相関分析では有意な相関が見られない」にも関わらず、「重回帰分析では有意な結果が見られる」 というような書き方がなされていました。 また、この論文における考察部では、相関分析と重回帰分析をまとめて考察しており、 ほとんど重回帰分析の結果についてしか触れられていませんでした。 相関分析と重回帰分析を両方行う場合、相関がない変数についても重回帰分析を行うべきなんでしょうか? ゼミに教授に質問しにいっても、現4回生の卒論などで忙しいのか、 今度にしてくれ、と言われてしまいましたので、こちらで質問させていただきました。 不勉強で、重回帰分析の仕組みが良くわかっておらず、大変心苦しいのですが、 宜しければ回答していただけると、とても助かります。

  • アレルギー検査について

    アレルギー検査について教えて下さい。 娘(1才)が1ヶ月前に血液採取によるアレルギー検査をしたところ、卵白クラス3、牛乳クラス2という検査結果が出ました。 そして先日、皮膚スクラッチによる検査をしたのですが、卵白・卵黄が陰性、牛乳が陽性という結果が出ました。 先生は皮膚テストの方が正確だと言われたのですが、なぜ正確なのかよく分かりません。 今回の結果を見て、卵は食べさせていいと言われたのですが、まだ怖くてあげていません。 血液検査と皮膚テストで結果がこんなに違うものでしょうか?それともこの1ヶ月の間に卵のアレルギーが治まったという事でしょうか? ご存知の方がいらっしゃれば教えて下さい。

  • 統計の質問です。

    統計初心者です。基本的なことで申し訳ありません。 ある対照群に対し検査を行ったところ、陽性30人、陰性70人でした。陽性率が30%という結果ですが、 一般の群では、陽性率は10%程度であると、認知されています。 よって、この対照群は陽性率が有意に高いということを示したいのですが、この場合どの検定をもちいればよいでしょうか? ちなみに、一般群は、既知の知見をもとにした数値(10%です)です。 一般群の陽性率は、実際に調べているわけではないですが、適当に陽性10人、陰性90人としてみて 解2乗検定をしてみようかと考えたのですが、この方法でもよいのでしょうか。 よろしくお願いいたします。

  • 統計学の問題について教えてください。

    統計学を独学で学んでいるのですが、コンセプトの所でつまずいています。 大学で統計学を学んだ方や、統計に詳しい方、教えてください。 {問題1} 変数の対(X,Y)ならびに(Y,Z)の両者に有意な相関が観測される場合、(X,Z)に関しては何が言えるか。以下の中から最も適当であると思われるものを選べ。 A、有意な相関がある。B、有意な相関はない。 C、どちらともいえない。 (私の答え)C、(X,Y),(Y,Z)に相関があっても、(X,Z)に相関があることは分からないと思う。 {問題2} ある無限母集団から1000個のサンプルを無作為に抽出しヒストグラムを描くと、かなり左裾が長い分布となった。その後、2000個のランダムサンプルを追加してもう一度ヒストグラムを描いた場合、その分布の形状はどうなると考えられるか。以下の中から最も可能性が高いと思われるものを選べ。 A、左右対称に近づく。B、右裾が長い分布となる。 C、左裾が長い分布となる。 (私の答え・疑問点)Nが増えるにつれてヒストグラムは左右対称に近づくと思う。しかしこの場合、無限母集団とランダムサンプリングとの違いが不明である。 {問題3} A大学の男子学生と女子学生の身長は、それぞれ正規分布をし、男性の平均は170cm、標準偏差は10cm、女性の平均は156cm、標準偏差は9.8cmであると仮定する。この大学の男子学生一人と女子学生一人をランダムに選んだ場合、選ばれた男子学生の身長が女子学生の身長より高い確率はおよそいくつか。以下の中から最も適当であると思われるものを選べ。なお、いかにPrで示した標準正規分布の下側確立を参考にせよ。 Pr(Z<0.7)=0.76 Pr(Z<1.0)=0.84  Pr(Z<1.3)=0.90 Pr(Z<1.4)=0.92 A、0.76 B、0.84 C、0.90 D、0.92 (私の疑問点)それぞれSDが分かっているが、生徒が何人いるのか分からないのでどう計算するのか分からない。

  • pearsonの相関の計算の不適切さ(統計学)

    実権を行い、10匹の実験動物のある臓器の酵素Aの活性と酵素Bの活性とを測定した。 その際のデータを表に示す。pearsonの相関を計算したところ、 r=0.991,p<0.01の結果を得た。学会で発表したところ、解析方法が不適切と指摘された。どう統計解析を行うべきだったか。2つの方法を答えなさい。 とありました。 表は 個体番号  酵素A    酵素B 1 1.0 1.1 2 1.1 1.7 3 1.2 1.3 4 1.3 1.6 5 1.4 1.4 6 1.5 1.5 7 1.6 1.4 8 1.7 1.8 9 1.8 1.0 10 10.0 10.0 とかいてありました。 まず、rというのは何を意味してるのでしょうか。 ポアソン分布とは e^-μ ・ μ^x/x! という公式だと記憶してます。 そして定義が n回施行したとするとそのnを無限大に近づけ、pはゼロに近づけると分布の的確さが証明できる分布だということだったと思うのですが、統計じゃなくて生命科学の問題でこれがでてきたので統計をかじった自分にとっては難問です。 一応、考えたのがそもそもnが10でポアソンの分布を取るには数が少なすぎる ということしか考えられませんでした。 そもそもr=0.992と書いてありますがこのrは何を意味してるのでしょうか。 また結果2つの方法とはどういうアプローチを行えばいいのでしょう。 わかりやすくご指導お願い申し上げます。理解をしたいのでお時間がございます時にご指導お願い申し上げます。

  • 統計学のデータを分析するソフトは?

    データをとって、それを統計学的手法で結果・考察をしたいのですが、エクセルでできるのか?それとも統計専門SPSSのソフトが必要なのか? どうでしょうか? ちなみに、データの統計処理の内容は因子分析です。 因子負荷量や共通性、寄与率などを算出し、数少ない因子に要約して回転などを加える予定です。 この程度は、エクセルで十分でしょうか? それともSPSSでないと困難でしょうか?