• ベストアンサー

正規分布とピアソン相関

正規分布がピアソンの相関分析の条件だと聞きましたが、「正規分布」とみなして良いかどうかは、どうやって見分けるのですか?グラフで直感では分かりますが、何か本当は検定すべきなのでしょうか?

質問者が選んだベストアンサー

  • ベストアンサー
  • vzb04330
  • ベストアンサー率74% (577/778)
回答No.1

またお困りのようですから。 ピアソンの相関分析が、ピアソンの積率相関係数を求めることを意味していらっしゃるのであれば、その前提条件は、対象としているデータが、間隔尺度または比率尺度(比例尺度)ということだけで、データの正規分布は問われなかったと記憶しています。 ただし、得られた相関係数が、統計学的に見て有意であるかどうか(正確には、r=0が帰無仮説ですから、無相関の検定になります)を検定したいときには、2変量正規分布にしたがうことを利用します。 データが正規分布にしたがっているかどうかについては、2つの方法があり、その1つは、歪度と尖度を積率によって検定する方法(岩原,1967、pp.132-133)であり、もう1つはχ2乗を利用する方法(同書、pp133-135)です。 SPSSという統計パッケージが利用できるのでしたら、「分析」→「記述統計」→「探索的」を選択すると、「探索的分析」ダイアログボックスが現れますので、そこで、変数を指定し、また、「表示」には「両方」をチェックしておくと,ヒストグラムとともに、基本統計量を算出してくれます。その基本統計量には、上記の歪度と尖度も含まれます。

yoshihero
質問者

お礼

ありがとうございます。 岩原をアマゾンで入手したところなので、すぐに確認してみます。 分かりやすい解説ありがとうございます。

関連するQ&A

  • 正規分布でないときピアソンの相関係数を使いたいのですが。

    文献には、ピアソンの相関係数は ・連続変数 ・正規分布に従う。 時に使い、それ以外はスピアマンの順位相関係数を使うとありますが、正規分布をとらないときピアソンの相関係数を使うと問題がありますか?心理学では正規分布の条件は無視した論文もあると聞いたことがあるのですが。どうしてもピアソンで行いたいので、もし、無視できるくぐりぬけかたがあれば教えてください。 都市の「汚染物質排出量」と「イオン濃度」のあいだで相関係数を調べました。 サンプル数は29で「イオン濃度」はおおまかに正規分布をとるのですが「汚染物質排出量」では中央が少なく正規分布をとりませんでした。 相関係数はそれぞれ、ピアソンは、0.67で、スピアマンでは0.56です。 ともにp<0.01水準で有意でした。 どうか、分かる方がいましたら教えてください。お願いします。

  • 正規分布していないデータの相関を見たいです。

    せっかくテスト3つを作成して信頼性の方は大丈夫でしたが集まったデータがグラフで見ても正規分布していません。このよおうな3つのテストの相関を見るとき、ピアソンではまずいでしょうか?スピアマンに切り替える基準みたいなものはあるのでしょうか?どのくらいまで正規分布していると見なされるのでしょうか? また正規分布していないデータで回帰分析にかけると問題がおこるでしょうか?

  • 相関がある2つの正規分布

     確率統計の試験の過去問題で分からない問題があったため質問させていただきました。問題分の内容は以下になっています。 (問題) Xは平均1、分散4の正規分布に従い、Yは標準正規分布に従う確率変数である。またXとYの相関係数は0.5である。X+Yが0以下になる確立を求めなさい。    互いに独立な時は正規分布の再生性よりX+YがN(1,4)に従うのですが相関があるときにどうすればよいかが分かりません。 宜しくお願い致します。  

  • ピアソンの相関係数の有意検定について

    ピアソンの相関係数 r を求めて、有意検定をするところを勉強していますが、t検定のとき 標本数nと相関係数rから求めますが、 自由度についてよく判りません。 危険率0.05で、棄却域を求めるときの自由度ですが。 (n-1)で検定をするのか、(n-2)なのか判りません。 いろんなサイトで調べると(n-2)のt分布に従うとあり。 私の本では、(n-1)で棄却域が求められています。 共分散の考えから、(n-2)なのでしょうか。 教えてください。

  • 正規分布

    研究を行っておりますが統計が難しくいつも悩みます。 2群間の比較を良く行いますが,基本的にはt検定を用います。 t検定を用いるには様々な条件が必要ですが,データが連続変数であり,正規分布であり,分散が等しいなどがあるようです。 そこでいつも悩む点が,正規分布はサンプルが正規分布なのか,推定母集団が正規分布なのか,本によって書き方が難解で解りません。 また,サンプルが5個とか10個程度でも正規分布を示すことがあるのでしょうか。 教えてください。

  • Statcel2を用いたデータの正規性の検定

    Statcel2を用いたデータの正規性の検定について教えてください。 私の解釈は合っていますでしょうか。 ある計数データの正規性の有無を調べるため、Statcel2を用いてx^2検定で検定を行いました。 p値が仮に0.04だった場合、p<0.05のため、正規分布であるとは言えない。 加えて自由度が1の場合、x^2(0.95)は3.84であるから、x^2値が4.07ならば、正規分布であるとは言えない。p値で判定してもx^2値で判定しても構わないのでしょうか。 その後、計数データが、ある因子に相関があるか評価したいのですが、さきほど正規分布であるとは言えないと判定された場合は、ピアソンの相関係数ではなく、スピアマンの相関係数といったノンパラメトリックな手法で検定を行うべきでしょうか。その場合もp<0.05ならば「有意な」相関だと判断して良いでしょうか。 統計学は論文作成のために独学で行ったため、自信がありません。 乱文で申し訳ありませんが、ご教授ください。よろしくお願いいたします。

  • 正規分布による分析

    すみません、質問が複数あるので長文になります。 また当方、統計学については素人のため初歩的すぎる質問であったら失礼します。 前提:卒研でアンケート調査を行い結果を統計で分析することになりました。アンケート内容は「ある事項につき賛成~反対までを無段階で聞く」とうもので、その結果を正規分布にかけて5段階にわけ、各段階の割合を求める。というものです。 1:アンケート調査を行い結果を分析するにあたりそのアンケート結果が正規分布なのか検定する手段として、尖度、歪度は学んだのですが、この二つの検定方法はそれ以外の検定方法(カイ二乗検定など)に比べ信頼性に足るのでしょうか? 2:アンケート結果が正規分布にのっとらない場合、片端に偏ったり、中心が最少で両端に偏ったりした場合に、正規分布による分析をした時は信頼に足る結果は出ないという事になるのでしょうか? 3:上記のようなアンケート調査の場合に、正規分布にのっとらない場合に用いられる分布などがあれば教えていただきたいです。 以上、長文失礼しました。m(_ _)m

  • 2変量間に相関がある場合の正規分布

    2変量間に相関がある場合の正規分布について、よくわからないのですいませんが説明してもらえないでしょうか

  • 2つのスピアマン順位相関係数の差の有意差検定

    データが正規分布していない2つの相関係数の間に有意差があるかどうかを調べたいのですが、2つのスピアマン順位相関係数の間に有意差があるかどうかを調べる検定というものは存在しますか?ピアソンのがあることは教えて頂いたのですがスピアマンのことは見つかりませんでした。よろしくお願いします。 (SPSSは手元にあります。)

  • 非正規母集団の相関係数の有意性検定法について

    変量(X,Y)に関する,大きさNのデータが既知であるとき,X, Yの相関係数ρの有意性を検定(無相関検定)する方法を探しています。 ただし,データは標本ではなく母集団であり,X,Yに関して正規分布が仮定できないとします。 無相関を仮定して,相関係数の確率密度分布を求め,その分布を利用して検定する(実際の相関係数ρが分布のどの程度端に存在するかを見る)という方法でよいのでしょうか? よろしくお願い致します。