コリレーション分析について

このQ&Aのポイント
  • コリレーション分析は、相関係数を求めて相関関係を測る方法です。
  • 具体的な分析手法としては、縦軸に「パンを買った人の数」、横軸に「ミルクを買った人の数」としてデータを集計し、相関係数を算出します。
  • 相関係数が高い場合、つまりパンを買った人の中にはミルクも買っている人が多い場合には、パンとミルクの間に相関関係があると判断されます。
回答を見る
  • ベストアンサー

コリレーション分析に関して

http://www.atmarkit.co.jp/aig/04biz/associationanalysis.html を読んでアソシエーション分析に関しては取り敢えず理解したのですが、これの一番最後に、 「なお、スタンフォード大学に在学していた(後にグーグルの共同設立者となる)サーゲイ・ブリン(Sergey Brin)氏らは、1997年に信頼度と支持度では条件部と結論部の相関関係を正しく評価できないと指摘し、コリレーション分析を提唱している。」 と、記載されていました。 コリレーション分析は、相関係数を求めて相関関係を測るものということは分かったのですが、上記URLにて示されている「パン, バターを買った人はミルクも買っている」といったことをコリレーション分析で相関関係があるかどうか判定するにはどの様に縦軸と横軸を取ればいいのでしょうか?

質問者が選んだベストアンサー

  • ベストアンサー
回答No.1

相関というより判別分析ではないでしょうか。 パンを買っている人のうちでミルクを買っている人のグループ と バターを買っている人のうちでミルクを買っている人のグループ がどれくらい同じグループであるかどうか を統計的に検定することができます。

glarelance
質問者

お礼

なるほど、どうも有り難うございました。

関連するQ&A

  • 日経平均とNYダウの相関関係

    NYダウ(横軸)と日経平均(縦軸)の関係のグラフを作った方おりませんか? 私にはかなり強い相関があるような気がするのですが。

  • 回帰分析について教えてください

    統計に関する質問です。 私は勤務先(金融)で特定の業種の財務分析をしているのですが、データの分析方法(回帰分析)で分からない点があります。 具体的には下記の通りです。 【状況】 ある業種業界について、2つのデータ(例えば、総資産と売上高)を収集しました。 データは5年間分をパネルとして扱っており、総数は400くらいです。 2つのデータ間に何らかの関係をあると考え、総資産を横軸、売上高を縦軸、としてエクセルで散布図を作成したところ、右上がりの関係があるように感じました。 エクセルの機能で近似値線(直線)を引いて、算式とR2を表示したところ、算式の傾きはプラスで、R2は0.2程度でした。 その後、回帰分析を行い、分散分析表を作成しました。 相関係数の有意性を検定したところ、1%水準で有意な関係、となりました。 回帰係数も検定したところ、1%水準で有意な関係、との結果でした。 【私の主張】 私は「統計学的に考えて、総資産の増加に伴い売上高が増加する傾向がある」と述べたいのですが、 (なお、背景にある理論は別途構築しており、業界内でも理解が得られると思われます。) 【ご質問】 1. 回帰分析の結果から、回帰直線の傾きがプラスで、相関係数の関係が1%の有意水準で有意であることから、統計学的に私の主張は正しいと言えるのでしょうか?評価は個人ですべきものだとは存じますが、考え方・説明方法に無理があればご教示をお願い申し上げます。 2. もし、上記1の質問が的外れであれば、どのような点がおかしいのでしょうか。ご教示いただきますようお願い申し上げます。 抽象的な部分もございますが、何卒ご教示のほど、お願い申し上げます。 【前提】 上記は私の職務柄、個人で利用する目的で作業を行っています。 論文その他レポートの作成を目的としておりません。

  • 相関係数と回帰分析

    大学でSPSSの使い方の授業を受けていますがわからないことがあるので教えてください。 私は都道府県別のコンビニの数について調べようと思いました。 ・コンビニ数と人口 ・コンビニ数と県民所得 ・コンビニ数と県内総生産 という3つの関係について調べています。 先生から教えていただいた内容ですと・・・ 相関係数を求める⇒回帰分析を行う⇒t検定をする という順番で分析すると教えて頂きました。 しかし、この場合は、 相関係数は3つそれぞれ求めてから1度の重回帰分析をしたらよいのか、それともそれぞれを回帰分析したらよいのかわかりません。 また、相関係数を求めて相関がない(0)となった場合であっても回帰分析は行うものなのでしょうか? SPSSは勉強開始したばかりなのでなかなか理解できません。 また、分析の仕方についてアドバイスありましたらよろしくお願いします。 どうか教えてください。

  • FT-IRのチャートの読みかたについて教えてください

    ある分析機関に分析してもらい、チャートをもらったのですが、どのように解釈したらよいのか困っています。 縦軸:%T(透過度) 横軸:cm-1(波数) というのは調べたのですが、縦軸の透過度の数値はどのような場合、変化するのでしょうか? 勉強不足で申し訳ありません。 回答宜しくお願いいたします。

  • エクセル グラフ

    EXCEL2003を使って、グラフの横軸に単価、縦軸に売上をとって、平成18年から平成20年までの3年間の単価と売上の相関関係を示す分布表を作りたいと思うのですが、作り方がわかりません。教えてください。

  • 分析方法を教えてください

    病院で働いております。 職員の経験年数ごとの仕事の満足度をアンケートさせてもらいました。 経験年数(1年目、2年目、・・・、8年目の8つ)と満足度(満足、不満足の2つ)との関係性を調べたいと思っています。 仮説として「経験年数が上がるほど不満足の割合もあがる」を検定するのか、あるいは「経験年数と満足度との相関」を調べるののか。 どちらをとるべきなのかわかりません。またその際の分析手法もわからないのが現状です。 まったくの初歩からの質問ですが教えていただけないでしょうか?

  • 回帰分析の結果は何を示す?

    毎度毎度、大変お世話になっています。 私は大学の統計学の授業でエクセルを使い、北海道の最低気温と降雪量の関係を分析し、回帰分析を行い、決定係数を出しました。 しかし、この決定係数が果たして何を示すのかイマイチ理解ができないのです。 ちなみにこの結果は「0.067」となりました。 私が思うに、最低気温と降雪量にはあまり関係(関連性というのでしょうか)がないという結果なのではないかと思うのですが、いかがでしょう? どなたか力を貸してくださいませんでしょうか? よろしくお願いします。 (本当何度もすみません、相関関数の方は無事解決しました^^)

  • 相関分析や回帰分析について

    相関分析や回帰分析についての記述が正しいのかわかりません。 間違っていたらどこが違うのか理由も教えていただけると幸いです! (1)ある特性、例えば、身長についてゴールドンのいう第二世代(子)の平均への回帰が観測される(b<1)のとき説明変数と被説明変数を逆にした回帰計算をしてもいわば、おやの平均への回帰が観測される可能性はない。(親と子の身長には、正の相関があると考えてよい) (2)第二世代(子)が平均へと回帰するのならば、将来は、個人のもつ身長その他、さまざまな諸特性がすべて一様な社会になってしまう。(ある経済学者はそう考えた) (3)重回帰の場合、通常の決定係数を使用すると、説明変数の増加のよるあてはまりのよさの改善を誇張してしまうので、修正済み決定係数(自由度調整済み決定係数)を使用するのが普通である。もいろん、単純回帰については、決定係数と修正済み決定係数は同じものになる。 (4)決定係数は、マイナスになることはないが、修正済み係数はマイナスになりうる。 (5)回帰分析を因果関係と結びつける(説明変数を原因、被説明変数を結果と見る)ことは、記述統計の範囲を逸脱している。 よろしくお願いいたします!!!

  • Bland-Altman Plot(差分値プロット)について教えてください

    Bland-Altman Plotについて調べています。異なった測定法の比較を行う方法で[A法の測定値をx,B法の測定値をyとしたとき,(x+y)/2を横軸,(y-x)を縦軸に配するもの]ということは分かるのですが、どのような意味・特徴があるのでしょうか?統計でよく使用している相関関係を見るのと何か違いがあるのでしょうか? わかる方がいましたら教えてください。

  • クロス集計の数量データによる相関などの分析

    公表されている調査結果報告書から相関分析等をすることによって、構造を把握したい。 例えば、x、y、zについて満足、普通、不満足という回答を得て、それぞれに3点、2点、1点を配点して、 それを地区別に集計して平均した数値と、被説明変数についても地区別に集計して平均した数値が、表1として 公表されていた場合。 (もちろん個別のサンプルについての生データを得ることが難しいので、このような公表データで分析をして、 その構造を把握するとともに、今後の改善に役立てたいと思っています。) x、y、z間の単相関係数の状況 被説明変数とx、y、zの相関の状況 および重回帰分析 を試みたいと思っています。 この場合の、相関分析、重回帰分析などの統計分析を行う場合の問題点、課題、解決方法、留意点などについて、教えてください。 また、このようなことについて、いい本があれば教えてください。 調査結果報告書 表1 *************************************************************** * 項目 * 被説明変数 * x満足度 * y満足度 * z満足度 * 調査者数 * *************************************************************** *A地区*  15    *  3.5  * 2.1 * 1.3 * 60 * *************************************************************** *B地区*  13   *  2.5  * 2.9 * 3.3 * 30 * *************************************************************** *C地区*   8   *  1.5  * 2.0 * 2.3 * 10 * *************************************************************** データに基づく現状分析と改善方策の策定を目指す、文系の統計初心者(経営コンサルタント)より