• 締切済み

相関分析と回帰分析をしたいのですが

ある雑誌のランキング数値(企業のCSRや環境度に関するもの)と株価および会計数値との相関分析と回帰分析を行いたいと思っています。 雑誌に掲載されているものは1~200位までなので、これを基に相関分析を行おうと思うのですが、対象企業は1000社ほどあるようなのです。1~200位だけでもサンプルとして妥当でしょうか? また上記の条件で回帰分析を行うこともできるのでしょうか? 統計分析初心者なため、どのように分析すれば良いのか分かりません。もし参考文献などご存じでしたらよろしくお願いします。

みんなの回答

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.3

>「擬相関」についてですが、5つの要件については、具体的にどのようにチェックするのでしょうか  これが難しい。当然ながら、初心者用には、書いてありません。  専門書でさえ、例えば密接性については、「強い関連があること」なんぞと書かれたりしていて、ウッカリ納得してしまいます。このように、説明文を読むと、それなりに分った気にはなるのです。が、明確な基準が、すなわち何をもって強い弱いを判断するかが、書かれていません。  私なりの方法は、ありますが、ここに書くと私の実名が分かってしまう可能性があるので、書かない、と逃げておきます(本は、絶版になっていると想うので、まあバレナイが)。この擬相関の判定法については、3年ほど悩みましたので、1年ほどは苦慮して下さい。それでも正解が得られなければ、「擬相関の判定法は、1年間の悩み」とでもして、書きこんで下さい。目に止まれば、回答します。言葉だけで教えても、目から鱗、にはなりませんので。  しかし、合理性については、「合理性を判定できる科学的方法論は無く、経験によってのみ判断される」と非科学的に述べていますが。  気になるのは、ランキングが、株価や会計数値によって、つけられているのではの疑問。これだと、別の表現をしているの過ぎません。  例えば、日本は、世界一平均寿命が長いのです。が、死亡率との相関をとれば、強い負の相関があります。生きるの裏返しが死亡ですので、これは別の表現をしただけ、ということで、研究するまでもなく、だれでも推定できることです(実際にはこれほど単純ではありません)。  むしろ、相関が無い方が、学問的には価値があるかも。

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.2

>1~200位だけでもサンプルとして妥当でしょうか? 統計学では、「有意差有り」を主張できれば十分、というよりそれしか結論できないので、サンプル数は無関係です。ただ、サンプルを恣意的に選ぶことは許されません。それより、1~100、101~200に分けて、解析して、双方とも有意差有りなら、下記の普遍性をある程度クリアできます。  手順としては、まず散布図を描きますが、200もあれば一見バラバラ、無関係に見えても、検定では有意差あり、の結論になることも経験しています。  ちなみに、統計学は、その性質上、サンプル数を増やせば増やすほど、有意差は出やすくなります。  社会学の相関分析では、有意差ありの結論を得た後、特に「擬相関」の問題についてクリアする必要があります。これには、9要件、7要件、などが提案されていますが、私は、時間性、密接性、特異性、普遍性、合理性の5要件で判定しています。  エクセルの利用法については、我田引水ですが、 http://oshiete1.goo.ne.jp/qa3516234.html

参考URL:
http://oshiete1.goo.ne.jp/qa3516234.html
charocharo
質問者

お礼

ご回答いただきありがとうございます。 これから分析を進めていく上で非常に勉強になりました。 「擬相関」についてですが、5つの要件については、具体的にどのようにチェックするのでしょうか。有意差ありの後にさらに判定が必要なのですね。もし、ご回答可能でしたらよろしくお願いします。

回答No.1

社会科学なら200個程度のデータがあれば一応の統計分析でものは言えます。 回帰分析とか相関分析とか今はエクセルで簡単にできてしまうのですぐにやりがちですが、手順が大事です。 理論仮説をつくる→実証可能なモデルを立てる(数式化)→モデルに合ったデータを集める・加工する→データの記述統計(平均や分散、相関係数)を作成して眺める(記述統計の結果で言えることは何か考える)→回帰分析などを行う→検定統計量などをみて有効性を見る→ダメならどこを修正すべきか検討する(理論?モデリング?データ?分析手法?精度?)→繰り返す 白砂、鳥居などの初心者向けの統計学のテキストを読んでみましょう。

charocharo
質問者

お礼

アドバイスいただきありがとうございます。 参考にあげていただいたものを読んでみます。 まずは手順が大事なのですね。 使いこなせるように勉強したいと思います。

関連するQ&A

  • 相関分析と重回帰分析

    大学3回生で、来年度の卒論のために先行研究を読んでいます。 私が書く卒論では統計分析が必要なのですが、 先行研究を読んでいて疑問に思ったことがあるので、質問させてください。 ある論文で、変数間の相関を分析した後、重回帰分析を行っていました。 ところが、相関分析において相関の出ていない変数に対しても重回帰分析を行っており、 その結果、 「相関分析では有意な相関が見られない」にも関わらず、「重回帰分析では有意な結果が見られる」 というような書き方がなされていました。 また、この論文における考察部では、相関分析と重回帰分析をまとめて考察しており、 ほとんど重回帰分析の結果についてしか触れられていませんでした。 相関分析と重回帰分析を両方行う場合、相関がない変数についても重回帰分析を行うべきなんでしょうか? ゼミに教授に質問しにいっても、現4回生の卒論などで忙しいのか、 今度にしてくれ、と言われてしまいましたので、こちらで質問させていただきました。 不勉強で、重回帰分析の仕組みが良くわかっておらず、大変心苦しいのですが、 宜しければ回答していただけると、とても助かります。

  • 回帰分析について概念的なところを教えて下さい

    回帰分析について、統計学の初心者の私にふわっとどういうものか教えて頂けますか? 自分の理解としてはAとBがあって、AがこのくらいならBはこのくらいだよというのが 分析できる(?) です。 また、相関関係との関連を教えて欲しいです。 相関関係を出してから回帰分析するのかなど。

  • 相関分析や回帰分析について

    相関分析や回帰分析についての記述が正しいのかわかりません。 間違っていたらどこが違うのか理由も教えていただけると幸いです! (1)ある特性、例えば、身長についてゴールドンのいう第二世代(子)の平均への回帰が観測される(b<1)のとき説明変数と被説明変数を逆にした回帰計算をしてもいわば、おやの平均への回帰が観測される可能性はない。(親と子の身長には、正の相関があると考えてよい) (2)第二世代(子)が平均へと回帰するのならば、将来は、個人のもつ身長その他、さまざまな諸特性がすべて一様な社会になってしまう。(ある経済学者はそう考えた) (3)重回帰の場合、通常の決定係数を使用すると、説明変数の増加のよるあてはまりのよさの改善を誇張してしまうので、修正済み決定係数(自由度調整済み決定係数)を使用するのが普通である。もいろん、単純回帰については、決定係数と修正済み決定係数は同じものになる。 (4)決定係数は、マイナスになることはないが、修正済み係数はマイナスになりうる。 (5)回帰分析を因果関係と結びつける(説明変数を原因、被説明変数を結果と見る)ことは、記述統計の範囲を逸脱している。 よろしくお願いいたします!!!

  • 【統計学】重回帰分析と正準相関分析の違いを教えてください。

    統計学初心者です。 文系でも分かる統計学といった類いの本を 読んでいるのですが、重回帰分析と正準相関分析の違いが分かりません。どうも同じように思えてしまうのですが・・・ 素人なので分かりやすく説明してください。

  • 回帰分析についてわかる方…

    大学の授業で統計学の授業をとっているのですが、 レポートの課題が回帰分析でした。 回帰分析までやったのですが回帰分析の妥当性評価の ところがやり方がわからず、頭が混乱してしまいます。 妥当性評価で以下の3つのポイントをチェックしろと言われました 1、符号条件 2、x値 3、相関係数、決定係数 「符号条件」というのは各変数が直感的に正しく影響しているか? ということらしいのですが… これはつまり何をすればいいのでしょうか? 符号がマイナスだといけないのですか? 2番のx値というのは、どこをみればいいのでしょうか… 文章がわかりずらくてすみません。 わかる方、どうかお願いします。

  • 相関分析の相関係数と重回帰分析の偏回帰係数の違いの説明

    実は会社での説明に苦慮しています。 例えば、携帯電話の(1)メーカー/(2)デザイン/(3)機能の(4)購入意向、に対する影響度を見たい、という時に、重回帰分析における偏回帰係数で(1)(2)(3)の(4)に対する影響度を測ろうとしているのですが、「(4)と(1)(2)(3)それぞれの相関の高さで見るのと何が違うのか?」と聞かれてしまい、回答に窮しています。あまり統計に詳しくない人(私もそうですが)に対し、うまく説明する方法はないでしょうか。 どなたかお知恵をいただきたく、よろしくお願いします。

  • 回帰分析について教えてください

    統計に関する質問です。 私は勤務先(金融)で特定の業種の財務分析をしているのですが、データの分析方法(回帰分析)で分からない点があります。 具体的には下記の通りです。 【状況】 ある業種業界について、2つのデータ(例えば、総資産と売上高)を収集しました。 データは5年間分をパネルとして扱っており、総数は400くらいです。 2つのデータ間に何らかの関係をあると考え、総資産を横軸、売上高を縦軸、としてエクセルで散布図を作成したところ、右上がりの関係があるように感じました。 エクセルの機能で近似値線(直線)を引いて、算式とR2を表示したところ、算式の傾きはプラスで、R2は0.2程度でした。 その後、回帰分析を行い、分散分析表を作成しました。 相関係数の有意性を検定したところ、1%水準で有意な関係、となりました。 回帰係数も検定したところ、1%水準で有意な関係、との結果でした。 【私の主張】 私は「統計学的に考えて、総資産の増加に伴い売上高が増加する傾向がある」と述べたいのですが、 (なお、背景にある理論は別途構築しており、業界内でも理解が得られると思われます。) 【ご質問】 1. 回帰分析の結果から、回帰直線の傾きがプラスで、相関係数の関係が1%の有意水準で有意であることから、統計学的に私の主張は正しいと言えるのでしょうか?評価は個人ですべきものだとは存じますが、考え方・説明方法に無理があればご教示をお願い申し上げます。 2. もし、上記1の質問が的外れであれば、どのような点がおかしいのでしょうか。ご教示いただきますようお願い申し上げます。 抽象的な部分もございますが、何卒ご教示のほど、お願い申し上げます。 【前提】 上記は私の職務柄、個人で利用する目的で作業を行っています。 論文その他レポートの作成を目的としておりません。

  • 統計データの回帰分析

    経済をはじめいろんな統計データがあると思いますが そういったデータの中で、重回帰分析されているものを 探しているのですが、参考になるHP、文献を教えてください

  • 単回帰分析と重回帰分析の結果の違い

    論文を読んでいて疑問に思うことがありました.よろしくお願いします. 私は,回帰分析とは変数Yを、p個の変数X1,X2 ,… Xpにより説明したり予測するための統計的手法であり,p=1のときは単回帰分析,p>1のときは重回帰分析と呼ぶ,と解釈しています. 今,ある施設のサービス改善についての調査論文を読んでおります.そこではアンケート調査でその施設のサービスの総合評価Yと,8個の各サービス毎の評価(x1~x8)を調べ,総合評価Yを従属変数, x1~x8を説明変数として重回帰分析にかけます.そして出た相関係数から施設の総合評価に対する各サービスの重要度を求め,改善につなげようとしています. 結果,重要度は x1>x2>x6>x3>x7>x8>x4>x5 という結果になりました.ここまではわかるんです. ですが次に総合評価Yを従属変数,x1を説明変数として単回帰分析,また総合評価Yを従属変数,x2を説明変数として単回帰分析,また総合評価Yを従属変数,x3を説明変数として単回帰分析・・・というようにこの操作をx8まで続け,出た相関係数を比較しています.結果は x1>x2>x4>x8>x3>x5>x7=x6 となっており,重回帰分析の結果と照らしあわせると最初のx1とx2は合致しているものの,あとはバラバラです.x6にいたっては最後にきています.なぜでしょうか.論文は「どのサービスも総合満足度に重要な影響を与えており,特にx1,x2,x3,x4を改善するのがよい」 と締めくくっています. 質問は3点です. (1)なぜ重回帰分析の結果と単回帰分析の結果が異なるのか (2)どのサービスも総合満足度に重要な影響があるとして,それは重回帰分析の結果だけで言えるのではないか(重回帰でも相関係数は出ているし,単回帰分析をする意味はあるのか) 稚文ですみません. 当方あまりオツムがよろしくないのでできるだけわかりやすくよろしくお願いします.

  • 重回帰分析と相関分析の結果の差異について

    都内4年制大学に通う学生です。 現在、学校の課題で統計処理を行っているのですが、困っている事があります。 変数Aと変数Bとの関係において、2変量の相関分析では有意ではなかった(r=-.05,p>0.1)にも関わらず、重回帰分析では独立変数Aが従属変数Bに対して負の影響を与えているという事が明らかになり(β=-.30,p<0.05)、これを他の人にどう説明してよいか分からないのです。 この場合、独立変数Aは抑制変数と呼ばれるものになるのでしょうか? まだまだ統計の知識も浅い未熟者なので、できるだけ易しく教えて頂けると助かります。 何卒よろしくお願いします。