重回帰分析でハイパフォーマ判定式を出す

このQ&Aのポイント
  • 重回帰分析を用いて、社員の能力評価項目とハイパフォーマの判定変数を組み合わせたデータからハイパフォーマである度合いを測定する方程式を求める方法について考えています。
  • 具体的な手順としては、まず、重回帰分析を行い、数値的にそぐわない説明変数を取り除きます。そして、再度重回帰分析を行い、ハイパフォーマ度を表現する連立方程式を作成します。
  • しかし、質的数値を目的変数にすることが妥当なのか、また、この考え方が正しいのかについてご意見をいただきたいです。
回答を見る
  • ベストアンサー

重回帰分析でハイパフォーマ判定式を出す

社員に対する能力評価項目(10段階)A~Jの評価スコアと、ハイパフォーマーかそうでないかという1or0のダミー変数が入ったデータがあります。 ここから、ハイパフォーマである度合いを測定するための方程式を出したいと思っており、次のような手順で実現できないかと考えました。 (1)ハイパフォーマであるかどうかを目的変数にして、重回帰分析 (2)説明変数のうち、数値的にそぐわないものを精査する (3)残った説明変数だけで再度重回帰分析を行い、連立方程式を出す ハイパフォーマ度=A×0.03+B×1.23・・・ といった表現をしたいのです。 (1)で質的数値を目的変数にして良いのか?(1,0で能力が高い方が1だから結果的に同じか?) そして、そもそもこの考え方について正しいか? といった点についてアドバイスいただけると幸いです。 どうぞよろしくおねがいします。

質問者が選んだベストアンサー

  • ベストアンサー
  • backs
  • ベストアンサー率50% (410/818)
回答No.3

> 判別分析とはまさに2つのグループを分けるための式を出すことが出来るようです。 その通りですが、3群以上の判別もできます。 > まず重回帰、その後に判別分析という流れなのかなーと思うのですがいかがでしょう? [判別分析 変数選択]というキーワードでgoogleすれば色々と情報が得られるでしょう。結論だけをいうと、重回帰分析と同じように判別分析においても変数選択の方法というものがあります。

dreamcon
質問者

お礼

いろいろとありがとうございました! 調べてみます!

その他の回答 (2)

  • backs
  • ベストアンサー率50% (410/818)
回答No.2

> 切片の違いだけということであれば、どうして重回帰分析ではダメなのでしょうか? ダメではないですよ。判別分析といっても色々な判別方法があるわけで、その中でも線形判別関数による判別は重回帰分析と関連があるというだけの話です。 ただ実務的な問題として、重回帰分析を行うプログラムで判別分析をしようとしたら、分析のたびに切片を調節するという手計算の手間はまるっきり無駄骨でしょう。 また、これは直線を当てはめて判別を行う場合に限っていえることで、曲線で判別する場合は全く別問題なので両者の方法を比較することさえ意味がありません。 要するに最終的に何を明らかにしたいのか(説明したいのか)ということによって、扱う方法も変わってくるわけです。重回帰の扱う問題は「応答変数を説明する重要な変数は何か」ということで、判別分析は「判別のために重要な変数は何か」ということです。

dreamcon
質問者

お礼

お返事ありがとうございます。 少し理解が足りないようで、いただいた内容を咀嚼出来ずにおります。 もう少し勉強した方が良いなと感じました。 手元の本を見たところ、判別分析とはまさに2つのグループを 分けるための式を出すことが出来るようです。 この式で判別得点を出せばいいのですね。 >重回帰の扱う問題は「応答変数を説明する重要な変数は何か」という>ことで、判別分析は「判別のために重要な変数は何か」 ただ、例えばA~Eまで変数があり、必ずしも全てが判別式に含まれる必要がないかと思っており、それを選別するためにはまず重回帰、その後に判別分析という流れなのかなーと思うのですがいかがでしょう? 何度もすみません。どうぞよろしくお願いします。

  • backs
  • ベストアンサー率50% (410/818)
回答No.1

> ハイパフォーマであるかどうかを目的変数にして、重回帰分析 これは判別分析、あるいは多重ロジスティック回帰分析を適用すべきでしょう(もっとも、2値データを応答変数として重回帰分析することと、線形判別分析をすることとは切片の調節をしているかどうかだけで、同じことなのですけど)。

参考URL:
http://homepage2.nifty.com/nandemoarchive/GLM/tahenryou_03_discrim.htm
dreamcon
質問者

お礼

ありがとうございます。まだ無知なものなので分からずすみません。 切片の違いだけということであれば、どうして重回帰分析ではダメなのでしょうか? 選ぶべき分析手法についての考え方を詳しく教えていただけると幸いです。 どうぞよろしくおねがいします。

関連するQ&A

  • ダミー変数だけによる重回帰分析

    被説明変数は連続変数、説明変数はすべてダミー変数、という重回帰分析を行う際に何か注意することはあるのでしょうか。あるいはこうした場合は単純な重回帰分析は使うべきでないのでしょうか。

  • Excelの回帰分析でわからないことがあります。

    統計学の初心者です。 Excel2007の分析ツールをつかって重回帰分析しようと試みています。 目的変数は1つで、説明変数は2つの回帰方程式を求めたいのですが、かなりデータの精度が低く、回帰方程式を求めると切片がマイナスになってしまいます。 このままでは、説明変数の数値がある一程の数値よりも低くなると、目的変数がマイナスになってしまいます。 ただ、私の分析では実際問題として目的変数も説明変数も全て、0以上しかあり得ません。 回帰方程式はあくまでも予測で、実際にはおこらないけれども、そのような数値がでる。ということは理解しているのですが、予測で求めた理論値を使って、次に行いたいことがありまして、どうしてもマイナスになることを避けたいのです。 この現象を防ぐために定数項を0にするを選択したところ、説明変数が0以上において、目的変数がマイナスにならない回帰方程式を求められたのですが、補正R2が、定数項を0にするを選択しない場合に比べ、大幅に数値が大きくなりました。 ネットで調べていると、定数項を0にする場合としない場合において、補正R2の算出方法が異なり、比べることはできないと書かれていました。 ご質問なのですが、それは比べては行けないだけで、この補正R2は使用しても良いのでしょう? レポートなどに補正R2=○○と書いても良いのでしょうか? 素人のため、何か的外れな質問をしているかもしれません、よろしくお願い致します。

  • YesかNoの重回帰分析のやり方

    重回帰分析を勉強していて疑問が生じたので質問させていただきます。 従属変数がYesかNoのどちらかで結果が欲しい場合、Yesが1、Noが0というようにダミー変数を用いて良いのでしょうか。 wikipediaの重回帰分析のページでは、説明変数にダミー変数を用いる場合しか書いていなかったので。 よろしくお願いします。

  • 重回帰分析について

    重回帰分析を用いて、性別を調整した解析を行いたいのですが・・・ 結果の見方がわかりません。 男を1、女を0というダミー変数にし、解析を行っています。 それによって、得られた標準化偏回帰係数が-(-)を示しているときは、男性の方が負の影響を与えているのか・・・それとも女性に負の影響を与えているのかわかりません。 また、調整するためのダミー変数ならば、得られた数値は無視して他の独立変数の値を見ればよいのか・・・どのように解釈したらよいのかわかりません。 統計に詳しいかたがいましたら、お願いします。

  • 単回帰分析と重回帰分析の結果の違い

    論文を読んでいて疑問に思うことがありました.よろしくお願いします. 私は,回帰分析とは変数Yを、p個の変数X1,X2 ,… Xpにより説明したり予測するための統計的手法であり,p=1のときは単回帰分析,p>1のときは重回帰分析と呼ぶ,と解釈しています. 今,ある施設のサービス改善についての調査論文を読んでおります.そこではアンケート調査でその施設のサービスの総合評価Yと,8個の各サービス毎の評価(x1~x8)を調べ,総合評価Yを従属変数, x1~x8を説明変数として重回帰分析にかけます.そして出た相関係数から施設の総合評価に対する各サービスの重要度を求め,改善につなげようとしています. 結果,重要度は x1>x2>x6>x3>x7>x8>x4>x5 という結果になりました.ここまではわかるんです. ですが次に総合評価Yを従属変数,x1を説明変数として単回帰分析,また総合評価Yを従属変数,x2を説明変数として単回帰分析,また総合評価Yを従属変数,x3を説明変数として単回帰分析・・・というようにこの操作をx8まで続け,出た相関係数を比較しています.結果は x1>x2>x4>x8>x3>x5>x7=x6 となっており,重回帰分析の結果と照らしあわせると最初のx1とx2は合致しているものの,あとはバラバラです.x6にいたっては最後にきています.なぜでしょうか.論文は「どのサービスも総合満足度に重要な影響を与えており,特にx1,x2,x3,x4を改善するのがよい」 と締めくくっています. 質問は3点です. (1)なぜ重回帰分析の結果と単回帰分析の結果が異なるのか (2)どのサービスも総合満足度に重要な影響があるとして,それは重回帰分析の結果だけで言えるのではないか(重回帰でも相関係数は出ているし,単回帰分析をする意味はあるのか) 稚文ですみません. 当方あまりオツムがよろしくないのでできるだけわかりやすくよろしくお願いします.

  • 重回帰分析について(緊急)

    重回帰分析について.(緊急) 大学で近赤外スペクトル法を用いた研究をやっています. 解析方法にはPLS回帰分析を使用しており,目的変数を熱電対の温度T,説明変数を各波長の吸光度差スペクトルΔAでとっています. 現在,上記の研究を分光器ではなく近赤外線カメラで行おうと考えています. しかしながら,近赤外線カメラは分光器のように各波長の吸光度差スペクトルΔAを出すことができません(1920nmのΔAのみ). 単回帰分析に変更しようと思っていますが,参考書などを読む限り精度は,単回帰分析<重回帰分析<PLS回帰分析のような気がしてなりません. そこで質問です. ・説明変数は波長1920nmのΔA(以下ΔA(1920))しかありませんが,ΔA(1920)の関数である光強度Iを無理やり説目変数に入れ,重回帰分析を行うことはできるのか?(説明変数に使われている変数の関数をしようすることはできるのか?) ・上記のように説明変数の因子が一つしかない場合でもPLS回帰分析を行うことはできるのか? 以上です.今年から上記の研究を始めたので勉強不足な点もあるかとは思いますがどなたか教えてください. よろしくお願いします.

  • 重回帰分析ダミー変数ありで使用できるような事例と数値データはないでしょうか。

    重回帰分析でレポートを書きたいのですが、重回帰分析ダミー変数ありで使用できるような事例と数値データはないでしょうか。 よろしかったら誰か教えてください(>_<)

  • 重回帰分析と数量化理論について

    データ分析を行っているのですが、例えば売上を分析するときに、説明変数として気温などの量的データと曜日や天気などの質的データ(ダミー変数を用いる)を一緒にしてExcelの回帰分析の機能を使用し分析することは、数量化理論(1)類といえるのでしょうか?それとも重回帰分析というのでしょうか?それとも他に呼び名があるのでしょうか?

  • 重回帰分析について

    重回帰分析についての質問です *学生本人、その父親・母親の身長および性別 身長  性別(X) 父の身長(X2) 母の身長(X3) 176 1     174      166 173 1     169      160  ・  ・      ・        ・  ・  ・      ・        ・  ・  ・      ・        ・ というデータがあるとします。説明関数xが性別のダミー変数で男なら1女なら0の値をとる。変回帰分析係数β^1の値からどの様なことが読み取れますか?

  • エクセルの回帰分析について

     エクセルで回帰分析をおこなったのですが、有意な結果がでませんでした。説明変数がすべてダミー変数であるからでしょうか?ダミー変数のみで回帰分析を行うことは可能ですか?