• ベストアンサー

所属部署と業績評価の「ばらつき」度合を検定する方法について

エクセル関数について少々の知識はあるのですが,統計に疎いため困っています。 いま,下記データがあり,個人の業績評価は所属部署に影響されないこと(あるいは影響される)ことを調べようとしています。 (1)所属部署のコードナンバー(40部署ほど,4桁) 0100,0200,1000,5000 … (2)個人の業績評価(6段階,1桁)    5,4,3,2,1,0 この場合の関数ですが,ばらつきについて相関関係を調べようとしているのですが,コードの数字に大小があるため,分散でも標準偏差でもうまくいかない感じで,何か良い関数,あるいは方法が無いか悩んでいます。 お力を貸していただけませんでしょうか?

質問者が選んだベストアンサー

  • ベストアンサー
  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.2

>個人の業績評価は所属部署に影響されないこと(あるいは影響される)ことを調べようとしています。 統計学での検定は、差があることを示したいときに使います。相関だけは例外的に、「差がない」そのものではありませんが、AはBと同程度、という証明に利用することはできますが、本来の利用法ではありません。ですから、何をしたいのか、まず明確に決めて下さい。  ご提示の内容で、(1)は、No1の方がご指摘のように、みかけは数字ですが、文字です。すなわち、ア、イ、ウなどに変えても支障はないからです。すなわち、統計の対象にはなりえません。 (2)についても、5の人は、1の人の5倍の能力がありますか。5=1×5の数式は成立しないので、一般の数字とき異なります。順番はこのとおりでしょえから、順序を示す順序尺度というようです。すなわち、2と3の平均は、2.5ですが、5の人が1の人の5倍の評価、3の人は2の人の1.5倍の能力、というのなら平均値は信頼できますが、この場合、平均値さえ信頼できないということになります。特に、0の人は、平均を求めると「完全な無能力者」としての判定になります。 >相関関係 部署と評価の因果関係ですから、相関を利用するのは妥当です。しかし 問題は、部署のコードナンバーは、その部署の性質・特長を示す数値ではなく、名目的な数字(実際には、ア、イ、ウの文字の代用)に過ぎません。相関分析は、意味のある数値でなければなりません。体重50kgの人はヤセている、100kgなら肥満と、誰も同じ想像ができます。部署500と聞いてもどんな部署か誰もイメージが湧きません。同じ500でも、A社は総務、B社は営業かもしれません。  評価も、5の人は1よりも能力がありそうだが、評価した人は5倍と考えて、5にしたのでしょうか。何より、完全な無能の0の人を雇用したままとは思えないのです。仮に、窓際の人がいても、ゼロでは無いとおもうのですが。  したがって、評価の方法も統計的に利用できるように工夫する必要があります。  と、文系的に書いておきます。  文系の人は、「工夫すべき」とご立派なことはいうのですが、どのように工夫したらよ良いのか、具体的な方法は示さないので、なんの役にもたちません。先日も、中身のない「美しい」とか「立派」とかの美辞麗句ばかりで、『寝たろ』と決心しましたが、あまりのヒドサに眠れませんでした。『寝たらアカン』と感じつつ寝るのは、気持ちのいいものですが。  と、ここまで書いたら、次を書かなければ、同じ中身のない人間なるので、調べる目的は、同じことを示すことですか。違うことを明らかにして、「評価は不公平」と文句を言いたいのでしょうか。  評価が不公平なことを補正する方法は、あります。この場合でも、評価のしかたは、工夫する必要があります。 1) ゼロは除く。 2) 幅を広げる。0から5では、人々は最低の0と最大の5は、まずつけません。すると、1から4までの争いになります。これでは、幅が狭すぎて、差がつきにくい(会社側の人間で、「評価に差は無い」「正当にやっている」というのなら、このままでどうぞ。これを「統計で嘘をつく」と表現します)。 3) 評価する人に、5の人は1の人の5倍の能力と最初から言って置く。  部署による差は無い、あるいは差は無いと仮定したい、というのなら、統計学で簡単にできます。大学の入試で、日本史と世界史はどちらかの選択だったが、平均点に大差があった(部署による評価に差があった)。不公平を避けるため、これを補正するのに利用している大学もあります。    

その他の回答 (1)

  • ltx78
  • ベストアンサー率45% (10/22)
回答No.1

所属部署コードナンバーの数字に対して分散などを計算しようとしているのではないでしょうか? もしそうでしたら,まずはコードの数字を「数値」だと考えるのをやめる必要があります. 仮に0100というコードが9999であったとしても, 既に9999というコードを持つ部署がない限りは,「業績と所属部署」には全く影響しないはずです. コードの数値の近さが業務内容の近さを表しており, 業務内容の近さも考慮に入れて何らかの評価を行いたい,といった場合は別ですが. あとは,部署ごとに業績評価の平均と分散などを求めて とりあえずデータを眺めてみれば良いのではないでしょうか. もちろん,仮説検定などを行って統計的な基準で差があるかどうかを評価することはできますが, まずは直感的に人間がそれを判断することが重要です.

関連するQ&A

  • エクセル関数で「ばらつき」を調べるには?

    エクセル関数について少々の知識はあるのですが,統計に疎いため困っています。 いま,下記データがあり,個人の業績評価は所属部署に影響されないこと(あるいは影響される)ことを調べようとしています。 (1)所属部署のコードナンバー(40部署ほど,4桁) 0100,0200,1000,5000 … (2)個人の業績評価(6段階,1桁)    5,4,3,2,1,0 この場合の関数ですが,ばらつきについて相関関係を調べようとしているのですが,コードの数字に大小があるため,分散でも標準偏差でもうまくいかない感じで,何か良い関数,あるいは方法が無いか悩んでいます。 お力を貸していただけませんでしょうか?

  • 業績評価について

    アパレルの店長をしています。 半期ごとに目標立てを行い自己評価→直属上司評価→部長承認→年俸決定となります。 前期の個人目標の一つが、会社の業績や伸び率、おかれている環境や自己のキャリアなど総合的に判断し上司承認のもと【自店売上:昨年対比5%増加】でした。 年俸査定がかかっているので必死に取り組み、結果10.5%増加する事が出来たので『目標を上回って達成』としました。 しかし、上司からは「部署全体的に見ると昨年対比は平均90%で全体的に上がっていないので、『目標を概ね達成』に書き換え再提出」と言われました。 部署全体での業績が良くないので年俸UPは無しと言われるのは仕方がないし異論は無いのですが、個人の目標立てに対する評価であって、全体の成績が悪いから評価を下げるというのは少々疑問です。当たり前の事なのでしょうか・・。 また、業績評価自体昨年始まったことなので一般的な評価基準もよく把握できていないのですが、一般的に目標に対しプラス5.5%増加(自店売上昨年対比では110.5%、部署平均昨年対比は90%)程度では『上回って』には入らないのでしょうか・・。 評価は具体的事例や数値推移、結果を述べた上で『目標を大幅に上回って達成』『目標を上回って達成』『目標を概ね達成』『目標を下回った』『目標を大きく下回った』の五段階評価です。 他の評価項目の例は【棚卸:売上に対するロス比率、前期より5%削減】→8%削減できたので『目標を上回って達成』(この場合、部署全体でのロス比率は比較されていない):承認。【育成:(特定の部下の)サブ育成】→水準に達し、チェッククリアの為『目標を概ね達成』:承認。などです。 上司に聞くのが一番近道なのですが、決定的縦社会で上司の仰る事に異論を唱えれば問題児扱いで査定がマイナスになる(=年俸が下がるかも!!)ので、質問するかも悩んでいます。 来期の目標立てもそろそろ決定しなければならないので、個人(自分が店長を勤める店舗)での成績がよくても全体が良くないなら評価の対象にならないのであれば、一番明確で結果が出やすいのですが売上関係は目標から外そうと思っています。これ以上給料が減っては涙目なので。。 一般的な見解を聞かせて頂けると助かります。宜しくお願い致します。

  • 変動係数の評価と検定

    変動係数について質問させて下さい。 統計の初心者ですので、とんちんかんな事を聞いているかも知れませんが、そこはお許し頂きたいと思います。 今回教えていただきたいのは、変動係数についてです。 データの基本統計値を見ると、その中には簡単な物からわからない物がありました。 特に、変動係数(CV)に付いてはどう考えたらよいのかわかりません。 色々、調べてみると、計算式から考えて、標準偏差を平均で割っているので、各群から得られた平均値を単一にそろえてばらつきを見ている。 (代数幾何のベクトルで言うと単位ベクトル化していると判断しました) Wikipediaでは相対的なばらつきと書いてあり、何となくわかった感じがします。 例えば、ある2群の生データ(それぞれ100個ずつ)があるとします。 Aの平均は500、S.D.は25とします。 Bの平均は400、S.D.は18とします。 A、Bの変動係数はそれぞれAが0.05、Bが0.045になります。 ここでAにはある余分な因子が含まれているので、それを除いて加工したとします。つまり、100個の生データから個々に50を引いたとします。 当然、S.D.は変わらないと思うので、25のままで平均が450になります。 そうなると、変動係数は0.056となり若干大きくなりました。 生データではAとBは近い値なのに、Aを補正した場合に得られる変動係数は大きくなるためAとBが遠のいてしまいます。 こうなった場合は、どちらが良いのか、評価が難しくなります。 また、変動係数の検定は、どうしたらよいのでしょうか? ちなみに、インターネットで青木先生のサイトを見つけて、見ようと思ったのですが、つながらないために、この場で教えていただければと思います。 難しい統計言語はなかなか解釈が出来ない時があります。 お手数おかけしますが、出来るだけかみ砕いて教えていただけると大変ありがたいので、よろしくお願い申し上げます。

  • 統計学について

    統計学の無相関検定について 無相関検定について理解ができておらず、 どなたか教えてください。 理解できていない場所を理解したいので、 非常にまとまりがありませんが、箇条書きとしました。 番号ごとに箇条書きしたので、 番号に対応するように回答を頂けると幸いです。 よろしくお願いします。 (1)無相関検定により、帰無仮説が採択されると、相関係数の数値の大小に関係なく、一律で統計結果自体を無効にする。 (2)統計結果自体の無効とは、すなわち相関係数ゼロのことを指す。 (3)相関係数ゼロとは、すなわち無相関のことを指す。 (4)「相関の強さ」と「有意」は別個の考え方である。 (5)「相関が強いこと」=「相関係数が1または-1に近いこと」である。 (6)相関が強い場合でも、有意でない場合は、「統計自体が無効だった」ということになる。 言い換えれば、「統計結果は無相関だった」という解釈になるのだろうか? (7)相関が弱い場合で、かつ有意である場合は、「弱い相関があった」ということになる。 (8)「統計自体が無効だったこと」=無相関なのか? (9)「相関の強さが弱過ぎる」=無相関なのか? (10)相関があるという仮説の数は無限であり、相関が無いという仮説の数は1つである。 11.相関係数がゼロであることは、無相関検定をやること以外の方法では生じない。 つまり、変数が2つのとき「偏差積の平均÷標準偏差X÷標準偏差Y」の計算結果によって、相関係数がゼロという答えが出ることはない。(無相関検定をやる前から無相関であるという答えが導き出されることはない) 非常にまとまりが無くて申し訳ありませんが、よろしくお願いします!

  • 統計 基準値の標準偏差はなぜ1か

    統計の勉強をしていて、標準偏差とはデータの ばらつき具合、分散と書かれていました。 平均から比べてどのくらい差があるかという事は 理解しました。 しかし基準値を勉強していて、 本には基準値の平均は必ず0である。標準偏差は 必ず1であると書かれています。標準偏差は データのばらつき具合なのに、なぜ基準値の元では すべての標準偏差は1になるのでしょうか?

  • 標準偏差の評価において妥当なデータ数は幾つか?

     標準偏差や分散などのデータのばらつきを調べる場合、評価の対象にするデータ数が多い程、その母集団の性質に近くなります。しかし、評価するデータ数が2個では、それから標準偏差を求めても、それが母集団の性質を表す数値とは言い難いです。評価するデータ数が幾つ以上であれば、その標準偏差や分散が意味のある値となるのでしょうか?一般的に。

  • 統計に関する疑問

    統計検定の問題なのですが、(以下問題) あるアンケート調査で,いくつかの質問をした。問1は次の形式である。 あなたは「XXX」の意見に賛成ですか,それとも反対ですか?次の1から5のうち, あてはまるもの一つを選んでその数字を○で囲んでください。 1. 賛成  2.やや賛成  3.どちらでもない  4. やや反対  5. 反対 問2は「YYY」の意見についての同様な 5 肢選択の質問である。 回答について、○で囲まれた数字コードを数値として記録した。問1について集 計した結果は,平均が 2.6,標準偏差が 0.84,問2との相関係数は 0.46 であった。と ころが,問1の質問の趣旨を踏まえれば,選択肢の数字コードを逆向きにした方が よいのではとの意見が出されたので, 「賛成」を 5,「やや賛成」を 4,「どちらでもない」を 3,「やや反対」を 2,「反対」を 1 に振り直した。この数値コードを新コードと呼ぶ。新コードに基づいた平均,標準 偏差,相関係数がどうなるかについて,次の記述 I~III がある。 I. 平均は変らない。 II. 標準偏差は変らない。 III. 相関係数は変らない。 これらの記述の正誤の組合せとして,適切なものを次の 1 ~ 5 のうちから一つ 選べ。 答えは「II のみが正しい。」 になるのですが、なぜでしょう。 平均が変われば、各変数から平均を引いて、算出する分散の値も変われば、標準偏差も変わると思うのですが。統計を勉強し始めたばかりで、わからないことばかりです。 詳しく解説していただけるとありがたいです。 出典:統計検定2級 問題より http://www.toukei-kentei.jp/about/pastpaper/2012/grade2.pdf

  • 共分散と相関係数について

    ファイナンス(証券投資)の勉強をしているのですが、共分散と相関関数でどうしても理解できない部分があるので、こちらのカテゴリで質問させて頂きます。 1.具体例(前提) A証券とB証券のポートフォリオ効果を調べるために、両者の相関性を計算します。 A証券の環境変化(期待収益率=平均収益率:20%*0.4+10%*0.4+5%×0.2=13%) 為替相場:円高→確率:0.4→収益率:20%→偏差:7% 為替相場:不変→確率:0.4→収益率:10%→偏差:-3% 為替相場:円安→確率:0.2→収益率:5%→偏差:-8% A証券の標準偏差:7*7*0.4+(-3)*(-3)*0.4+(-8)*(-8)*0.2の平方根=6% B証券の環境変化(期待収益率=6%) 為替相場:円高→確率:0.4→収益率:3%→偏差:-3% 為替相場:不変→確率:0.4→収益率:7%→偏差:1% 為替相場:円安→確率:0.2→収益率:10%→偏差:4% B証券の標準偏差:≒2.68% 2.質問 (1)共分散について この場合に、共分散は、Σ(A証券の偏差×B証券の偏差×確率)で求められると記述があります。 A証券の偏差×B証券の偏差の平均をとったものだと思います。 上述の例では、共分散は、結果的に-16になります。 この際、共分散の数値が正(+)である場合は、同方向、負(-)である場合は、逆方向の相関性があるというのは、掛け算の性質から理解できます。 その上で、共分散の絶対値は、2つの証券の相関性の程度であって、絶対的が大きい程、相関性は高いと記述がありまして、ここで理解できずにいます。 なぜ、両者の偏差を掛け合わせることで、両者の相関性の程度が計算できるのでしょうか? 例えば、一定条件のA証券の偏差が1%、B証券の偏差が2%の場合は、1*2=2と計算されますが、仮にA証券の偏差が19%、B証券の偏差が20%の場合は、19*20=380になります。 相関性というならば、両者は同方向に1%しか差がないにもかかわらず、相関性として計算される数値は雲泥の差です。 この点についてご教示頂ければと思います。 (2)相関係数について 相関係数は、共分散/(A証券の標準偏差×B証券の標準偏差)で求められると記述されています。 上記の例の場合は、-16/6%*2.68=-0.995と非常に高い負の相関性があります。 そしてこの式は、共分散(A証券の偏差×B証券の偏差の平均)を両証券の標準偏差(偏差の正数値の平均)で割ったもので、これが-1~1の間で推移することは理解できます。 ただ、上記の共分散と同様に、両者の偏差(及び標準偏差)を掛け合わせることで、両者の相関性の程度が計算できる理屈がわかりません。 この点についてご教示頂けないでしょうか? ご回答よろしくお願い致します。

  • 統計学 分散について

    今ネットのHPでハンバーガー統計学とういところで統計学を覚えようとしています。 このHPで、 データのばらつきを数値で表す という、項目があります。  ここでは、分散の式を分かりやすく説明しているのですが、 HPの説明では・・・ 平均値からのずれ(つまり個々のデータと平均値との差)を足せば、ばらつきの数値になるのではないかと考えます。つまり、 ばらつき案1=(データ-平均値)の総和 ということです。しかし、これですと、データが小さいときに(データ-平均値)はマイナスになるので、総和を求めてもゼロになってしまいます。そこで、2乗することでマイナスをプラスにします。次の案はこうなります。 ばらつき案2=((データ-平均値)の2乗)の総和 しかし、まだ問題があります。この式ですと、データの個数が大きくなるにつれてばらつきが大きくなってしまいます。個数の大小にかかわらず、ばらつきを求めたいのです。そこで、総和をデータの個数で割ることにします。式は、 ばらつき案3=((データ-平均値)の2乗)の総和÷個数 これで良さそうです。この「ばらつき3」のことを「分散」と呼びます。もう一度式を書いておきましょう。 分散=((データ-平均値)の2乗)の総和÷個数 分散は、データが平均値を中心にして、どのくらいばらついているのかを示した数値です。 と、あります。  分散は平均からのずれを出すのであれば、 分散=((データ-平均値)の2乗)の平方根の総和÷個数 が正しいような気がします。 例えば平均から+5cmの2乗は25なのに、 +0.3cmの場合2乗は0.09になってしまい、 大きくぶれたものはより大きく、 小さくぶれたものはより小さくなってしまいます。 ばらつき案1で データから平均値を引いた答えに+と-があり、 総和を求めると、この+と-のブレがお互いに干渉しあって 数値を0に近くする為、 一度2乗して+と-を無くしたのに、 何故その後、そのままなのかよく分かりません。  2乗して+と-を外したなら、次に平方根を出し数値を実態に近い値にすればいいのにと思ってしまいます。  言ってる事がいまいち伝わらないかと思いますが・・・  どなたか解説お願いします。  分散とはそういう計算式なんだ!と、 言ってしまえばそれまでですが、 どうしても納得がいきません・・・

  • 3σについて

    3σとは何でしょうか? σというのは標準偏差(ばらつきを評価するもの?)ですよね。 また、実験値(数値列)があるとします。1.05±0.4%(正規化分散というらしい、この範囲に正解値が分布しているという事例があるので、実験値を評価したい)というのは、3σの範囲を表示すれば、3.15±1.2%となり、±3.15%、つまり、1.03と0.97を正解値に掛けることになるのでしょうか?それはなぜでしょうか?イマイチ理屈が分かりません。 またここで、1.2とは何でしょうか? 2σや6σもあるが、3σを使う理由は何か?何を意味するのか? 3σの範囲に入らなければ、ばらつきがある?駄目なのでしょうか? 言い訳ではないのですが、確率を習ってなく、自分で調べているのですがよく分かりません。 この汚い文章を見て、私が何をしたいか予想がつく方は、どうかお助けください。