• ベストアンサー

エクセル関数で「ばらつき」を調べるには?

エクセル関数について少々の知識はあるのですが,統計に疎いため困っています。 いま,下記データがあり,個人の業績評価は所属部署に影響されないこと(あるいは影響される)ことを調べようとしています。 (1)所属部署のコードナンバー(40部署ほど,4桁) 0100,0200,1000,5000 … (2)個人の業績評価(6段階,1桁)    5,4,3,2,1,0 この場合の関数ですが,ばらつきについて相関関係を調べようとしているのですが,コードの数字に大小があるため,分散でも標準偏差でもうまくいかない感じで,何か良い関数,あるいは方法が無いか悩んでいます。 お力を貸していただけませんでしょうか?

質問者が選んだベストアンサー

  • ベストアンサー
回答No.1

こういうものを比較する手法の一つにχ自乗検定があり、Excelでは chitest関数が用意されています。仕様はヘルプを、理論は適当な統 計の教科書を参照して下さい。 統計検定っていつ習うんだっけ。高校受験で偏差値がどうこうって 話題になるときはまだ標準偏差の話なんて教わってなかった記憶が あるんだけど、名義尺度がどうした順序尺度がこうしたってネタを やった記憶がないなぁ。

hihi21c
質問者

お礼

χ二乗検定についてもう少し勉強してみます。。。 統計は力はあるものだけれど、なかなかとっつきにくいですね。受験の時は確率統計はほとんどしてませんでした。悔やまれます。

全文を見る
すると、全ての回答が全文表示されます。

その他の回答 (1)

  • fujillin
  • ベストアンサー率61% (1594/2576)
回答No.2

エクセルはともかく、統計を理解しておかないと、結果を人に説明する時に困りますよね。 学生時代の記憶なので・・とてもおぼろげですが。 多分、分散分析になるのではと思いますが、ちょっと探してみたら、エクセルを利用しながら「検定」や「分散分析」をやさしく解説しているURLを見つけました。 まずはとっつき易いところで、大体の概念を見てみてから、統計の本を読むなり、Webで検索したりして、正確な知識を身に付けるのが宜しいかと思います。 http://kogolab.jp/elearn/hamburger/index.html

hihi21c
質問者

お礼

ありがとうございます。 やはり、統計の勉強は必要ですね・・・ もう一度勉強しなおします。 ありがとうございました。

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • 所属部署と業績評価の「ばらつき」度合を検定する方法について

    エクセル関数について少々の知識はあるのですが,統計に疎いため困っています。 いま,下記データがあり,個人の業績評価は所属部署に影響されないこと(あるいは影響される)ことを調べようとしています。 (1)所属部署のコードナンバー(40部署ほど,4桁) 0100,0200,1000,5000 … (2)個人の業績評価(6段階,1桁)    5,4,3,2,1,0 この場合の関数ですが,ばらつきについて相関関係を調べようとしているのですが,コードの数字に大小があるため,分散でも標準偏差でもうまくいかない感じで,何か良い関数,あるいは方法が無いか悩んでいます。 お力を貸していただけませんでしょうか?

  • エクセルの関数について

    エクセルで部署コートが同じ人をまとめて一枚の用紙に出したいとおもっています。 シート1 部署コード    名前欄  1     田中 原田 中野 宮本  2     大木 松下 伊藤   3     石川 神崎 乾  斉藤  鈴木 といった風にコードの横に人の名前が入っています。 (部署は7.8箇所あります。人数のばらつきもかなりあります) シート2 部署コードを入れると 該当する人の名前が表示されるセル*10行 といった風に表示させるには 名前が表示されるセルの関数をどのようにすればいいのでしょうか?

  • 統計関数

    こんにちは。私は、看護学生です。 今パソコンの授業で、統計関数というものを習っています。 標準偏差・分散・尖度・歪度・四分位範囲など・・・ どこかの大学の先生だった人が教えてくれていて、操作方法はわかりましたが、これらの関数をどう生かしていくのかさっぱりわかりません。 「看護研究に使う」とほかの先生は言いますが、どう使うのでしょうか? どなたかご存知でしたら、実際の使い方を教えていただけませんか?

  • 統計学について

    統計学の無相関検定について 無相関検定について理解ができておらず、 どなたか教えてください。 理解できていない場所を理解したいので、 非常にまとまりがありませんが、箇条書きとしました。 番号ごとに箇条書きしたので、 番号に対応するように回答を頂けると幸いです。 よろしくお願いします。 (1)無相関検定により、帰無仮説が採択されると、相関係数の数値の大小に関係なく、一律で統計結果自体を無効にする。 (2)統計結果自体の無効とは、すなわち相関係数ゼロのことを指す。 (3)相関係数ゼロとは、すなわち無相関のことを指す。 (4)「相関の強さ」と「有意」は別個の考え方である。 (5)「相関が強いこと」=「相関係数が1または-1に近いこと」である。 (6)相関が強い場合でも、有意でない場合は、「統計自体が無効だった」ということになる。 言い換えれば、「統計結果は無相関だった」という解釈になるのだろうか? (7)相関が弱い場合で、かつ有意である場合は、「弱い相関があった」ということになる。 (8)「統計自体が無効だったこと」=無相関なのか? (9)「相関の強さが弱過ぎる」=無相関なのか? (10)相関があるという仮説の数は無限であり、相関が無いという仮説の数は1つである。 11.相関係数がゼロであることは、無相関検定をやること以外の方法では生じない。 つまり、変数が2つのとき「偏差積の平均÷標準偏差X÷標準偏差Y」の計算結果によって、相関係数がゼロという答えが出ることはない。(無相関検定をやる前から無相関であるという答えが導き出されることはない) 非常にまとまりが無くて申し訳ありませんが、よろしくお願いします!

  • 統計 基準値の標準偏差はなぜ1か

    統計の勉強をしていて、標準偏差とはデータの ばらつき具合、分散と書かれていました。 平均から比べてどのくらい差があるかという事は 理解しました。 しかし基準値を勉強していて、 本には基準値の平均は必ず0である。標準偏差は 必ず1であると書かれています。標準偏差は データのばらつき具合なのに、なぜ基準値の元では すべての標準偏差は1になるのでしょうか?

  • 標準偏差の評価において妥当なデータ数は幾つか?

     標準偏差や分散などのデータのばらつきを調べる場合、評価の対象にするデータ数が多い程、その母集団の性質に近くなります。しかし、評価するデータ数が2個では、それから標準偏差を求めても、それが母集団の性質を表す数値とは言い難いです。評価するデータ数が幾つ以上であれば、その標準偏差や分散が意味のある値となるのでしょうか?一般的に。

  • Excelの値取得関数について

    Excelで表を作成する際、コードから値を取得する方法について教えてください。 以下のようなことをやりたいです。 画像の場合、 1. 社員コードに"A001"を入力。 2. 各マスタの領域にある値を取得し、検索結果の各セルに値を表示。  ※B5,B6 の部分に値を取得する関数を設定したいです。 社員名は、C4のセルに記載したような、VLOOKUPで値を取得できました。 出身地と所属部署を取得する場合、 VLOOKUP に VLOOKUP を入れるような形で ないと取得できないのでしょうか。 ※出身地  社員コード"A001" をキーに社員マスタから出身地"T001"を取得し、地方マスタより、"青森県"を取得したいです。 ※所属部署   社員コード"A001" をキーに社員マスタから所属部署"S001"を取得し、部マスタより、"総務部"を取得したいです。 アドバイスをお願いします。

  • 統計に関する疑問

    統計検定の問題なのですが、(以下問題) あるアンケート調査で,いくつかの質問をした。問1は次の形式である。 あなたは「XXX」の意見に賛成ですか,それとも反対ですか?次の1から5のうち, あてはまるもの一つを選んでその数字を○で囲んでください。 1. 賛成  2.やや賛成  3.どちらでもない  4. やや反対  5. 反対 問2は「YYY」の意見についての同様な 5 肢選択の質問である。 回答について、○で囲まれた数字コードを数値として記録した。問1について集 計した結果は,平均が 2.6,標準偏差が 0.84,問2との相関係数は 0.46 であった。と ころが,問1の質問の趣旨を踏まえれば,選択肢の数字コードを逆向きにした方が よいのではとの意見が出されたので, 「賛成」を 5,「やや賛成」を 4,「どちらでもない」を 3,「やや反対」を 2,「反対」を 1 に振り直した。この数値コードを新コードと呼ぶ。新コードに基づいた平均,標準 偏差,相関係数がどうなるかについて,次の記述 I~III がある。 I. 平均は変らない。 II. 標準偏差は変らない。 III. 相関係数は変らない。 これらの記述の正誤の組合せとして,適切なものを次の 1 ~ 5 のうちから一つ 選べ。 答えは「II のみが正しい。」 になるのですが、なぜでしょう。 平均が変われば、各変数から平均を引いて、算出する分散の値も変われば、標準偏差も変わると思うのですが。統計を勉強し始めたばかりで、わからないことばかりです。 詳しく解説していただけるとありがたいです。 出典:統計検定2級 問題より http://www.toukei-kentei.jp/about/pastpaper/2012/grade2.pdf

  • 共分散と相関係数について

    ファイナンス(証券投資)の勉強をしているのですが、共分散と相関関数でどうしても理解できない部分があるので、こちらのカテゴリで質問させて頂きます。 1.具体例(前提) A証券とB証券のポートフォリオ効果を調べるために、両者の相関性を計算します。 A証券の環境変化(期待収益率=平均収益率:20%*0.4+10%*0.4+5%×0.2=13%) 為替相場:円高→確率:0.4→収益率:20%→偏差:7% 為替相場:不変→確率:0.4→収益率:10%→偏差:-3% 為替相場:円安→確率:0.2→収益率:5%→偏差:-8% A証券の標準偏差:7*7*0.4+(-3)*(-3)*0.4+(-8)*(-8)*0.2の平方根=6% B証券の環境変化(期待収益率=6%) 為替相場:円高→確率:0.4→収益率:3%→偏差:-3% 為替相場:不変→確率:0.4→収益率:7%→偏差:1% 為替相場:円安→確率:0.2→収益率:10%→偏差:4% B証券の標準偏差:≒2.68% 2.質問 (1)共分散について この場合に、共分散は、Σ(A証券の偏差×B証券の偏差×確率)で求められると記述があります。 A証券の偏差×B証券の偏差の平均をとったものだと思います。 上述の例では、共分散は、結果的に-16になります。 この際、共分散の数値が正(+)である場合は、同方向、負(-)である場合は、逆方向の相関性があるというのは、掛け算の性質から理解できます。 その上で、共分散の絶対値は、2つの証券の相関性の程度であって、絶対的が大きい程、相関性は高いと記述がありまして、ここで理解できずにいます。 なぜ、両者の偏差を掛け合わせることで、両者の相関性の程度が計算できるのでしょうか? 例えば、一定条件のA証券の偏差が1%、B証券の偏差が2%の場合は、1*2=2と計算されますが、仮にA証券の偏差が19%、B証券の偏差が20%の場合は、19*20=380になります。 相関性というならば、両者は同方向に1%しか差がないにもかかわらず、相関性として計算される数値は雲泥の差です。 この点についてご教示頂ければと思います。 (2)相関係数について 相関係数は、共分散/(A証券の標準偏差×B証券の標準偏差)で求められると記述されています。 上記の例の場合は、-16/6%*2.68=-0.995と非常に高い負の相関性があります。 そしてこの式は、共分散(A証券の偏差×B証券の偏差の平均)を両証券の標準偏差(偏差の正数値の平均)で割ったもので、これが-1~1の間で推移することは理解できます。 ただ、上記の共分散と同様に、両者の偏差(及び標準偏差)を掛け合わせることで、両者の相関性の程度が計算できる理屈がわかりません。 この点についてご教示頂けないでしょうか? ご回答よろしくお願い致します。

  • 統計学 分散について

    今ネットのHPでハンバーガー統計学とういところで統計学を覚えようとしています。 このHPで、 データのばらつきを数値で表す という、項目があります。  ここでは、分散の式を分かりやすく説明しているのですが、 HPの説明では・・・ 平均値からのずれ(つまり個々のデータと平均値との差)を足せば、ばらつきの数値になるのではないかと考えます。つまり、 ばらつき案1=(データ-平均値)の総和 ということです。しかし、これですと、データが小さいときに(データ-平均値)はマイナスになるので、総和を求めてもゼロになってしまいます。そこで、2乗することでマイナスをプラスにします。次の案はこうなります。 ばらつき案2=((データ-平均値)の2乗)の総和 しかし、まだ問題があります。この式ですと、データの個数が大きくなるにつれてばらつきが大きくなってしまいます。個数の大小にかかわらず、ばらつきを求めたいのです。そこで、総和をデータの個数で割ることにします。式は、 ばらつき案3=((データ-平均値)の2乗)の総和÷個数 これで良さそうです。この「ばらつき3」のことを「分散」と呼びます。もう一度式を書いておきましょう。 分散=((データ-平均値)の2乗)の総和÷個数 分散は、データが平均値を中心にして、どのくらいばらついているのかを示した数値です。 と、あります。  分散は平均からのずれを出すのであれば、 分散=((データ-平均値)の2乗)の平方根の総和÷個数 が正しいような気がします。 例えば平均から+5cmの2乗は25なのに、 +0.3cmの場合2乗は0.09になってしまい、 大きくぶれたものはより大きく、 小さくぶれたものはより小さくなってしまいます。 ばらつき案1で データから平均値を引いた答えに+と-があり、 総和を求めると、この+と-のブレがお互いに干渉しあって 数値を0に近くする為、 一度2乗して+と-を無くしたのに、 何故その後、そのままなのかよく分かりません。  2乗して+と-を外したなら、次に平方根を出し数値を実態に近い値にすればいいのにと思ってしまいます。  言ってる事がいまいち伝わらないかと思いますが・・・  どなたか解説お願いします。  分散とはそういう計算式なんだ!と、 言ってしまえばそれまでですが、 どうしても納得がいきません・・・

専門家に質問してみよう