• 締切済み

統計に関する質問です。

ある評価を2つのグループにしてもらいました。 そのグループの評価の一致度を調べたいと思っていますがどうしたら良いでしょうか?(たぶんカッパ係数を出すべきと思っているのですが。) ある2つのグループに各15人ずつ評価者がいます。 評価の項目は10項目あって、それぞれの評価の平均からグループ評価としての平均値を出しました。 その2つの評価の平均値を比べて一致度を出したいのですが、どうしたら良いのかわかりません。 検索してすぐに見つけられたhttp://www.mizumot.com/stats/kappa.htmを参考にしてやってみましたが、ここでの評価はABCで、ABCの各個数で一致度を見ていると思います。 私の評価の値は2.6だの3.7だの、5段階評価で行ったものの平均なので小数点があり、何評価が何個という数え方はできません。この場合カッパ係数を出すことは不可能でしょうか? ここのデータの一致度を見るのではなく、平均の値の比較をして一致度を測るにはどうしたら良いでしょうか? ちなみにデータは。。。 評価グループ1の平均が 3.6 4.4 2 4.3 4.3 3.1 4.4 4 3.1 3.4 評価グループ2の平均が 2.8 2.9 2.4 3.1 2.9 3.5 3.4 3.4 3.8 3.4 です。どうしたらいいのでしょうか?ものすごく困っています。 一致率が出たあとのデータの読み方も含め、どなたかご存知の方、至急お教え願います。 よろしくお願い致します。

みんなの回答

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.3

一致度の前に、各項目が何か分かりませんが、「項目毎に有意差は無いのか」と突っ込みたくなります。もちろん、有意差の検定が意味があるのかどうかは、分りませんが。  また、10項目で一致する、というのも、私には理解できません。「10項目全体でなく、どの項目が一致するの」と突っ込みたくなります。項目ごとに有意差検定ができそうな雰囲気があります。  統計学的方法では、10項目全般について多重比較をやり「有意差があった」という結論を求めるのが普通です。というわけで、なにかしら違和感を捨てきれません。  統計の専門家などにご相談された方が良いと想います。

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.2

>どちらも3.4なのだから評価は一致していると言うことになりますよね? A社とB社の時計を10個ずつ、時計の時刻を調べた。10日後の時刻は、平均すると同時刻だった。「両社の時計は、どちらも同様に正確」ということにはなりません。B社は、10分進んでいるものと10分遅れているものが5個ずつだったら、・・・。  これは、データをどのようにして得たのか、特に平均することに意味がある場合(=代表値として扱える)に限ります。時計の場合は、分散も考慮する必要があります。 >Aグループの評価が4.4 少数点があるので、大丈夫だとは思うのですが、順序尺度は平均するのは誤りでしょう。4.4と書かれているので、比例尺度でしょうから、平均はできます。でも、平均した値が、その集団の代表値になりうるのか、については再検討して下さい。現実には、中央値の方が適する場合も少なくありません。    一致度については、統計学では「有意差」という単語のように、差があることを一般的に追求します。ただ、相関分析は、一致度として応用しています。実際に、「改良した新しい方法で測定した値は、従来の方法と変わらない」などの証明として、論文でも一般的に見ます。  平均値について、相関分析をするために散布図を描いてみましたが、一致しているようには見えませんでした。カッパ係数というのを知りませんが、相関分析なら、比例尺度をそのまま利用できます。  ただ、統計学は、その性質上、データ数さえ増やせば、有意差がある、とか、一致する、とかはしやすくなります。

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.1

データの読み方が分からないのですが、 1)3.6とか2.8とかは,平均なのですか。そうなら、平均前のデータは利用できるのですか。 2)3.6は、グループ2の2.8に一致させようとしているのですか。  統計学では、「有意差」という単語が頻繁にでてくるように、本来的には差があることを示そうとする手法・目的なので、一致度というのは難しいかも。  不勉強でカッパ係数というのは知りません。A、B、Cだと利用できるのなら、変換という手法はありますが、書きこまれた数字がどのようにして得たものか不明なので何とも。

jk_snd
質問者

補足

お返事ありがとうございました。 1)kgu-2さんのおっしゃる通りです。項目に対してAグループの評価の平均が3.6で、Bグループの平均が2.8です。他の項目も比較しながらその一致度を見たいのです。 表にあるように項目10の評価の平均がAのグループもBのグループは3.4です。どちらも3.4なのだから評価は一致していると言うことになりますよね?それに対して項目2は、Aグループの評価が4.4でBグループの評価が2.9です。こうなると一致してる評価とは言い難いような気がするのです。こういうものを比較して一致度を測る手法があるのかと思っています。いかがでしょうか?教えて頂ければとても助かります。よろしくお願い致します。

関連するQ&A

  • 統計学の問題について

    テストで実際に書いた答案なのですが、非常に低い評価が付けられていて 大変困惑しています。学部生の入門科目です。 問題1データの中心の尺度の概要を書け 回答 標本の性質を代表する数値的尺度を統計量という。 中心の尺度には平均、メジアン、モードがある。 平均はデータの値の合計をデータの数で割ったものであり、 メジアンとはデータを大きさ順に並べたとき、真ん中に来る値のことである。 データの数が偶数のときは、真ん中に2つあるので、真ん中2つの 算術平均をとってそれが中央値になる。 まだ、モードは標本のなかでもっともたくさん登場する数値である。 <ここは完全に間違えました> 図に表した時に右の裾が長い場合は 平均<メジアン<モードの大小関係になり 左の裾が長い場合は モード<メジアン<平均という関係になる。 問2 ローレンツ曲線とジニ係数の概要を書け ローレンツ曲線とは所得・人口・販売高などの 一定グループへの集中度合いを観察できる曲線のことである。 ローレンツ曲線は45度線に近いほど所得分配は平等であり、逆に45度線から 離れるほど所得分配は不平等である。 また、ローレンツ曲線は不平等度や集中の度合いを捉えるのに有用な手段であるが、 それを実用化した指標がジニ係数である。ジニ係数の定義は ジニ係数=2×(完全平等線とローレンツ曲線に囲まれた面積)である。 ローレンツ曲線が完全平等線に近いほどジニ係数は0に近くなり 逆に完全平等線から離れるほど1に近くなる。 よってジニ係数は0に近いほど平等で、1に近いほど不平等である。 このレベルで100点中何点ぐらいものになるのでしょうか? 問はそのままで制約(数式を書けとかグラフを入れろ等)はありません。 学部の入門科目です。

  • 統計学 分散について

    今ネットのHPでハンバーガー統計学とういところで統計学を覚えようとしています。 このHPで、 データのばらつきを数値で表す という、項目があります。  ここでは、分散の式を分かりやすく説明しているのですが、 HPの説明では・・・ 平均値からのずれ(つまり個々のデータと平均値との差)を足せば、ばらつきの数値になるのではないかと考えます。つまり、 ばらつき案1=(データ-平均値)の総和 ということです。しかし、これですと、データが小さいときに(データ-平均値)はマイナスになるので、総和を求めてもゼロになってしまいます。そこで、2乗することでマイナスをプラスにします。次の案はこうなります。 ばらつき案2=((データ-平均値)の2乗)の総和 しかし、まだ問題があります。この式ですと、データの個数が大きくなるにつれてばらつきが大きくなってしまいます。個数の大小にかかわらず、ばらつきを求めたいのです。そこで、総和をデータの個数で割ることにします。式は、 ばらつき案3=((データ-平均値)の2乗)の総和÷個数 これで良さそうです。この「ばらつき3」のことを「分散」と呼びます。もう一度式を書いておきましょう。 分散=((データ-平均値)の2乗)の総和÷個数 分散は、データが平均値を中心にして、どのくらいばらついているのかを示した数値です。 と、あります。  分散は平均からのずれを出すのであれば、 分散=((データ-平均値)の2乗)の平方根の総和÷個数 が正しいような気がします。 例えば平均から+5cmの2乗は25なのに、 +0.3cmの場合2乗は0.09になってしまい、 大きくぶれたものはより大きく、 小さくぶれたものはより小さくなってしまいます。 ばらつき案1で データから平均値を引いた答えに+と-があり、 総和を求めると、この+と-のブレがお互いに干渉しあって 数値を0に近くする為、 一度2乗して+と-を無くしたのに、 何故その後、そのままなのかよく分かりません。  2乗して+と-を外したなら、次に平方根を出し数値を実態に近い値にすればいいのにと思ってしまいます。  言ってる事がいまいち伝わらないかと思いますが・・・  どなたか解説お願いします。  分散とはそういう計算式なんだ!と、 言ってしまえばそれまでですが、 どうしても納得がいきません・・・

  • 統計 仮説の立て方

    統計学のカテゴリがないようなのでこちらで質問させていただきます。 「二つのグループがあり、一つ目は10人の非喫煙者、二つ目は10人のヘビースモーカーである。二つのグループは、ベースラインとしてBMIの値を調べ、六年後にもう一度BMIの値を調べている」 「データは一年目のそれぞれのグループのBMIの値、六年目のそれぞれのグループのBMIの値、それぞれのグループ内でのBMIの値の変化した値がある」 上記の条件下で喫煙がBMIに関係しているかどうかの仮説を立てたいのですが、どうやって仮説を立てて良いのか迷っています。 私が考えているのは、帰無仮説(喫煙はBMIの変化に関係ない)、対立仮説(喫煙はBMIの変化に関係する)なのですが、それぞれ 帰無仮説=一つ目のグループのBMIの変化した値の平均 = 二つ目のグループのBMIの変化した値の平均、 対立仮説=一つ目のグループのBMIの変化した値の平均 < 二つ目のグループのBMIの変化した値の平均 で仮説を立てて良いのでしょうか?

  • 統計学の初歩的な質問です

    統計学の初歩的な問題に関する質問です。 とあるデータ系列があり、その平均値を出すと割り切れないので小数点第三位を四捨五入します。 そこで偏差を求めるとその総和が0になりませんが、このまま変動の値を求めてもいいのでしょうか? 使っているテキストには「偏差の総和は常に0である」と書いてありますが、四捨五入すればどうしても0にはならないと思うのですが…。 どなたか教えて下さると助かります;;

  • 統計学、自由度の意味がよくわかりません。

    「質問」 自由度の意味がわかりません 「質問の経緯」 統計学の学習をしています。自由度という言葉の意味がよく分からず困っています。 下記はあるウェブサイトからの自由度の説明の引用です "例えば、サンプルサイズが3のデータから算出された標本平均が5であるとき、1つ目の値と2つ目の値は自由に取ることができます。例えば、4と6とします。すると、3つ目の値は標本平均が5となるようにしなくてはならないので、「5」しか取ることはできません。つまり、自由に値を取れるデータの個数が1つ分減ってしまった(1つ分の情報量を失った)ことになります。したがって、自由度は「3-1=2」となります。" 全体的によくわからないのですが、上記の文章における >>1つ目の値と2つ目の値は自由に取ることができます が特に分かりません。例えば日本人の平均身長を標本から統計的推測をしたいとします。 この時、無作為に選んだ人間の身長の平均が標本平均となるはずです。 標本の中の一つ一つのデータについて、この人は平均身長は168で、とかこのひとは170でとか 値をつけることはないはずです。しかし上記の引用した文章においては まるで標本の中のデータの値を自分で勝手に決めているように思えます。 「質問まとめ」 自由度という言葉の意味がよく分かりません。 特に"1つ目の値と2つ目の値は自由に取ることができます" という、値を自由に取ることが出来る、という言葉が分かりません。 理解の手助けとなるようなアドバイスなどがあれば教えてほしいです。

  • 5段階評価の方法についての質問です。

    5段階評価の方法についての質問です。 評価項目が10項目あります。 各項目毎に、5段階評価をしていくと、10項目合計の平均は、小数点第1位までで計算すると、 1.0~5.0になります。 最終的に、1~5の整数で評価をしないといけない場合、どこからどこまてが、1~5になるという、 ルールや考え方があるのでしょうか? 例えば、1.0~1.4は1、1.5~2.4は2とか。

  • [統計] こんな検定をして意味がありますか?

    2グループあります。 各グループにはいくつかのサンプルがあって、 各サンプルにたいしてある試験を行い、 得られたデータを最小二乗近似したときの傾きの値(A)をサンプルごとに得ました。 このAの平均値がグループ間で異なるかどうかを検定したいのですが、 通常のt検定や分散分析で解析しても大丈夫でしょうか?

  • 統計学の質問です.アドバイスもらえないでしょうか?

    統計学の質問です.アドバイスもらえないでしょうか? 統計学の質問です.気象予測の研究において気温,気圧,日射量,風向,風速,雲量,相対湿度の7項目のうち一つを目的変 数として他の複数の説明変数に対して重回帰分析(各項目1時間ごとのデータ)を行った.気温を目的変数としたとき,気圧が最 も影響度が高かく,日射量は低かったが,普通に考えても日射量がもっと影響を与えるはずだと考える.確かに日射量は日が沈 んでから値は0で,昼間に急に値が上がるのでそのままだと相関関係はとらない.しかし,関係性があるのは確かなので日射量の 値を変換して相関関係をとりたいのですが,どうしたらよいでしょうか?累加日射量の二十四時間移動平均を使っている過去の 論文の例もあるのですが,よく分かりません.なにかアドバイスいただけるでしょうか?

  • 経済統計についての質問です。

    家計の消費支出(全体)の金額をX、省支出のうちの各項目(食料、被服および履物等)の支出金額をYとします。Y=aX+bを仮定して、総務省統計局の「家計調査」カラもとめたX,Yのデータに、最小二乗法を用いてこの式を当てはめて、a、bに値を求める事ができます。ここで、aは限界消費性向、bは切片とよばれます。この時、 (1)弾性値=X/Y・dY/dXの値が、1よりも小さい支出項目を必需的費目、1よりも大きい支出項目を選択的費目とする財の分類 (2)切片bについて、b>0である支出項目を必需的費目、b<0である支出項目を選択的費目とする財の分類 が一致する事を説明したいのですが、どうしたらいいでしょうか。

  • データのばらつきを評価する方法についての質問です.

    データのばらつきを評価する方法についての質問です. ばらつきを数値で表すために,分散という値が用いられます.そのためにまず,各データの平均値からのずれの総和を求めます.この時,(データ-平均値)の総和だとゼロになってしまいます.データが平均値よりも小さいと,(データ-平均値)がマイナスになるからです.そこで,(データ-平均値)を2乗することにより,マイナスをプラスに変える,といつも説明されています. ここからが質問です.(データ-平均値)がマイナスになったとき,それをプラスに変えるためならば,2乗しなくても絶対値をとれば良いのではないでしょうか?その後,(データ-平均値)の総和を計算すれば,2乗の総和を求めるより計算が容易ですし,単位も各データの単位と一致します.けれでも,そういう方法が用いられない理由は何なのでしょうか? よろしくお願い致します.