• 締切済み

個数の違うデータの平均

各個体につき、他者との間で「あるイベント」が生じた際に「特定の行動」が見られるか、ということを記録したデータです。 当事者個体から見た他者は、A群・B群といった異なる2群があります。 データセットはこのようになっています。 個体  特定の行動頻度  総イベント数      (A群)  (B群)  (A群)(B群) X     15     16    31   25   Y      0      5     0    8 Z      5      17    17   40 …etc. 現段階ではまだ本格的な統計処理はせず、 グラフという形で行動の発現率(行動頻度/合計イベント数)をA・B群間で比較したいのですが、 先輩が教えてくれた方法は A群における個体Xの行動頻度/A群におけるXの総イベント数=Xの行動発現率A (15/31=0.48) A群における個体Yの~以下略 (0/0=0.00) A群における個体Zの~以下略 (5/17=0.29) … 全個体の、A群における「行動発現率の平均」((.48+0+.29)/3=0.25) VS B群以下略 という計算でしたが、「発現率」そのものを比較してしまうと、たとえば個体YのようにA群のそもそものイベント数が0であるために発現率0%となっているものまで数えられてしまって、違和感を覚えます。 自分は A群における合計行動頻度(15+0+5)/A群の総イベント(31+0+17)=0.41 VS B群以下略 のほうが正確だと思えるのですが、昔から数字が苦手だったため自信がありません。 見たい情報を得るためにはどのような手法を用いればいいか、ご助言頂ければ幸いです。グラフで感じがつかめたら、t検定やGLMMなどを行う予定です。

みんなの回答

noname#227064
noname#227064
回答No.2

> 現段階ではまだ本格的な統計処理はせず、 > グラフという形で行動の発現率(行動頻度/合計イベント数)をA・B群間で比較したい とのことで、さらにどの値でもって比較するかも決まっていないのであれば、情報をできるだけ削らずにグラフ化することをお勧めします。 比率だけでグラフ化すると、総イベント数等の情報がなくなりますし、#1さんも指摘したように比率にできないものもあるので、例えば、横軸を総イベント数、縦軸を行動頻度とし、個体と群によりマーカーの形や色を変えてグラフ化してみてはどうでしょうか。 これ以外にもいろいろと方法は考えられるでしょうから、いろいろと試してみて、その中で最もA群とB群の違いがでて、かつ説明の付けやすい(モデル化しやすい)ものを選べば良いかと思います。

  • alice_44
  • ベストアンサー率44% (2109/4759)
回答No.1

0/0 は、0%じゃなく、比率未定義です。 被験者YのA群イベントが、そもそも 観測されていないのであれば、それに対する 反応について、何も言えないのは 当然ではないですか?

関連するQ&A