• ベストアンサー

Fold Changeで表すグラフにする際のエラーバーの付け方(統計学)

統計学初心者です. 実験データをFold Changeで表すグラフにする際の,エラーバーの付け方がわかりません. 具体的には,たとえば, 非刺激群Aの平均値が100,標準誤差1.5 刺激群Bの平均値が200,標準誤差2.0 治療群Cの平均値が140,標準誤差1.2 というデータがあり, Aが1に対してBが2,Cが1.4というグラフを作りたいのですが,その誤差(すみません,統計的に,正しくは何と言うのかわかりません)をエラーバーで示さなくてはなりません. どのような計算が必要なのでしょうか? 追; グラフをローデータで表せない理由は,A,B,Cの実験が,実際には別々の実験で行われているため(実際はABCだけでなくもっとたくさんのサンプルを持っています),各々の実験のcontrolに対してのFold Changeをとらなくてはいけないからです.質問を簡便にするため,上記のような例・値とさせていただきました. よろしくお願いいたします.

質問者が選んだベストアンサー

  • ベストアンサー
  • widowers
  • ベストアンサー率100% (1/1)
回答No.2

一般に統計変数の関数の誤差は、統計変数の共分散関係を伝播させることで求めることができます。ただし、統計変数の誤差が標準分布(ガウス分布)であったとしても一般には関数値は標準分布にはなりませんので、あくまで目安です。 今、関数をf(x、y)とし、x、yを統計変数としてその誤差共分散行列を、 (σ(x)^2,<σ(x)σ(y)> | <σ(x)σ(y)> ,σ(y)^2) (|の左は一行目、右は2行目) とします。σ(x)^2、σ(y)^2はそれぞれx、yの分散で、<σ(x)σ(y)>は共分散です。 誤差の伝播は次のようになります。 σ(f)^2 = (∂f/∂x,∂f/∂y)(σ(x)^2,<σ(x)σ(y)> | <σ(x)σ(y)> ,σ(y)^2)(∂f/∂x | ∂f/∂y) さて、ご質問のデータの場合は各標本群の平均値が統計変数であり、それらの比が関数値です。 群A : x1=100, σ(x1)=1.5 群B : x2=200, σ(x2)=2.0 群C : x3=140, σ(x3)=1.2 比AB : r1=x2/x1=2 比AC : r2=x3/x1=1.4 また、各群は独立なので相関は無いものとし、x1,2,3の共分散はゼロに取ります(誤差は測定誤差のみによるものとする仮定)。 ∂r1/∂x1=-x2/x1^2, ∂r1/∂x2=1/x1 ですから、 σ(r1)^2 = (∂r1/∂x1,∂r1/∂x2)(σ(x1)^2, 0 | 0 ,σ(x2)^2)(∂r1/∂x1 | ∂r1/∂x2) = (∂r1/∂x1)^2σ(x1)^2 + (∂r1/∂x2)^2σ(x2)^2 = r1^2 ( (σ(x1)/x1)^2 + (σ(x2)/x2)^2 ) ゆえに σ(r1) = r1 root( (σ(x1)/x1)^2 + (σ(x2)/x2)^2 ) = 2 root( (1.5/100)^2 + (2/200)^2 ) = 0.036 r2についても同様に、 σ(r2) = 1.4 root( (1.5/100)^2 + (1.2/140)^2 ) = 0.024

cullin
質問者

補足

ありがとうございます. 統計は全くの初心者で,正直馴染みのない言葉ばかりではありますが,丁寧に説明していただき,計算方法はよくわかりました. ,,と同時に,やはりきちんと統計を勉強しなくては..と認識を新たにいたしました. ただ,現在急ぎのため,よろしければ追加で教えてください. σ(r1) = 2 root( (1.5/100)^2 + (2/200)^2 ) = 0.036;Bのエラーバー σ(r2) = 1.4 root( (1.5/100)^2 + (1.2/140)^2 ) = 0.024;Cのエラーバー ということになると思うのですが, 比の元(分母)となったAのグラフには,エラーは添付する必要は無いのでしょうか?

すると、全ての回答が全文表示されます。

その他の回答 (3)

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.4

 単に、エクセルなどの図で、どう示すのか、というご質問と勘違いして、失礼しました。というのも、私は分らず、学生に聞きましたので。  指導者を差しおいての回答は、科学者としてのマナー違反。もちろん、する方も。ただ、これまでの経験では「一人で・・・」のような返答が多いので、とりあえず独り言を。  まず、誤差について。標準偏差、不偏標準偏差、標準誤差の区別がついていますか。というのも、日本人は、標準誤差で誤差を表示する人は少数派なので。もっとも、これは、どうでもよいことかも。  次に、誤差を図表に示すのは、細胞を含め生物を用いた時、その個体差が必ずでるからです。大気中の二酸化炭素濃度を3回測れば誤差はでますが、これは、単にその人の腕の悪さを示しているに過ぎず、露悪趣味です。もっとも、最近は簡単に計算できるので、そんな論文が増えていますが。  生物の誤差には、生物の個体差とその人の技術が内在しています。それで、誤差をしめすのが慣習です。まあ、『私の腕ではなく、生物の個体差』と主張したいようなものです。  さて、A、B、C群は、それぞれ相互に関係していないようなので、A群の表現を片付ければ、あとは同様にできるという印象をうけています。違っていたら、その旨書き込んで下さい。  A群のデータ、これは生データでも、比をとっているのでも同じことですが、それを新たなデータと考え、そのまま標準誤差などを公式に入れて、計算します。  その比が、1、1.5、2.0なら、不偏標準偏差は、0.5とかなり大きくなりますが、最大と最小を削ってなどの改竄は言語道断。0.5が大き過ぎるのなら、標準誤差で表せば、当然小さくなり、腕が良いように見せかけることが可能です(私は、標準誤差で示している論文を見ると、『こいつは腕が悪いので、ちいさいように見せかけている』と感じますが)。  データが、3、50、1000なんぞなら、誤差が大きくなるのは、どうしようもありません。誤差が大き過ぎることが問題なら、データ数を増やせば、標準誤差なら簡単に小さくできます。  ただ、比を取ることに意味があるのか、とり方に問題は無いのか、は判断できません。  さらに、標準誤差においても、元のデータが正規分布をしていないのであれば、その表示はほとんど意義がありません。一般に平均±不偏標準偏差で表現しますが、正規分布している場合にのみ、このは範囲に68.5%のデータが入ることを示せるからです。比がデータの場合、論文審査などなら、それが正規分布をしていることを求められると想います。

cullin
質問者

お礼

お礼が遅くなり申し訳ありません. お返事,そしてご指摘,どうもありがとうございました. このデータは細胞を用いて行った実験で,6回の独立した実験を繰り返しており,正規分布は確認済みです. 標準偏差or誤差については,このデータについては,誤差で表示するように指導者から言われていました.(すみません,ここでは詳細までは説明できないのですが...) 今はまだまだ一つ一つのデータを処理するのにやっとのような段階ですが,勉強を重ねていこうと思います. ありがとうございました.

すると、全ての回答が全文表示されます。
  • widowers
  • ベストアンサー率100% (1/1)
回答No.3

>比の元(分母)となったAのグラフには,エラーは添付する必要は無いのでしょうか? とのことですが、比B/A、C/Aを同じグラフに示し、それぞれの誤差をA、B,C全て考慮して(前回のように伝播させて)示したならば、A/A=1に対してその誤差を示す必要はありません。グラフ上にその旨を示せばよいでしょう。 他の方法としては、単純にA/A、B/A、C/Aを、A=1に規格化したグラフとして示すことも出来ます。その場合は各点は上と全く同じプロットになりますが、誤差もA=1に規格化(A,B,C各誤差を単にAで割る)してグラフ上に書くことになります。これはようするに縦軸のスケールを変換しただけのつまらないグラフです。一方比を求めてその誤差を示すのは比そのものに意味のあるグラフになります。

cullin
質問者

お礼

先ほどまで言葉の意味が今ひとつわかっていなかったようですみません. 「誤差を伝播させた」ということは,つまりAの誤差も先の数式中に乗せることにより含めて考慮した,ということになるのですよね. よくわかりました. 大変丁寧に教えていただき,感謝しております.ありがとうございました.

すると、全ての回答が全文表示されます。
  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.1

 ご質問は、論文でよく見るように、棒グラフに標準誤差をつけて表現したい、ということなら、エクセルで簡単にできるようです。4年生がやっていました。  Fold Changeが何なのか、不明。

cullin
質問者

補足

ありがとうございます.質問がわかりにくかったようですみません. 「Fold Change」と呼んだのは,つまり,この例の場合,Y軸の値を100,200,140というローデータではなくAからの変化率で表現するということです(A=100/100=1. B=200/100=2. C=140/100=1.4). 100,200,140をY値にとるのであれば,SEをエラーとして,そのままerror barをA1.5,B2.0,C1.2としてつけて表現できるのはわかります. でも,変化率で表す時は,例えばAの「1」という値に,標準誤差「1.5」をエラー値としては,なんだかおかしいですよね? 感覚的には1.5も元の値の100で割ればいいのか(%標準誤差,,という言葉があるかわかりませんが),かつ,B,Cについては,同様に%標準誤差をもとめて,Aの%標準誤差と足す,などかなあ,と思うのですが。。。 説明が下手ですみません. 引き続き,よろしくお願いいたします.

すると、全ての回答が全文表示されます。