• ベストアンサー

統計R:個体差を考慮した生存分析

stomachmanの回答

  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.5

 ANo.4のコメントについて。ご参考までにヒントを。  N個の個体から成る集団Sの各個体xについて、まずA地点からB地点にいく時間を測定し、次に同じ試行をもう一度行って、1回目に比べて2回目の方が成績が良かったかどうかを調べる、という実験を考えます。  2回目には成績が上がった、と言いたいのならまずは H(1/2):「集団Sのどの個体にとっても、1回目の試行と2回目の試行とは同等である。だから、成績のばらつきは偶然だけに依る」 というようなことを帰無仮説とすれば良さそうですが、これを検定しようとすると「成績のばらつき」を定量的に予測できないんで困りますよね。何がまずいんでしょうか。  実験についてもう一度考えてみますと、「ある個体xについて、タスク達成に掛かる時間がどれだけ短縮したか」という数値は、タスクの性質におおいに依存しているんじゃないでしょうか。タスクを達成する上で重要なのが、環境に怯えないことなのか、速く走ることなのか、複雑な分岐を迷わず選択することなのか、見えない場所にあるものの匂いを嗅ぎ取ることなのか、…それはタスクによるでしょう。つまり、単一のタスクだけを使った実験では、この数値にさしたる意味はないんです。(定量的に「時間がどれだけ短縮したか」ということをキチンと考察するためには、多様なタスク同士を比較し、タスクにどんな要因が含まれているかを探る実験が必要でしょう。)  また、仮に、ある1個体cについては1回目が100秒で2回目が10秒、他の10個体はどれも1回目が10秒で2回目が11秒だったとしたら、「平均時間を見れば、成績が上がったと言える」という結論で良いでしょうか?そりゃやっぱり無理ですよね。  では「成績が上がった」という結論はどのように裏付けられるのか。それは専ら「大抵の個体において、1回目より2回目の方が速かった」という定性的な情報に依ってでしょう。  という訳で、時間の数値のことは忘れて「1回目より2回目の方が速かったかどうか」だけに着目しましょう。すなわち、帰無仮説を精密化して、 H(1/2):「集団Sのどの個体についても、1回目の試行より2回目の試行の方が成績が良くなることも、逆になることも、同等の確率で生じる」 ということを考える。  個体xのk回目の試行の成績v(k,x)は、A地点からB地点に速く到達できるほど高得点であるとし、また、所定の時間内にB地点に到達できなかった場合は最低点であるように定義してあるものとします。すると帰無仮説H(1/2)から 「集団Sのどの個体xについても、命題   X(1/2): P(v(1,x) < v(2,x)) = P(v(2,x) < v(1,x)) = 1/2 が成立つ」という<確率的な予言>が帰結できるので、   L = {x | x∈S ∧ v(1,x) < v(2,x)} とすると、z=|L| (集合Lの要素数)は2項分布   B(z,N,1/2)= (NCz)((1/2)^N) (0≦z≦N) に従うことになる。もし、データが(適当な有意水準において)これを棄却するのであれば、H(1/2)の否定が結論できます。 (実際にはv(1,x)=v(2,x)=最低点という個体も生じるでしょうから、その扱いも考慮しておかねばなりません(でも、データを捨てちゃ駄目です)。ですが、ここでは話を簡単にするために、v(1,x)≠v(2,x)だとしています。)  この帰無仮説をもう少し一般化して H*(p) : 「集団Sのどの個体についても、1回目の試行に比べて2回目の試行の成績が上がる確率はp以下である」 とするとどうでしょうか。  もちろん、個体xごとに、1回目の試行に比べて2回目の試行の成績が上がる確率p(x)が異なるかもしれません。でも、H*(p)を満たす「最良」の場合を考えることができます。すなわち、どの個体についてもp(x)が仮説が許す最大値pであったとする。その場合でもz=|L|は2項分布   B(z,N,p)= (NCz)(p^z)((1-p)^(N-z)) (0≦z≦N) に従うのだから、もしこの分布から予測される頻度に比べて有意に大きい頻度(たとえば有意水準1%)で「1回目の試行に比べて2回目の試行の成績が上がった」個体が生じたのなら、この帰無仮説は棄却できて、「有意水準1%以下」でH*(p)の否定が結論できることになります。(ここで「有意水準1%以下」というのは、H*(p)が1%の有意水準でギリギリ棄却できたとしても、それは、H*(p)を満たす「最良」の場合を棄却したのですから、最良でない場合についてはもっと低い有意水準で棄却できていることになるからです。)H*(p)の否定は「集団S中に、1回目の試行に比べて2回目の試行の成績が上がる確率がp以上である個体がいる」ということであり、結論としてはちょっとパンチ不足です。もっと旨い帰無仮説を工夫できないでしょうかね。

関連するQ&A

  • 擬似反復と反復について

    ある個体から複数のデータを取る「擬似反復」と、一つの個体から一つのデータを取る「反復」の一般化線形モデルにおける扱いの違いがよくわかりません。 なぜ擬似反復の場合は個体差をモデルに組み込むのに対し、反復の場合は個体差をモデルに組み込まない(組み込めない)のでしょうか。 「反復の場合はひとつの個体からひとつのデータしか取っていないため、個体差を考慮できない」というような記述も見ましたが、これの意味もよくわかりません。 よろしくお願いいたします。

  • リングレーザージャイロスコープ

    リングレーザージャイロスコープ の到達地点に時計を置けば右回りと左回りの到達時間に差がでるのでは?

  • 超音波風向風速計

    超音波風向風速計について勉強しています。 風速測定の原理としては、超音波がA地点からB地点と、B地点からA地点までの両方の到達時間を 測定し、時間差を求めるといったものです。 この方法で風速0.1m/sの精度を出すには、時間差の分解能が約0.08[μsec]以下でなければいけません。自分としてはかなり小さな時間差だと感じています。 この時間差を正確に測定できる方法はありますでしょうか。

  • 個体差??

    N504isかSO504isか・・・・・・? なんて、まだ発売もされていないのにお聞きするのは不毛かもしれませんが、N504isかSO504isか迷っています。 以前はN502iを利用していて、すごく使いやすく、 「今度もNかな?」と思っていたのですが、機種変更するとき、Nがなかったこともあって、 現在はso211iを利用しています。 PoBoxがものすごーーーーーく使いやすく、今では「今度の機種はso? なんて思いはじめています。」(苦笑)  しかし、気になるのは電波状況です。 以前Nを利用していたときに比べて、音質が悪い気がするのです。 一般電話→携帯はいいのですが、携帯同士だと、ときどき なにしゃべっているのか聞き取れないときがあります。 以前Nを使用していたときは、このようなことはありませんでした。 また、Nの時は、車に乗っているような「高速移動中」もメールは 確実に入っていたのですが、SOに変えてからは、移動中はおろか、 普通のときで、電波3本立っているときでも入らないことがあります。  お聞きしたいことは、 これはメーカーによる個体差なのか否か、ということです。 メーカーによる個体差ではなくて、ただ単に、ユーザーの増加とかの関係で メールが届きにくくなったり、音質が悪くなったりしただけなのか・・・・? 正直な気持ち、次もsoにしたいのですが、そういった「メーカーでの個体差」が「あきらかに」あるのなら、少し考えたいなぁ・・・と 思って質問しました。 どうぞよろしくお願いいたします。 「SO(あるいはN)は壊れやすい」などのそれぞれのいい点、悪い点 なども教えていただけるとうれしいです。

  • 個体差?

    年末にGV-NX88T512HPを購入したのですが、 初期不良(BIOSの警告音を参考にすると、メモリの不良)で先程交換 してもらいました。 そして、今組み付けてドライバを入れなおしてみたのですが、 クロックが若干下がっています。 ATIToolやEverest、GPU-Zなど色々なソフトで確認してみたのですが、 すべて同じ表示です。 コアクロックは問題ないのですが、メモリクロックが920Mhz(1840Mhz)と表示されています。(公式発表、また初期不良の物のクロックは1900Mhzでした) 初期不良の製品、また今までのGPUでは起こらなかったことなので心配です。

  • エアコンの寿命って?

    個体差があることも、使い方、手入れ等によることも、ありでしょうが、 普通にエアコンの寿命ってどれくらいなものでしょうか? 効きが悪い感じなのですが、修理を頼んでみるか買い替えか、考慮中です。 尚、暖房はほとんど使いません。冷房専用で、稼働率も決して高くない。 年間150~200時間程度しか使ってない計算になる。 余り使わないほうが壊れやすいとか、ありますかね?

  • R言語で統計分析を始めたい

    カテゴリ違いかもしれませんが、 ここなら適切な回答を頂けると思い質問します。 本日ちょっとした出来事がありまして統計分析とR言語に強烈な興味をもちました。 しかし、残念ながら中学の数学もろくにできないような人間ですので 統計学を学ぶにはどの位のレベルの数学知識が必要かが知りたいです。 今目標としているのは財務省が発表している輸出入貿易統計を使って 今後どの国に何を輸出したらよいかという指標を自分で算出したいと思います。 データ参照元↓(財務省統計ページ) http://www.e-stat.go.jp/SG1/estat/List.do?lid=000001100843 こういった予測をするのに必要な数学レベルを教えてください そこから統計分析、R言語と進んで行けたらと思います。 よろしくお願いします。 余談ですが英語が読めたりコピペでVBAプログラムを多少作る事はできます。

  • 統計学に良く用いられる「個体内変動」と「個体間変動」について

    統計学に良く用いられる「個体内変動」と「個体間変動」の意味が分からなくて困っています、「個体内変動」と「個体間変動」とはいったい何なんでしょうか?知識をお持ちの方よろしくお願いします。

  • 旅人算

    例題 2400mはなれたA、Bの2地点から、はろ美さんはA地点から、すく男君はB地点から同時に出発 してそれぞれ何往復していきます。1回目に出会ったのは2人が出発してから16分後で、2回目に会ったのはA地点から624mのところでした。 (1)2回目に出会うのは最初に2人が出発してから何分後ですか。 (2)はろ美さんの速さは分速何mですか。 解説 (1) 2回目に出会ったとき、2人のきょりの和は1回目の3倍になっている。1回目に出会うまでの時間が16分なので、2回目に出会う時間は16×3=48分。 (2) 2回目に出会うまでに、はろ美さんはすく男君よりも1152m多く進んでいるので、速さの差は1152÷48=24m。 速さの和は2400÷16=150mなので、和差算で考えていけば、はろ美さんの速さは (150+24)÷2=87m (1)ですが、解答は48分ということなのですが、漠然としていてなんだかよくわかりません。 どうして、そうなるのでしょうか?

  • 統計の分析について

    授業で質問紙を実施し、統計で分析をするのですが、どの分析方法で行えば良いかわからず困っています。 私がやろうとしていることは、まず、状態不安尺度を実施⇒不安が喚起されるような出来事・安心感が喚起するような出来事を実験により与える⇒再度、状態不安尺度を実施し、不安喚起条件群と安心喚起条件群それぞれの状態不安がどう変化するかをみたいと思っています。 この疑問は、すでに回答者様からとても詳しい回答を頂いており、解決しております。 (出来事(不安・安心)×状態不安尺度測定時期(前・後)の2要因2水準の分散分析を行う予定です。) 次に、不安喚起・安心喚起によって状態不安が変動する人・しない人(不安喚起によって安心したり、安心喚起によって不安になったりしないものとするので、不安喚起によって状態不安が高くなる人(変動する)と、変動しない人の2群のみを考えています)の個人特定をみるために、モーズレイ人格目録(MPI)という質問紙も実施したいのですが(一回目の状態不安を測る時に、一緒にMPIも実施します)、この場合は、どういった分析方法で分析すれば良いでしょうか? 私としては、MPIの9分類と、被験者を変動した群・変動しない群の2群にわけた、両群によるMPIの差をt検定にて検討、という分析方法を考えています…が、まだ統計を習いたてなので、これで正しいか分かりません…。この分析方法は間違っているでしょうか? まだ、統計は習ったばかりなので(先生曰く、まずアンケートやって分析してみなさいとのことなのです)わからないことばかりです。 ですが、アンケートをとってからあわてるのはいやなので、まず質問紙を取る前に、取り終わった後にどのように分析するか、きちんと決めてから調査を行いたいと思っています。 すでに書きましたが、私は統計がかなり苦手なので、わかりやすく回答していただけたらと思います。 よろしくお願いします。