• ベストアンサー

統計学に関する質問です。

統計学に関する質問です。 1.統計書で「正規分布する母集団から独立に得たX1、X2、…Xn」という記載がありますが、ここでの「独立に得た」は具体的にどういう意味でしょうか? 2.『Q&Aで知る統計データ解析』という本に「測定値の独立性」に関する記載があり、「同じ被験者の反応が同一条件下で反復して測定される」場合、「観測値は独立とはいえない」といった解説がありました。この「観測値の独立性」とは具体的にどういう意味でしょうか?単一事例からベースラインをとり、その後介入期を設けて、それぞれから得た観測値を検定にかけることは統計誤用でしょうか? 以上、宜しくお願い致します。

質問者が選んだベストアンサー

  • ベストアンサー
  • ramayana
  • ベストアンサー率75% (215/285)
回答No.1

1 厳密な定義 X1、X2、…Xnが独立であることの厳密な定義は、任意の実数a1、a2、…、anに対して、「X1<a1、X2<a2、…、Xn<anとなる確率」が「(X1<a1となる確率)×(X2<a2となる確率)×…×(Xn<anとなる確率)」に一致することです。 2 実用上の扱い 実用上は、扱っている観測値X1、X2、…Xnについて、上の関係が言えそうかどうかで判断するしかありません。 なお、どのXiも他のX1、X2、…Xnと無関係に変動するなら、X1、X2、…、Xnは独立になります。 3 「同じ被験者の反応が同一条件下で反復して測定される」場合は、次のように考えられます。例えば血圧を測るとき、X1が200以上なら、その被験者は高血圧である可能性が高いので、X2も200以上になる可能性が高いと考えるのが普通でしょう。 つまり、日本全国からランダムに選ばれた人の血圧が200未満である確率をpとすると、もし、X1とX2がランダムに選ばれた別人の観測値なら、「X1<200、X2<200となる確率」は、(1-p)×(1-p)と考えられます。ところが、同一人物からの観測値なら、これは、(1-p)×(1-p)より大きいとみるのが素直です。そうすると、1が成立しないので、これらは独立でないと判断されるわけです。

161016
質問者

お礼

丁寧な説明、有難うございました。厳密な定義は全く知りませんでした。自分なりに理解が深まったと感じています。 ちなみに質問本文中、「測定値」「観測値」と用語が不統一でした。文献記載は「測定値」でした。

関連するQ&A

  • 統計学に関する質問です。

    例えば、以下の検定を”1人の”被験者に行うことに問題はあるでしょうか? 「ベースライン期(ただ観察するのみの10日間)と介入期(治療を行う10日間)を設け、1日1回、一定時間における反応数を計測します。すると、ベースライン期に10個の測定値、介入期にも10個の測定値を得ます。前者10個の測定値の集まりを1標本、後者10個の測定値の集まりを1標本とし、それら2標本の統計学的検定(t検定なり、ノンパラメトリック検定なり)を行い、反応数が有意に多いかをみる(反応数が多い方が好ましいとする)」 最近、本で読んだ、「測定値の独立性」がどうも気になり、「1人の被験者内の2群を検定にかけることはできないのかな?」と思ってしまったことが質問の背景にあります。

  • 統計学(独立性の検定)について

    独立性の検定の検定統計量を求める式の意味がわからず、調べていたところ、「例示的な説明」としながらも、該当箇所が見つかりました。が、自分には難解で、わかりにくいです。どなたか、以下の内容を噛み砕いて教えていただけないでしょうか? 「Eiはi番目の観測単位(セル)の理論値だが、観測値であるOiが、パラメーターがλiのポアソン分布に従うとすると、Ei=λiとなる。(ポアソン分布の分散は期待値と同じくλiなので)、 Σ(Oi-Ei)の2乗/E =Σ(Oi-E(Oi))の2乗/σ2乗(Oi) となる。ここで、E(Oi)とσ2乗(Oi)はi番目のセルの期待値と分散である。これは、 カイ2乗=Σ(Xi-μ)/σ2剰と同じである。」 特に、「観測値であるOiが、パラメーターがλiのポアソン分布に従う」のところが、具体的にイメージできません。 例えば、   ダイエットに興味がある ダイエットに興味がない 男    50             150 女    150             50 の場合、50や150という度数がポアソン分布に従うということでしょうか? 宜しくお願い致します。

  • 統計学の初歩的な問題について

    統計についての質問です!;; 変数yはN(4,9)の分布に従うとする。 (1)-2yはN(a、b)に従う。aとbを求めよ (2)3y-2の分散を求めよ (3)この分布から独立に3個の観測地を得た。この平均の標準偏差を求めよ。 とても初歩的な問題だと思うんですが、度忘れしてしまい解けません。。。 もし知恵を貸していただけるかたがいらっしゃいましたら、よろしくおねがいします!;;

  • 統計学での確率変数Xと観測値xの使い分けについて

    全く別物だと思うのですが、理解できなくて質問いたします。 確率変数Xは、その値をとる確率が決まっている変数であり、 観測値xは、ただ実際に出現した値、であることは理解しています。 確率密度関数では横軸が確率変数であり、Pr(X)の値が縦軸である、というのがわかりやすかったです(以下ブログを参考)。 https://bellcurve.jp/statistics/blog/14006.html 1)しかし、この考えでは次のブログのことを理解できませんでした。 http://igakubugakushi.com/ctl1/ 互いに独立であり、同一分布に従う確率変数X1、、、Xnとあります。1つの確率密度関数には、複数の観測値xを決まった確率で取りうる確率変数Xが1つある理解でした。1つの確率密度関数に複数の独立の確率変数があるというのはどういうことでしょうか。 2) また、同じブログの「母集団が正規分布だった場合」 http://igakubugakushi.com/interval-estimation1/ X1~N(μ、σ²)  : Xn~N(μ、σ²)とすると、正規分布の再生性により、 x1~+xn~N(nμ,nσ²) よって、x⁻(観測値xの平均)~N(μ,σ²/2) との記述があります。複数の確率密度関数が同じ正規分布に従っている、のは一先ずおいておくとして、そのあとの正規分布を再生する観測値x1~xnは、どの確率分布から出てきたものなのでしょうか? 3)また、2)で出てきた、x1~+xn~N(nμ,nσ²) → x⁻(観測値xの平均)~N(μ,σ²/2) になるのはなぜでしょうか?x⁻~N(μ、σ²)ではないですか?(nで全てを割るのであれば) ただのブログの書き間違えなのか、私がよくわかっていないのかわからず、解説いただきたいです。

  • 統計学の「独立」についての質問です。教科書に出てくる「試行の独立」「事

    統計学の「独立」についての質問です。教科書に出てくる「試行の独立」「事象の独立」「標本の独立性」(これは「標本の独立性は統計解析の前提」といった文脈で登場)はいずれも違う概念でしょうか?それぞれの意味を初心者向けにわかりやすく教えて頂けると幸いです。

  • 統計解析についての質問です。

    品質管理部門に所属している者ですが、統計解析について質問です。一元配置による分散分析を行い、F分布表5%水準でグループ内に有意差を認めない場合の検出力とはどの程度でしょうか。 また、母集団の不良率を正規分布表により推定し不良率が0.5%以下というのは、具体的にどの程度になるのでしょうか?

  • 統計です・

    統計学の質問ですがお願いします。 母集団全体における内閣支持率をp(pは未知定数)とする。母集団から無作為に抽出し、支持する場合は「1」、しない場合は「0」と変数Xに記録する。 1、Xは確率変数である。Xの確率分布を求めよ。 2、Xの期待値と分散を求めよ。 無作為抽出をn回独立に復元抽出で繰り返したとする。この無作為標本から得られた回答を上記と同様にX1、X2、…Xnに記録したとする。 3、S=X1+X2+…+Xnとすると、Sはなにを意味するか答えろ。 4、Sの期待値と分散を求めよ 5、X_(←エックスバーです)=S/nと定義する。X_は何を意味しているか答えよ 6、X_の期待値と分散を求め証明過程を説明せよ。 7、X_の2シグマ区間をもとめよ

  • 統計学です。お願いします。

    統計学の質問ですがお願いします。 母集団全体における内閣支持率をp(pは未知定数)とする。母集団から無作為に抽出し、支持する場合は「1」、しない場合は「0」と変数Xに記録する。 1、Xは確率変数である。Xの確率分布を求めよ。 2、Xの期待値と分散を求めよ。 無作為抽出をn回独立に復元抽出で繰り返したとする。この無作為標本から得られた回答を上記と同様にX1、X2、…Xnに記録したとする。 3、S=X1+X2+…+Xnとすると、Sはなにを意味するか答えろ。 4、Sの期待値と分散を求めよ 5、X_(←エックスバーです)=S/nと定義する。X_は何を意味しているか答えよ 6、X_の期待値と分散を求め証明過程を説明せよ。 7、X_の2シグマ区間をもとめよ わかる範囲でいいのでおねがいします。

  • pearsonの相関の計算の不適切さ(統計学)

    実権を行い、10匹の実験動物のある臓器の酵素Aの活性と酵素Bの活性とを測定した。 その際のデータを表に示す。pearsonの相関を計算したところ、 r=0.991,p<0.01の結果を得た。学会で発表したところ、解析方法が不適切と指摘された。どう統計解析を行うべきだったか。2つの方法を答えなさい。 とありました。 表は 個体番号  酵素A    酵素B 1 1.0 1.1 2 1.1 1.7 3 1.2 1.3 4 1.3 1.6 5 1.4 1.4 6 1.5 1.5 7 1.6 1.4 8 1.7 1.8 9 1.8 1.0 10 10.0 10.0 とかいてありました。 まず、rというのは何を意味してるのでしょうか。 ポアソン分布とは e^-μ ・ μ^x/x! という公式だと記憶してます。 そして定義が n回施行したとするとそのnを無限大に近づけ、pはゼロに近づけると分布の的確さが証明できる分布だということだったと思うのですが、統計じゃなくて生命科学の問題でこれがでてきたので統計をかじった自分にとっては難問です。 一応、考えたのがそもそもnが10でポアソンの分布を取るには数が少なすぎる ということしか考えられませんでした。 そもそもr=0.992と書いてありますがこのrは何を意味してるのでしょうか。 また結果2つの方法とはどういうアプローチを行えばいいのでしょう。 わかりやすくご指導お願い申し上げます。理解をしたいのでお時間がございます時にご指導お願い申し上げます。

  • 統計の基礎なんですが…

     大学へ入って「統計の基礎」というのを習っているのですが  正規分布の特徴に 『互いに独立に作用する多数の偶然的要因があり、一つ一つ要因の全体への影響が微少であるとき、これらの諸要因がもたらす誤差の総和は正規分布する』 ってあります。 「諸要因がもたらす総和というのはいったい何?」という疑問と「誤差が正規分布するとは?」という疑問が起こりました。  インターネットで用語集を探してみてみましたが、難しくてよくわかりませんでした。具体例…みたいなものをあげていただくとわかりやすいです。 すいません。ひょっとしたらものすごく漠然としているかもしれません。ですが、解説よろしくお願いいたします