問題:測定器Aで測ったデータと測定器Bで測ったデータの関係性について

このQ&Aのポイント
  • 測定器Aで取得したデータと測定器Bで取得したデータの関係性について考えます。
  • 測定器Bで取得したデータを正規分布で表現し、測定器Aとの差分を計算する方法を提案します。
  • 120個のデータが正規分布にしたがっているかどうかを通常の判断基準で判断することができるかについても考えます。
回答を見る
  • ベストアンサー

この場、正規分布ですか

測定器Aで測定したデータ(データは一回しか取れない) 1mm 5mm 10mm 50mm 測定器BはAで測って1mmの物を30回測定結果は、N(1.1,0.2)の正規分布        Aで測って5mmの物を30回測定結果は、N(6,1)の正規分布        Aで測って10mmの物を30回測定結果は、N(9,2)の正規分布        Aで測って50mmの物を30回測定結果は、N(53,4)の正規分布 問題:Bで測った15mmの物は Aで測ったら何mmですか? 方法(1):Aで測ったデータをX軸にして、Bで測ったデータ各平均値でY座標にして、      得た4点で近似直線を作る、直線の式で問題を解ける(良くないと思う) 方法(2):(Bで測ったデータ-Aで測ったデータ)/Aで測ったデータ=m1 %       30回*4=120回 だからm1 % m2 % ・・・・m120 %--120個データ       この120個データは正規分布だったら、中央値5%とする 上記の問題も       解ける 質問は上記方法(2)の120個データは正規分布判断できますか(通常判断)

  • enli
  • お礼率54% (40/73)

質問者が選んだベストアンサー

  • ベストアンサー
  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.1

 ご質問の最後に「通常判断」と書いてあるのは(意味は分からんが)、おそらく、理論の話じゃなく(つまり、統計学などの演習問題の話ではなくて)、実務でお困りだということを暗示しているんでしょう。  ご質問のような推定をやるためには、少なくとも「AとBの測定値の関係が、物の長さLについて、とても滑らかな関数になっている」と仮定する必要があります。(現場でなら、測定器の仕組み、あるいは観察から、この仮定が妥当かどうか分かるでしょう。たとえば、「Aは火事場から拾ってきた、飴の様に溶けたプラスチック定規だ」というのなら、この仮定は無理そうです。)  方法(1)は大はずれではない。ただし、「Bで測ってYだったものを、Aで測ったら幾ら?」を予測したい場合、近似直線(回帰直線)なら X = aY + b の係数a, bを最小二乗法で決めてやることになります。ところが方式(1)の Y = αX + β では、別の直線(Aの測定結果からBを予測するための直線)が出てしまいます。  また、方式(1)は値のばらつきを無視してしまっているのがまずい。ナマのデータ120個が使えるのであれば、それを使って回帰曲線を作れば良いんです。  なお、近似曲線が直線でいいのか、もっと高次の曲線(2次曲線、3次曲線...)にすべきなのかは、AIC(赤池の情報量規範)を使って判断できます。でもま、この程度の話であればそこまでやらず、「直線でいいや」と決めてかかっても構わないでしょう。  一方、方法(2)は、式の結果が正規分布になるかどうかを心配する以前の話として、 a) 「AとBの関係(狂い方)は正比例である」というエラク強い仮定を置いているようである。A, Bの測定原理等からそう推論できるなど、特別な根拠があれば良いのだが、でも、測定した分散は正比例関係ではないことを示唆しているようにも思われ、この仮定はどうも無理っぽい。 b) 正比例だという仮定の下での回帰直線の計算方法として、この式は適切でない。また、何で中央値を使うのか。(それに、「中央値5%」ってなんだ?)。 という問題点があります。

enli
質問者

お礼

詳しくご回答いただきまして、ありがとうございます。 こちらの説明が良くないかも、直線で求めるなら、例えばBで測った15mmの物は Aで測ったら16mmだったら、16mmだけじゃなく、Aで測ったデータのバラツキも知りたい。そうすると、直線式では分からないですね

関連するQ&A

  • ベータ分布の正規分布近似について

    二項分布やガンマ分布の正規分布近似は成書によく記載されています。そこで二項分布の仲間であるベータ分布Be(a,b)を正規近似してみようと思いました。 Be(a,b)の平均であるa/(a+b)、分散ab/((a+b)^2*(a+b+1))をそのまま用いN(a/(a+b)、ab/((a+b)^2*(a+b+1)))としたらどうかと思いグラフで見たところ、なるほどa,bがそれぞれ8,9以上になると、モードと平均の差が殆ど無くなり左右対称の釣鐘型に見えてきます。どうやらa,bが大きくなれば正規分布に近づいていきそうだというのはうすうす分かるのですが、このやり方では感覚的に過ぎるのではないかとも思いました。何かスターリングの公式のような近似か、極限を用いて数式的証明をするべきなのでしょうか?それとも実際に色々なa,bの値のもとでグラフ曲線を描き、一々正規曲線を当てはめてみるべきなのでしょうか?それとも二項分布の逆正弦変換のように何かデータを変換させるとかいう方法があるのでしょうか、どうかお教え願います。

  • 正規分布への変換について

    お世話になります。 現在計測しているデータの工程能力を計算しているのですが、 データの分布が正規分布していないように見られます。(N=30個) そこで、自然対数を取ると正規分布に近づくのですが、 なんの根拠もなしに自然対数を取っても良いものか 理解できていません。 ネットで検索しても正直よく理解できず、 噛み砕いた説明がある文献やサイトをご存じないでしょうか。 ちなみに、データはそれぞれ独立したワークから測定したものです。 自分なりに勉強し、正規分布の検証として ?測定データと期待値のグラフを作成  →直線状ではなさそうだが、どの程度のばらつきが許されるのか   わからず、判断がつかない。 ?ネットからD'Agostino-Pearson正規分布検定なるものを実施  →K^2 4.0、 p 0.13 正規分布の可能性がある。   値の意味は理解できていないのですが、   正規分布の可能性としては低めということだけは推測できました。 以上、どうぞよろしくお願いいたします。

  • 確率 正規分布

    確率 正規分布 確率変数Xが正規分布N(5,2^2)に従う (1)P(6<=X<=9) (2)P(3<=X<=8) (3)P(X<=10) を求めよ という問題があるのですが、標準化変換のところがイマイチわかりません 調べたら 6=m+a 9=m+2a(mは平均、aを標準偏差としたとき) とかいてあるのですがそこからなぜ標準化変換したらP(0.5<=Z<=2)になるのかわかりません どなたかよろしくお願いします

  • 正規分布近似について

    たとえば、二項分布B(n,p)について、np≧5かつn(1-p)≧5なら正規分布近似できるとか、ポアソン分布Po(λ)についてλ>1000ならば、平均λ、標準偏差√ λの正規分布の非常によい近似であるとか言われますが、その他の分布についてもいつ正規分布で近似できるか、などというよく知られた判定基準はあるのでしょうか? 中心極限定理は確かに有用ですが、nがどれぐらい大きくなれば正規分布にどれぐらい近いか、ということについては何の情報もありません。もちろん分布によってその収束が大きく異なるからでしょうが、収束の速さについての一般的な理論というのはあるのでしょうか?統計の応用という意味では重要な問題のように思うのですが。

  • 正規分布について

    よろしくお願いします。 現在、実験により、帯電量を測っており、対象物一つ一つの計測では計測時間がかなりかかってしまうため、統計的に何個か抽出して測定しようと思っています。 何個くらいの帯電量を測れば全部の帯電量とみなしてよいか、計算しようと思うのですが、その前に正規分布になるか調べています。 この正規分布かどうか見る場合というのはすべての対象物を測定しなければいけないのでしょうか? それともすべて見なくても正規分布とみなせるのでしょうか。 また、みなさまのおすすめの統計学の本などありましたらご紹介していただけますでしょうか。 僕が探した本は学問としての問題ばかりで現実問題としてあまりピンときませんでしたので、できるだけ実験での統計例や現実的な例が載っている問題の方がありがたいです。 よろしくお願いします。

  • 正規分布についての計算

     Xが正規分布に従い   X1、X2.。。。。X10は小⇒大の順次で並んでおり  この10点の近似直線上にある対応点が x1, x2...... x10  残差Δ=xn-Xn   上記より、下記が分かるはずですが   Xnの確率  %=1-n/(1+n)   確率と残差は正比率関係であり、 % = a*Δ+b = a*(xn-Xn) + b----(1)  一方   正規確率紙で横軸をXとする 縦軸を確率% とする 10点を描くと直線になる   はずで、つまり %=m*x+n---(2) という式も成立つはずです。  教えていただきたいのは、(1)が成立すれば(2)が成立するのでしょうか。  もう一点教えていただきたいのは、(1)式を算出する過程(計算式)です。    現在、大変困っております。申し訳ありませんが  どなたか教えていただけないでしょうか。  よろしくお願いいたします。

  • 正規分布

    あるN人が試験を受けたとします。得点分布が正規分布に従うと仮定し、最高点Mと上位U人の平均点A、上からU人目の得点Lは与えられているものとします。 このとき、ある人の得点からその人が上から何番目か求めることはできますか? できないとすれば、どのような条件を加えれば求まりますか?

  • 正規分布の問題です。

    兵庫県の高校3年生の50メートル走における記録の分布は、男女でそれぞれ正規分布N(7.5,0.8^2),N(9.4,1.2^2)に従っている。その中のある5人の記録は、 A(男)8.3、B(女)10.2、C(男)6.9、D(女)8.2、E(男)9.0であった。 男女の性別を考慮に入れたうえで記録のいいと思われる順にならべよ。(単位はすべて秒) 講義を休んで答えがわかりません よろしくおねがいします。

  • 正規分布のやり方

    統計学を初めて行っています。 A・B・C・D・Eの被験個体の心拍を(1)平常(2)負荷をかける(3)30分後と3回測定しました。 この時の統計で最初に行う正規分布の作り方なんですが、 ABCDEの心拍数の絶対値を(1)(2)(3)と全てまとめてかけるものなのでしょうか?それとも(1)ごと、(2)ごと、(3)ごとではかるべきでしょうか? 次の処理を一元配置の分散分析へと考えています。 どうか、皆様にご教授いただければと思います。

  • 正規分布

    ある正規分布N(μ、σ)に従う母集団からnの標本、X1、X2、・・・・・・Xnを取り出すとき Y=X1+2・X2+・・・・・・+n・Xn はどのような分布で表されるかという問題なのですが解き方が分かりません。 どの用に結論づけ答えを出せばよいでしょうか?