統計手法を用いて機械差を知りたいのですが・・・

このQ&Aのポイント
  • 製品の特性を調べるため、効率を考慮して2台の測定器(AとB)を使用したいと考えています。単純に、AとBの測定値の相関をとり、最小二乗法によって関数を求めようかと考えたのですが、その方法では問題があるような気がします。
  • A測定器での基準値は既に確立されており、新規のB測定器で測定した場合、ある変換式を使用してA測定器での基準値で判断したいと考えています。
  • 同じサンプルでそれぞれの測定器で測定することは不可能であり、問題があるような気がします。データ数は、同一ロット毎にA測定器:B測定器=3:1の測定値、ロット数は50ロット分くらいのデータが蓄積されています。
回答を見る
  • ベストアンサー

統計手法を用いて機械差を知りたいのですが・・・

製品の特性を調べるため、効率を考慮して2台の測定器(AとB)を使用したいと考えています。 A測定器での基準値は既に確立されており、新規のB測定器で測定した場合、ある変換式を使用してA測定器での基準値で判断したいと考えています。 単純に、AとBの測定値の相関をとり、最小二乗法によって関数を求めようかと考えたのですが、全く同じサンプルでそれぞれの測定器で測定することは不可能であり(同ロットであることは間違いないのですがサンプルが違います)、問題があるような気がします。 このようなケースの場合、どのようにすれば良いか教えて下さい。 参考までに、データ数は、同一ロット毎にA測定器:B測定器=3:1の測定値、ロット数は50ロット分くらいのデータが蓄積されています。(素データとしてA測定器で約150、B測定器で約50のデータ数です) 宜しくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • mythism
  • ベストアンサー率52% (45/86)
回答No.2

#1です. 等質というのは,ここでは,A測定器で測定したサンプルとB測定器で測定したサンプルが同一の母集団から抽出された,あるいはそのように見なせるという意味です.例えば,A測定器で測定したサンプルはX製造機で作成されたもので,B測定器で測定したサンプルはY製造機で作成されたものだとすると,これらの2つの「サンプルの集合」は,製造機ごとにことなる可能性がありますので,等質とは見なせません.それに対して,両方の「サンプルの集合」がともにX製造機で作成されたものや,X製造機とY製造機で作成された製品の集合から,無作為にサンプリングされたものである場合には,統計的には平均・分散ともに同じになるはずであり,2つの集合が等質であると見なせます. 標準化得点は,そのサンプルの集合の平均値をAVE(X),標準偏差をSD(X)とし,そのサンプル内の任意のデータの値をXi(Xiは正規分布に従う)としたときに, Yi = (Xi - AVE(X)) / SD(X) で求められるYiのことを言います.このようにしてXiから変換されたYiの集合は,平均値が0,分散(標準偏差)が1である正規分布に従うという特徴があります. ここで,等質なサンプル集合においては,A測定器のサンプルとB測定器のサンプルでは,本当であれば平均値および分散は同一であると考えられるます.そのため,ある程度のサンプルを取れば,A測定器による測定器の平均値・分散とB測定器の平均値・分散のずれは,本来,等価であるものがそれぞれの測定器の性質により生じたものだと考えられます.このように考えると,各測定器の平均値を0,分散を1で同じになるように変換すれば(つまり,標準化得点を求めれば),実際には,標準化得点の平均値が0の点における各測定器での測定値が対応関係にあることになります.同様に,標準化得点が1(実際には,0以外の任意の数)の点でも,その点における各測定器での測定値が対応関係にあるということがいえます.後は,この2点を元に,変換式(y=ax+b)を作成することができるということです.

krckrc
質問者

補足

詳しいご説明ありがとうございます。 最後に確認させて下さい。 A測定機での基準値Ximin~Ximaxについて、A測定機によるAVE(XA)、SD(XA)でYimin、Yimaxをもとめ、この値とB測定機によるAVE(XB)、SD(XB)からXiを算出すれば良いってことでよろしいでしょうか?

その他の回答 (2)

  • mythism
  • ベストアンサー率52% (45/86)
回答No.3

#1です。 いろいろと忙しく,お返事が遅れてしまいました。 申し訳ありません。 >A測定機での基準値Ximin~Ximaxについて、A測定機によるAVE(XA)、SD(XA)でYimin、Yimaxをもとめ、 >この値とB測定機によるAVE(XB)、SD(XB)からXiを算出すれば良いってことでよろしいでしょうか? はい。手持ちのデータで処理するには,それで良いのではないかと思います。

krckrc
質問者

お礼

お忙しいところ、貴重なアドバイスありがとうございます。大変助かりました。

  • mythism
  • ベストアンサー率52% (45/86)
回答No.1

今ひとつ,質問者さんの行ないたいことがつかめておりませんので,適切な回答かどうかがわからないのですが…. もしも, ・A測定器で測定したサンプルの集合とB測定器で測定したサンプルの集合が等質であると仮定でき, ・測定結果が標準正規分布に従うと考えられる という2つの条件を満たしているならば,双方ともに測定結果をA測定器とB測定器ごとに標準化得点(平均が0,分散が1の標準正規分布に従うように測定値を線形変換された得点)を求めてみてはいかがでしょうか. 2つのサンプル集合が等質であれば,その平均値は同一になるはずですから,それと標準偏差を考慮してA測定器とB測定器の変換関数が作成できるのではないかと思います. 的外れでしたら,申し訳ありません.

krckrc
質問者

補足

御回答ありがとうございます。質問文章が難解になってしまい申し訳ございません。 質問の意味は、mythismさんの解釈どおりです。 で、さらに教えて頂きたいのですが、“等質”とは?また、“標準化得点”の計算はどのように求めれば良いのでしょうか? 無知ですみません、お教え願います。

関連するQ&A

  • 有意差が生じているかどうかの統計手法を教えてください。

    有意差が生じているかどうかの統計手法を教えてください。 質問事項は2点在ります。 1.Aというサイトで1年間Bという物質の日平均濃度を測定し、同サイトにおける地上5mと25mとの温位日平均値とで相関が見られた。翌年同様の測定を行ったが、同じ程度の有意性が認められるのか確認するにはどのような手法を用いればよいのか。 2.1999年度に500地点で測定されている物質Xと物質Yの日平均濃度値を用い、Y=aX^bという回帰式が求められた。10年後に再度同様の手法で回帰を求めて得られたY=AX^Bという式は10年前に求めた式と有意な差が見られるか 以上です。 数学に疎く、理解できなくても使えれば良い、という状況下におります。 ご見識のある方のアドバイス、よろしくお願い致します。

  • 統計手法

    ある薬Aの投与前後の血液データBの変化について統計処理を考えています。しかし血液データBは非常に個人差が大きくサンプル数10程度では正規分布には程遠くなってしまいます。このような時はWiscoxinの符号順位検定を用いて検定してよいでしょうか。また、投与前をたとえば100としてデータを標準化した場合はどのような統計処理がよいのでしょうか。

  • 統計的手法について

    現在,品質保証業務をこなしているものです. 旧式測定機と比較して,新型機の方が測定精度は向上している(もしくは同等以上である) ということ言うためにデータ取りを行うところです.(検査特性:漏水量) ここで質問ですが,検査対象になるワークが嵩張るためn=10×3種類しか入手できませんでした. n数が少ないときに有効な比較方法,もしくはデータ取り-統計的手法があれば教えてください.

  • 次のような場合に適した統計手法を教えてください

    統計初級者?ぐらいの者です。 基礎的な回帰、重回帰分析ぐらいまでならいちおう(クリック統計学レベルで…)理解しているのですが、いろいろと実作業をやっていて、わからなくなったので質問させていただきます。 さて、 調査の中身自体は全く違いますが、実際に次のような分布のデータがとれました。 -------------------------------- 【取得できたデータの概要】 -------------------------------- 家族の人数と、現在の生活に対する平均満足度に対するアンケートを5000人に行ったとして、 ■A. 生活満足度×家族の人数の相関  まず、家族の人数と、生活満足度を、シンプルにピアソンの相関係数で測った場合、-0.16程度しか出てきませんでした。5000人で、-0.16であれば、弱い相関は確実にあり、p値も、0.001以下になりました。  ただ、調整済み決定係数は、0.1未満…。正直、かなり弱い相関で、今ひとつインパクトに欠けるデータです。 ■B. 平均生活満足度×家族の人数の相関  また、少しデータの見方を変えて、家族人数が1人の時、2人の時、でそれぞれ、生活満足度の平均をとってやったとします。(この場合の「平均」はシンプルに算術平均をとりました。) 1人の時の平均生活満足度:4.5 (n=1500) 2人の時:4.4 (n=1000) 3人の時:4.3 (n=1400) 4人の時:4.2 (n=600) 5人の時:4.1 (n=300) 6人の時:4.0 (n=200) 7人の時:3.9 (n=100) というようなことが、わかりました。 このとき、 「平均生活満足度」と、「家族の人数」で、 相関をとればキレイに「-1」になるかと思います。 回帰曲線も、キレイな線が引けます。 ---------------------------- 【質問の本題】 ---------------------------- 質問の本題は、B.平均生活満足度×家族 の分析のほうになります。 B.の分析で、確かにキレイな数字は出てくるのですが、 こういった形で、分析をしてしまうと、 実際には、5000人のデータを取得しているにも関わらず、 300人ぐらいのデータでも、同じ平均が出てきたら同じ結果になってしまうかと思います。 それぞれのサンプル数が、500人いる場合とで、 サンプル数が10人いる場合とで、行うべき検定等の手法が異なってくるのではないかと思うのですが、 この場合、どのような処理を行うのが適切なのでしょうか。 ご指導お願い出きましたら幸いです。 よろしくお願いいたします。

  • 異なるデータ数から求めた相関値の比較

    時系列のデータA(サンプル数15000程度)とデータB(サンプル数2500程度)があります。この2種類のデータはサンプリング時間は同じですが、サンプリング周期が異なっています。それぞれのデータはXの値とYの値があります。 このとき、データAについて求めたXとYの相関値Aと、データBについて求めた相関値Bは、そのまま比較することはできますか?サンプル数の違いによって、相関値が大きくぶれてしまうことはあるのでしょうか?データAはデータBと同じ数のデータにすべく、データを間引くべきでしょうか? 教えていただけると幸いです。どうぞよろしくお願いします。

  • 統計の有意差に関して

    あるデータの有意差を求めたいのですが、データAとBは全く別のデータでなければいけないのでしょうか?Aの中にBが含まれる場合は、有意差を求める事は不可能なのでしょうか?測定の頻度を再考するために、全てのデータAと、抜き出したデータのまとめBに差があるのかどうか検定したいのですが。

  • 確率と統計

    N個の製品の中に不良数が何個入っているか判らないロットがあるとします。 その中からn個だけ取り出して、不良数がゼロだった場合、N個のロットの中に不良数がゼロである確立は幾らになるか? これだけで、答えは求まるのでしょうか? 私は、ある規定値(例えば寸法公差)の範囲内にn個の製品がどのように分布しているかで、上記の求めるべき確率は変わると思うので、求められないと思っています。 例えば、n個の測定結果より、その工程能力がCpk=cであった場合、N個のロットの中に不良数がゼロである確立は、幾らになりますでしょうか? 御回答の方、宜しくお願い致します。

  • 統計の信頼性

    統計データの信頼性はどのようにして確認したらよいのでしょうか?? 母体数が少なすぎるのはわかっているのですが(5しかありません・・)、これの相関を見たときに「相関がある」という結果が出ました。R2乗は0.9くらいです。でもあまりに信頼性がなさすぎると思うのですが、もし無理やり信頼性を数値で表すとしたらどのような作業をしたらよいのでしょうか?ちなみにJMP使って解析をしています。 どなたか、すごくやさしくわかりやすい回答をしていただけないでしょうか。

  • 分析の個人差を調べるには、どういう検定を行えばよいでしょうか

    今、ある成分の分析(法)について、測定者による違い(個人差)が(有意に)あるのかないのかを検証したいと考えています。 例えばですが、測定者が4人いた場合、適当な数のサンプルを用意して同条件で一斉に分析し、以下の様なデータを分散分析すれば良いのかなと考えています(測定者が2人なら、対応のあるt検定でしょうか)。 つまり、各自が出した値の平均を比較し、有意の差があるのかないのかを見る、ということで検証出来るのだろうという考えです。 測定者 Aさん Bさん Cさん Dさん サンプル1 1234 1235 1236 1237 サンプル2 3456 3457 3458 3459 (中略) サンプル6 6781 6782 6783 6784 まず、第一のご質問なのですが、こういう考え方で大筋間違っていないでしょうか? もしも決定的にダメな点があれば、どういう実験にすればより良くなるか、知りたいと思います。 またこの時、少し気になっているのが、サンプルの濃度がサンプルごとに大きく違っていたらまずいのだろうかということです。 上の例だと、4桁ということで大体同じかなとも思うのですが、例えば以下の様にサンプルごとの違いが大きいと、分散分析して良いのか、少し心配になっています。 測定者 Aさん Bさん Cさん Dさん サンプル1 34 35 36 37 サンプル2 3456 3457 3458 3459 (中略) サンプル6 26781 26782 26783 26784 第二のご質問として、こういう場合はどう考えるべきか、知りたいと思っています。 こういう事に通じておられる方のご意見を、うかがってみたいので、どうぞよろしく御願いします。

  • 統計学 二つのグループの有意差検定?

    二つのグループのサンプルについて統計的な検定をしなければならないのですが、統計学が全く分からないもので、何検定を使ってどう検定したら良いのか分かりません。下記が検定をするデータで、「A群の方が値が大きく、ABの二群には有意な差がある」と結論付けたいのですが、やり方をご教授願えませんでしょうか?A、Bでサンプル数が異なっていてどういった検定を使うのが正解なのか全く分かりません。よろしくお願い致します。 A群 B群 3  2 4  1 2  1 3  2 3 3