• ベストアンサー

分析結果の補正係数

いつもお世話になります。 ある食品の酸度や食塩分の分析方法を変更するに当たって、 新規の方法と従来の方法の結果を摺り合わせするために 補正係数を算出したいと思っています。 まずそれぞれの方法で50回ずつ分析しました。 私が思いついたのは最小二乗法だったので、Excelで散布図にプロットし 線形近似で方程式を求め、そこに新規法の結果を代入し、補正値を算出しました。 別の人は、従来法結果÷新規法結果の50回分の平均を補正係数としていました。 (補正値-新規法結果)が従来値に近いほど補正係数として適していると考え計算したところ、 酸度では私の方法(最小二乗法)が塩分では別の人の方法(除数の平均)がよりよい結果になりました。 どちらが正しい方法なのでしょうか? また通常こういった場合の補正係数はどのように求めるのでしょうか? レベルの低い質問で恐縮ですが、何とぞご教示下さいますようよろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
noname#210617
noname#210617
回答No.2

>(補正値-新規法結果)が従来値に近いほど補正係数として適していると考え 誤差の二乗和を最小にする、と考えているのが最小二乗法です。 >(補正値-新規法結果)が従来値に近いほど という評価方法とは一致しません。 一方、除数の平均は、平均をとってしまっていることで、ばらつきの評価をしていません。データがどんなにばらついていても、平均値は求まります。平均値からはデータのばらつきは伺えません。 最小二乗法の場合、近似方程式としてy=a*xとするか、y=a*x+bとするかの評価も必要だと思います。x=0ならy=0なのは当然と思われるかもしれませんが、分析方法の原理によっては必ずしもそうはならない可能性もあります。 除数の平均をとる場合は、x=0ならy=0は当然、という前提があります。 最小二乗法によるほうが"理"にはかなっていると思います。 >酸度では私の方法(最小二乗法)が塩分では別の人の方法(除数の平均)がよりよい結果になりました。 両者に差があるのは当然です。が、その差にデータのばらつき以上の意味があるでしょうか。 そもそも、 >(補正値-新規法結果)が従来値に近いほど という評価方法が妥当ではないのです。 二乗をすれば、差の絶対値が効いていますが、単に"差"で評価するとプラスとマイナスが殺しあってしまいます。

kkke
質問者

お礼

ご回答ありがとうございます。 確かに仰るとおりだと感じました。 もう少し勉強してみます。

全文を見る
すると、全ての回答が全文表示されます。

その他の回答 (4)

  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.5

No4です。 >>回帰式をy=a+bxとすると、aは理論的にはゼロだが、ゼロにならない場合も多い。 のところが良く分かりません。 測定時には、濃度が既知の標準品(標準液として市販されている場合も)の濃度を変えて測定します。そうすると,標準品が入っていない、すなわちゼロの測定値は、理論上は0.00です。この場合、直線なら切片はゼロなので、検量線は、y=bxになるハズ。手作業で検量線を描くときには、ゼロを通るようにするのは、理論上はゼロになるハズだからです。  しかし、現実には、ゼロにならない場合も、あります。そうすると、検量線は、y=a+bxの式になります。  この原因は、不明な場合が多いのですが、試薬にもとから色がついていた、不純物が多い、なんぞ。あるいは、機械の誤差、なんぞが理由として挙げられます。

全文を見る
すると、全ての回答が全文表示されます。
  • kgu-2
  • ベストアンサー率49% (787/1592)
回答No.4

>どちらが正しい方法なのでしょうか? 最小2乗によって回帰式を算出し、回帰式に代入して補正するのが正しい。  回帰式をy=a+bxとすると、aは理論的にはゼロだが、ゼロにならない場合も多い。aの値だけ、全体的に高くなるので、これを「下駄を履いている」と表現します。aがゼロなら、どちらも同じ。  それより、50回の根拠はなぜですか。より正確なら、50回に限らず、100回でも10000回でもするべきでは。5回もすれば十分で、50回もするのは時間その他費用経費の無駄。50回する前に、まず腕を磨いて下さい。  ただ、これは、以前の方法で出した値と比較する場合にのみ必要。古いデータを引っ張り出すことは現実ではしないので、標準物質などで検量線を描き、その値を真の値(基準)とすればよい。  ただ、論文などでは、「古い方法(または機械)では、値が高く(または低く)でていた」なんぞの表現、研究はある。

kkke
質問者

お礼

ご回答有り難うございます。 50回という数字はこれまで製造した回数で、特に根拠はありません。 やはり検量線を描いて求めるべきなのでしょうか・・・・ あと >回帰式をy=a+bxとすると、aは理論的にはゼロだが、ゼロにならない場合も多い。 のところが良く分かりません。 もう少し勉強してきます!

全文を見る
すると、全ての回答が全文表示されます。
  • nrb
  • ベストアンサー率31% (2227/7020)
回答No.3

補足で判りました 管理する上で補正するが良いのかは別にして どやって管理していけば適切に分析器変更に伴い適切な管理方法構築したいってことですね 旧の測定器で出ている値が現在製造している商品に適した酸度や食塩分である 測定器には個別の持つ誤差や精度などがあるが、 新しい機械で測定して旧の測定器で出ている値が現在製造している商品に適した酸度や食塩分を再現したいってことですね ここで問題になるが、 旧分析器と新分析器に問題になる違いがあるのか その例 新分析器が仮に測定物の温度違いがあっても適正に測定できる 旧がそれができない とがあるならばそれらを加味しないと駄目ですよね まずは、旧分析器と新分析器と何が違うのかが判らないと駄目ですよ これをまず纏める 単純に補正すれば良いのか、さらに捻らない駄目なのか・・ また、結構測定器メーカがアドバイスくれることもあるで・・一回相談すれば良いです 同様な事例が過去にあればラッキーです サンプル件数の適正数 サンプル分散の方法  例 朝、昼、夜    湿度が変わるとどうなる かとかね この手の問題は単純に行くとは限りません  測定器によっては、 時間安定度 温度安定度 湿度安定度 など からんでくる要素は多いのです これらが許容範囲であるのか等 測定器の安定度に寄与する問題もあります

kkke
質問者

お礼

有り難うございます。 もっといろんな側面からの検討が必要なんですね。 メーカーの方にも問い合わせてみます。 この度はありがとうございました!

全文を見る
すると、全ての回答が全文表示されます。
  • nrb
  • ベストアンサー率31% (2227/7020)
回答No.1

ある食品の酸度や食塩分って測定方法が変更されても同じ成ります 元の食品の酸度をA      食塩分っをB すると誤差や人為的ミスが無いとすれば結果は同じ成らないと可笑しいですね 同じに成らない(誤差があるので近い値ならない)ならば なにか間違ってます 単に従来の分析方法が誤差が大きいだけじゃないですか それと誤差は真値にたいして測定器1台での測定は正規分布に成りませんので注意しましょう

kkke
質問者

お礼

ご回答有り難うございます。 当然ながら本来は対象が同じならどんな方法を使っても 結果は同じになるはずです。 しかし方法や分析機器が変われば、分析を繰り返していくと 傾向として必ず差が出てきます。 製造の工程を管理するのが目的なので そのものに含まれる真の濃度ではなく、 その機器が出す数値が重要なのです。

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • 補正係数と補正率は違う意味なのですか?

    いつもお世話になっております。 普通交付税の算出に使われる段階補正についてお聞きします。 1.補正係数と補正率は今まで同じ意味だと思っていました。補正係数と補正率は違う意味なのですか? 2.下記は、補正係数(教育費の場合)の算出方法ですが、0.32や0.36といった補正率は分かるのですが、+1,156,000、+1,100,000はどこからでていくるのでしょうか?なぜさらに金額がプラスされるのですか? 1.170~140万人 Z=1/P(0.32P+1,156,000) 2.140~110万人 Z=1/P(0.36P+1,100,000) 3.110~ 80万人 Z=1/P(0.18P+1,298,000) 4. 80~ Z=1/P(0.27P+1,226,000)

  • 分析(心理学)で「部分―全体相関係数を求めろ」という課題があるんですが

    分析(心理学)で「部分―全体相関係数を求めろ」という課題があるんですがどうやって求められるんでしょうか? 今心理学の分析をやっているのですが、平均や標準偏差の算出などは分かるのですが「部分―全体相関係数」というものの求め方が分かりません。 分かる方がいらしたら教えていただけると嬉しいです!

  • 統計学 相関係数の算出に関する質問

    統計学 相関係数の算出に関する質問 統計学の勉強中ですが、以下の問題で悩んでます。 「10個のデータの組(Xi,Yi)があり、Xの総和が20、Yの総和が20、X^2の総和が50、Y^2の総和が50、XYの総和が30である。 最小二乗法で回帰直線を求め、その上で相関係数を求めよ。」 最小二乗法で回帰直線の方程式が Y=-X+4 であることは求められましたが、 その次の相関係数の算出でつまづいてます。 どなたか、解法を教えてください。 補足ちなみに、Excelではなく手計算での算出です。 同様の問題を自力で解答できるように、 途中式等の解法の説明も、よろしくお願いします。

  • CVP分析について

    CVP分析におけるスキャッターグラフ法(散布図表法)と最小二乗法(最小自乗法)の違いが分かりません。 よろしくお願いします。

  • blackboxの因子分析

    著名なblackboxというページがありますが、そこで因子分析をすると 因子抽出は主因子法になるのですか。それとも最小二乗法ですか。 オプションでこれらを選べず、出力結果をみてもわからないので 質問させてもらいました。 まだ大学一回で分析のメカニズムもわかっていなくて申し訳 ないのですが、ご教授よろしくおねがいします。

  • ベンチュリ管と管オリフィスの流量係数がばらつく理由を教えてください!

    ベンチュリ管と管オリフィスの流量係数がばらつく理由を詳しく教えてください! ベンチュリ管と管オリフィスの流量係数をデータをもとに9個分算出したんですが、 最小二乗法により求めた流量係数の近似式と9個の流量係数をグラフにして比較すると 全体的にかなりばらつきました。 流量やマノメータの読み取り誤差など以外に ばらつく具体的な理由はなんですか? あと最小二乗法により出した近似式が 平行ではなく右上がりの線になったんですが、 その理由はなんですか? 補足 グラフの縦軸は流量係数で 横軸はレイノルズ数です。

  • エクセルにおける回帰分析について

    統計分析初学者です。よろしくお願いいたします。 お聞きしたいのは、エクセルにおいて 回帰分析した結果の決定係数と散布図作成から近似曲線作成した場合の決定係数に違いがあるケースがあります。これはどう解釈したよいのかという質問です。近似曲線はもちろん線形で近似させています。マイクロソフトのサイトでは散布図からの近似曲線は最小2乗法によるとのことですので、縦軸と横軸を入れ替えても決定係数は変わらないと思っているのですが、このケースの場合変わってしまいます。ご存知の方がいましたら、是非教えていただきたいと思います。 <追記> パワーポイント資料等で説明する際には、 やはり決定係数だけでなく、t値やP値も併記するべきなのでしょうか。 合わせて皆様の見解をお聞かせください。 よろしくお願いいたします。

  • 相関係数式のRの2乗ってなんですか?

    質問が変ですみません。 最小二乗法で求めたと思われる式  Y=0.306×(X)+2.295 p<0.005 R^2=0.946 という式と直線グラフがあります。 この式においてR^2は何を表しているのでしょうか? 相関係数の2乗ですか?(グラフを見る限りそこまで直線上にのっていないのですが・・・ ←相関がある=直線上に乗っているとは、また別な気もしますが、ここらへんもよくわかりません) またそうだとすると、相関係数ではなく2乗を求めている理由も教えてください。

  • アンケート調査の結果分析における偏差値化

    アンケート結果の分析についてご質問させていただきます。 現在、従業員に対してアンケートを行い、その結果の分析を行っています。 アンケート概要としては、5つの部署で回答者が各30人程度、設問数30問程度(5つの設問カテゴリー)、5段階評定(全く当てはまらない、やや当てはまる、どちらでもない、やや当てはまる、当てはまる)で最低1点、最高5点として点数を付けています。 この結果を単純に各部署×各設問カテゴリーの1次集計の平均値だけでなく、偏差値として結果を捉えたいと思います。 この場合、アンケート回答者全体の平均値と標準偏差から、それぞれの各部署×各設問カテゴリーの平均値を測定値とみなして、偏差値を出すことができるのでしょうか? やはり偏差値は個々の回答者の、個々の設問に対してしか算出できないのでしょうか?(例えば、英数国社理のテストそれぞれで偏差値が出るように。) 上記の算出方法が不可の場合、各部署ごとの偏差値を出す方法はどのように行うべきなのでしょうか? よろしくお願いします。

  • クラスタ分析 結果の安定性について

    統計解析の初心者です。 2つの疑問と対処法に困っています。お分かりになる方ぜひ教えて いただければ幸いです。 <使用ソフトと分析方法> ・ソフト:SPSSの ・分析方法:大規模ファイルのクラスタ(非階層クラスタ/K-means法) ・変数:事前に行った因子分析結果の7因子の因子得点 <1> クラスタ数を5に指定し、その他をデフォルトの設定で行ったところ、 「反復の記録」のところで、「反復が最大回数実行されたため、反復を 終了しました」というメッセージが出ていました。 (反復回数「10」、収束基準「0」) この結果を最終結果として用いてはいけないものなのでしょうか? 実は既に一度この結果を提出してしまっているのですが…、 後から気づいて、試しに反復回数を変えて何度かやってみたところ、 あまりに結果(クラスタ別の因子得点平均点)が違うことに驚いて います。 既に結果を提示してしまっているため、できれば、最初に行った結果 でも誤りではない、という根拠が得られればと思っています。 <2> 上記のクラスタ分析の結果について、「安定性を検証して欲しい」 という要望を受けました。 クラスタ分析の「安定性」に該当する数値を出す方法とは、どのような 方法があるのでしょうか? 例えば、因子分析の場合の累積寄与率のように「○○%」という形で わかりやすくバシッと数値で出せるものなのでしょうか? SPSSで出せる方法を知りたいと思っています。 基本的な質問で恐縮ですが、よろしくお願いいたします。