• ベストアンサー

統計でよく見かける「差の自乗和」についてです。

統計でよく見かける「差の自乗和」についてです。 「単純に差のみだとプラスになったりマイナスになったりで和を算出するのに都合が悪いから、自乗してすべてプラスにする」と言う説明をよく見ますが、説明の後半部分、なぜ絶対値ではなく 4乗でもなく2乗であるのが妥当なのでしょうか? 和の算出目的であれば絶対値が素直だと思いますので別の意図かと思います。 差の大きな標本の混在に対して指数的に大きな影響を出したい意図であれば、4乗、6乗の方がベターだけど慣例的に2乗にしましょうという事でしょうか?

質問者が選んだベストアンサー

  • ベストアンサー
noname#212313
noname#212313
回答No.2

 平均値からの2乗差か、単純な差の絶対値かについては、歴史的にはラプラスが最小1乗法(仰る、平均値と標本値の差の絶対値を用いる方法)を2乗法に先んじて発表しています。続いてガウスが惑星軌道計算に最小2乗法を使い、その後で理論化して最小2乗法を発表しています。お考えの方法は、大数学者も考えていたわけですね。 (最小2乗法の発表はルシャンドルが先、ガウスはラプラスの発表より前に理論化に成功していた、等々、この辺りの事情はいろいろ複雑そう。)  仰る通り、絶対値のほうが扱う量についてはシンプルです。単に符号をプラスにすればよく、2乗するほうが手間です。ラプラスもガウスも、コンピュータが登場するより、ずっと前に活躍したわけですから、全て手計算です。マイナス符号だけを落とす方が2乗計算よりはるかに手間が少なくて済みます。統計は膨大なデータを扱うことが多いですから、1乗法にはっきりとメリットがありました。  しかし最小1乗法では、1乗差の絶対値を求めた後は、最小2乗法より数式的な処理がが複雑になるようです。基本的な統計量を求めるところまでは簡単でも、その後が面倒になるなら、メリットも目減りします。そのため、最小2乗法に比べて学問体系的な発展が遅れてしまい、ついには統計学では最小2乗法が主流となったようです。 「ようです」と歯切れの悪い言い方になってしまっていますが、最小1乗法が全く捨てられたわけではないからです。最小2乗法を基にする統計量では推定できない、あるいは誤差が大きいものでも、最小1乗法なら良い推定が可能かもしれず、研究が途絶えたわけではありません。 P.S.  3乗以上については、なんとも言えません。1乗法以上に未知な領域です。

koiroha
質問者

お礼

歴史的背景も含めた丁寧な解説ありがとうございました。 物理出身なものでして「勝手に自乗したら次元変わっちゃうじゃん!」という違和感をずっと抱えておりましたがようやく解消しました。

その他の回答 (1)

  • trytobe
  • ベストアンサー率36% (3457/9591)
回答No.1

一番、計算しやすくて、計算式や検定のモデルも複雑にならないのが、誤差は2乗することで全部正の値にしてしまう、という方法なのです。 絶対値にすると、正と負の場合分けが面倒になり、4乗でもべつにいいのですが式が複雑になって解が求めにくくなる(次数が高すぎて)ということもあるので、2乗のモデルが便利に統計学で用いられるのだと認識しています。

関連するQ&A

専門家に質問してみよう