• ベストアンサー

xとyの値を持つ複数のデータから値を大きく逸脱するデータを除外した平均

xとyの値を持つ複数のデータから値を大きく逸脱するデータを除外した平均値を求めたいです。 添付の画像に、イメージ図を記しました。除外したいデータが赤のドットになります。 こういうのは、平均値ではなく中央値になるのですか? で、そのような値をプログラムで求めるには、どうしたら良いですか? 言語はcを使ってますが、手続き型言語で一般的な回答でも結構です。 よろしくお願いいたします。

質問者が選んだベストアンサー

  • ベストアンサー
noname#182251
noname#182251
回答No.2

イメージ図から考えて 1.最小二乗法で最もフィットしそうな直線を求める 2.直線と点の距離を計算する 3.距離の最も大きな点を除外する 4.1.に戻ってループを繰り返す このような方法で如何でしょうか?ループしなくても3.時点で一定距離以上を削除でよいのかもしれません 最小二乗法に関しては、以下などをご参照ください http://szksrv.isc.chubu.ac.jp/lms/lms1.html ついでに云えば、質問内容は数学カテゴリーの方が良い回答が出そうです。またデータの出所(どのような種類のデータなのか)や除外する目的などを記載した方が目的になかった回答を得やすいでしょう。

kingfruits
質問者

お礼

fuuten_no_nekoさん、ご回答ありがとうございました。 >ついでに云えば、質問内容は数学カテゴリーの方が良い回答が出そうです。 ずいぶんと迷ったのですが、プログラムにしやすい回答が欲しかった物で。 >4.1.に戻ってループを繰り返す みたいな。 ご回答は大変参考になりました。どうもありがとうございました。

その他の回答 (1)

  • Tacosan
  • ベストアンサー率23% (3656/15482)
回答No.1

「大きく逸脱する」かどうかをどうやって判定するのでしょうか? その方法を決めないことには「プログラム」は書きようもありませんよ.

kingfruits
質問者

お礼

Tacosanさん、ご意見ありがとうございました。 そうですね。曖昧な質問でしたので、回答のしようがないですよね。 もう少し具体的な質問にして出直します。

関連するQ&A

専門家に質問してみよう