• 締切済み

ボックスプロットのひげについて

品質データの集計でボックスプロットを使うことが多々あります。 ボックスプロットでは”ひげ”があり、ひげの内と外で外れ値の判断をするわけですが、この”ひげ”について質問です。 ひげの長さは25%点から75%点の長さの1.5倍の長さとあります。 なぜ、1.5倍なのでしょうか? 1.5倍だとどういうことが言えるのかというのがボヤッとしています。 ボックス部分とひげ部分に全体の○%が含まれる、○%を超えるものが外れ値といったような考え方はできるのでしょうか? データのバラつきからによって、外れ値になる比率も変わるのでしょうか? 教えてください。

みんなの回答

noname#227064
noname#227064
回答No.1

標準正規分布の四分位範囲は1.349でその1.5倍は2.023です。 2.023は標準正規分布の97.85%点にあたります。 したがって、ひげの範囲内にはデータの95.7%が入ることが期待されます。

sexymira
質問者

お礼

明快なご回答ありがとうございました。 今まで、つっかえていたモノがすっきりしました。

関連するQ&A

  • MATLABで外れ値をプロットする方法を教えてくだ

     MATLABで外れ値をプロットする方法を教えてください。  具体的には下記のとおりです。  MATLABで、中央値+中央値から±20%離れた時系列データをプロットするにはどうすればよいでしょうか? 冗長なprogramしか作成できないため、よい関数か、方法があれば教えていただきたく思い、 質問しました。 まず、時系列データですが、数十万点数からなる信号になっています。 この信号の中央値をだし、その中央値から±20%の範囲でひっかかるデータをplotしたく思っています。 中央値算出は、関数を知っていますので処理が早いのですが中央値から±20%の範囲でひっかかるデータをプロットするのにいまは、以下のような考えで行っています。 行データ、size(x(:)) ans=:1000000 1とおきます。 まず、 1)中央値を求める。 2)median+20%、median-20%を求める。 3) hold on;  for i=1:1:data-length   if(x(i)<=median-20% & x(i)>=median+20%) plot x(i) endif  end というようにしています。しかし、これではデータ一点一点検討する必要があるので冗長で、処理に時間が かかります。 そのため、for文を使わずに、 medi-20(:)=function(x(:),median-20) medi+20(:)=function(x(:),median+20) で計算できるような、関数functionを教えていただけると幸いです。 よろしくお願いします。

  • 統計外れ値について。

    1.5 倍を外れ値とする箱ひげ図のデータを作り、その箱ひげ図と任意のデータで、最大値、最小値のいずれかの箱ひげ図を作っていただきたいのです。エクセルでも、手書きでも、それは、問わないです。ご教授願いたいです。すみません。

  • Excelでプロットの線がつながらない

    Excelの表で縦軸を値、横軸を日数としたときに データが一カ所抜けているところがあって、 空白のまま表を作ろうとすると、その空白の部分で プロットの点を結ぶ線がそこで切れてしまいます。 抜けているところを飛ばしてその前と後のプロットを 線で結ぶにはどうやったら良いのでしょうか。

  • 統計学 箱ひげ図についての質問です。

    ある身長の統計の結果から箱ひげ図を書きたいのですが、箱の上下のひげをどこまで伸ばしたらいいのかわからないので教えてください。また、この場合、外境界線は書き入れるのかどうか教えてください。 上部ヒンジ(75パーセント点)162.4cm、 中央値(50パーセント点)156.95cm、 下部ヒンジ(25パーセント点)152.8cm、 内境界点=138.4cm、176.8cm。 外境界点=124.0cm、191,2cm。 データ上、一番低い身長は145.6cm。一番高い身長は173.5cm。 よろしくお願いします。

  • jqplotによる変動グラフについて

    jqplotによる変動グラフを作成したいと思い、試行錯誤をしているのですが、うまくいかないので、教えていただけましたらとても嬉しく思います。 よろしくお願いします。 セレクトボックスの値を変更するたびに、その値に基づいたグラフを作成したいです。 セレクトボックスの値をJqueryからCGIに渡し、その値に基づき、WEB上のDBから値を持ってきて、グラフプロット用のデータに加工して、Jqueryに戻し、その値をグラフのプロットデータとして、組み込みます。 CGIからの結果をそのまま変数としてグラフのプロットデータ部分に入れてもグラフが表示されません。 CGIから戻ってくるプロットデータをコピーして生のデータとして、そのままグラフのプロットデータ部分に入れるとグラフが表示されます。 そのため、グラフのプロットデータとしてはコードは合っていると思うのですが、JSファイル上ではCGIからの変数ではなく、生データから直接入力しないとグラフデータとして反映されないのでしょうか。 CGIからの変数データをそのままプロットデータとして組み込むことができたらたいへん助かるのですが、ご存じの方がいらっしゃいましたら教えて下さい。 ご不明な点はお聞きください。 よろしくお願いします。

    • ベストアンサー
    • AJAX
  • 食玩をBOX購入して全種が揃う確率は?

    楽天で食玩のBOXを購入したいと思っているのですが…。 ランダム封入で、中には何が入っているのか解らない食玩です。 BOX購入をするのは初めてなのですが、お店の説明書きには『種類数は、生産商品全体での総種類数となります。販売商品には、そのうちメーカー規定の比率に従い封入されますので、商品によって全種揃えるために必要な購入数は異なります』とあります。 全6種で1BOX8個入りのものを買ったとしても、1BOXでは全種揃えられない確率は高いのでしょうか? 1BOXで全種揃えられるのかどうか不安です。 8個入りの内、5個も6個も同じものが入っていると言う可能性もあるのでしょうか? 詳しい方、BOX購入した場合に全部揃えられる確率はどれくらいなのか教えて下さい。 どうぞ宜しくお願い致します。

  • 日の丸の比率

    カテゴリ違いだったらすいません。 日本の国旗、日の丸。 あれの赤い丸の部分と背景の白い部分の比率って 決まっているのでしょうか。 全体的に統一はとれている気はしますが 公式に決まっているとしたら何なのか。 お分かりな方、教えてください。

  • ラリマーの品質について

    ラリマーの品質について教えてください 全体が淡い水色で部分的にじわっと少し濃い水色が入ったようなラリマーと 全体が濃いめの水色で波模様が見え、二箇所に茶色い不純物の点が入ったラリマーだと、どちらが品質が良いものとされるのでしょうか よろしくお願いいたします

  • 良い方法無いでしょうか?

    エクセル2000でグラフの作成をしています。 機器のデータ処理をしています。 縦軸に回転角度、横軸に電流値をとってあります。 これから、任意の場所のプロット点にそれぞれの数値を記入しています。例 (12.5%、12.3ma) 今はテキストボックスで作成していますが、飽きちゃいます。 良い方法はありませんか? プロットは10箇所あります。 98se

  • Excel2007 グラフ

    A1:F54にグラフに必要なデータを入力し、A18:H44にグラフを貼り付けて印刷しました。 するとグラフのプロットエリアやグラフタイトルの部分に、先ほどA1:F54に入力したデータの一部が写ってしまいます。 それも文字全体が写るのではなく、上の部分が少しだけ写ります。 見栄えが悪いので、下のデータがグラフに写らないようにできませんでしょうか。