• 締切済み

外れ値について。

箱ひげ図で、外れ値を含むデータを作っていただけないでしょうか?後、箱ひげ図のヒゲの長さは、上限下限1,5くらいとは、どのくらいの誤差でしょうか?目安だとは思うのですが。教えていただけないでしょうか?すみません。

みんなの回答

  • muturajcp
  • ベストアンサー率78% (505/644)
回答No.3

2.741733307←最大値(ひげの上端) 2.089425011 1.91615562 1.783655497 1.671540009 1.579809155 1.498270618 1.426924398 1.365770495 1.304616592 1.24346269 1.192501104 1.141539518 1.10077025 1.049808664 1.009039396 0.968270127 0.927500859 0.88673159 0.856154639 0.81538537 0.784808419 0.74403915 0.713462199 0.682885248←箱の上端 0.652308296 0.621731345 0.591154393 0.560577442 0.530000491 0.499423539 0.468846588 0.438269636 0.417885002 0.387308051 0.356731099 0.336346465 0.305769514 0.275192562 0.254807928 0.224230977 0.203846343 0.173269391 0.152884757 0.122307806 0.101923171 0.07134622 0.050961586 0.020384634 -0.020384634 -0.050961586 -0.07134622 -0.101923171 -0.122307806 -0.152884757 -0.173269391 -0.203846343 -0.224230977 -0.254807928 -0.275192562 -0.305769514 -0.336346465 -0.356731099 -0.387308051 -0.417885002 -0.438269636 -0.468846588 -0.499423539 -0.530000491 -0.560577442 -0.591154393 -0.621731345 -0.652308296 -0.682885248←箱の下端 -0.713462199 -0.74403915 -0.784808419 -0.81538537 -0.856154639 -0.88673159 -0.927500859 -0.968270127 -1.009039396 -1.049808664 -1.10077025 -1.141539518 -1.192501104 -1.24346269 -1.304616592 -1.365770495 -1.426924398 -1.498270618 -1.579809155 -1.671540009 -1.783655497 -1.91615562 -2.089425011 -2.741733307←最小値(ひげの下端) 箱の長さ=0.682885248*2=1.36577 箱の上端+箱の長さ*1.5=0.682885248+1.36577*1.5=2.73154 だから 2.73154を越えるZを外れ値とみなすのだから 標準正規分布表で Z≧2.73上側確率は0.003167≒0.3%だから 正規分布に従っていれば 0.3%の確率でZ≧2.73となる事はあり得る その場合は 外れ値ではない 2.73を越えるZを外れ値とみなすのだから 外れ値ではない値2.74等を 外れ値としてしまう確率は 0.3%なのです

全文を見る
すると、全ての回答が全文表示されます。
  • muturajcp
  • ベストアンサー率78% (505/644)
回答No.2

データを A={0,3,4,5,6,7,8,12} とする A1={0,3} A2={4,5} A3={6,7} A4={8,12} のようにデータを4等分する A2∪A3={4,5,6,7} を箱データとする 箱の下端4が第1四分位数 箱の上端7が第3四分位数 12←最大値(ひげの上端) 8 7←第3四分位数(箱の上端) 6 5 4←第1四分位数(箱の下端) 3 0←最小値(ひげの下端) 箱の長さ=7-4=3 箱の上端+箱の長さ*1.5=7+3*1.5=11.5 を越える値は12だけ 箱の下端+箱の長さ*1.5=4-3*1.5=0.5 を下回る値は0だけ 外れ値を考慮した場合 12←外れ値 8←11.5以下の最大値(ひげの上端) 7←第3四分位数(箱の上端) 6 5 4←第1四分位数(箱の下端) 3←0.5以上の最小値(ひげの下端) 0←外れ値 ------------------------------------- データを B={0,6,7,8,9,10,11,12,13,14,15,21} とすると B1={0,6,7} B2={8,9,10} B3={11,12,13} B4={14,15,21} のようにデータを4等分する B2∪B3={8,9,10,11,12,13} を箱データとする 箱の下端8が第1四分位数 箱の上端13が第3四分位数 21←最大値(ひげの上端) 15 14 13←第3四分位数(箱の上端) 12 11 10 9 8←第1四分位数(箱の下端) 7 6 0←最小値(ひげの下端) 箱の長さ=13-8=5 箱の上端+箱の長さ*1.5=13+5*1.5=20.5 を越える値は21だけ 箱の下端+箱の長さ*1.5=8-5*1.5=0.5 を下回る値は0だけ 外れ値を考慮した場合 21←外れ値 15←20.5以下の最大値(ひげの上端) 14 13←第3四分位数(箱の上端) 12 11 10 9 8←第1四分位数(箱の下端) 7 6←0.5以上の最小値(ひげの下端) 0←外れ値

全文を見る
すると、全ての回答が全文表示されます。
  • muturajcp
  • ベストアンサー率78% (505/644)
回答No.1

データを A={0,3,4,5,6,7,8,12} とすると min(A)=0 max(A)=12 |A|=8 第1四分位は第(|A|/4+1/2)=第(8/4+1/2)=第2.5 第2.5以上の最小値第3の値4を第1四分位数とする 第3四分位は第(3|A|/4+1/2)=第(3*8/4+1/2)=第6.5 第6.5以下の最大値第6の値7を第3四分位数とする 12←最大値(ひげの上端) 8 7←第3四分位数(箱の上端) 6 5 4←第1四分位数(箱の下端) 3 0←最小値(ひげの下端) 箱の長さ=7-4=3 箱の上端+箱の長さ*1.5=7+3*1.5=11.5 を越える値は12だけ 箱の下端+箱の長さ*1.5=4-3*1.5=0.5 を下回る値は0だけ 外れ値を考慮した場合 12←外れ値 8←11.5以下の最大値(ひげの上端) 7←第3四分位数(箱の上端) 6 5 4←第1四分位数(箱の下端) 3←0.5以上の最小値(ひげの下端) 0←外れ値 外れ値を考慮しない立場から 12,0を外れ値にするのは誤りなので 正しい外れ値は存在しないので誤差等ありません ------------------------------------- データを B={0,6,7,8,9,10,11,12,13,14,15,21} とすると min(B)=0 max(B)=21 |A|=12 第1四分位は第|B|/4+1/2=第12/4+1/2=第3.5 第3.5以上の最小値第4の値8を第1四分位数とする 第3四分位は第3|B|/4+1/2=第3*12/4+1/2=第9.5 第9.5以下の最大値第9の値13を第3四分位数とする 21←最大値(ひげの上端) 15 14 13←第3四分位数(箱の上端) 12 11 10 9 8←第1四分位数(箱の下端) 7 6 0←最小値(ひげの下端) 箱の長さ=13-8=5 箱の上端+箱の長さ*1.5=13+5*1.5=20.5 を越える値は21だけ 箱の下端+箱の長さ*1.5=8-5*1.5=0.5 を下回る値は0だけ 外れ値を考慮した場合 21←外れ値 15←20.5以下の最大値(ひげの上端) 14 13←第3四分位数(箱の上端) 12 11 10 9 8←第1四分位数(箱の下端) 7 6←0.5以上の最小値(ひげの下端) 0←外れ値 外れ値を考慮しない立場から 21,0を外れ値にするのは誤りなので 正しい外れ値は存在しないので誤差等ありません

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • 統計外れ値について。

    1.5 倍を外れ値とする箱ひげ図のデータを作り、その箱ひげ図と任意のデータで、最大値、最小値のいずれかの箱ひげ図を作っていただきたいのです。エクセルでも、手書きでも、それは、問わないです。ご教授願いたいです。すみません。

  • 統計のデータ処理について

    あるデータについて統計処理をおこなおうと思い、まずは箱ひげ図を作成しました。そこで外れ値と極値が出てきたので、それを外してまた箱ひげ図を作成したのですが、このとき出てきた外れ値や極値は、また除いてよいのでしょうか?外れ値・極値がなくなるまで処理してから、次の段階へ行った方がよいのか程度がわかりません。とても初歩的なことなのですが教えて下さい。

  • お願いします

    数1データの分析の分野です。 箱ひげ図で最大値が外れ値かどうか調べる際、四分位範囲×1.5+第三四分位数が最大値より小さかったら最大値は外れ値で最大値より大きかったら最大値は外れ値ではないということでよろしいですか?またこれは最小値でも同じことが言えますか?

  • ボックスプロットのひげについて

    品質データの集計でボックスプロットを使うことが多々あります。 ボックスプロットでは”ひげ”があり、ひげの内と外で外れ値の判断をするわけですが、この”ひげ”について質問です。 ひげの長さは25%点から75%点の長さの1.5倍の長さとあります。 なぜ、1.5倍なのでしょうか? 1.5倍だとどういうことが言えるのかというのがボヤッとしています。 ボックス部分とひげ部分に全体の○%が含まれる、○%を超えるものが外れ値といったような考え方はできるのでしょうか? データのバラつきからによって、外れ値になる比率も変わるのでしょうか? 教えてください。

  • 箱ひげ図の中央値について

    現在、研究でシミュレーションを行っております。 いくつかデータがあり、統計学には詳しくないのですが データの分散を知るために箱ひげ図を作成しました。 この箱ひげ図を作成する際に中央値も算出したのですが、 「これらのデータから○○といえる」と言う際に用いることができる数字は、 この中央値でいいのでしょうか。それとも平均値でしょうか。

  • (仮の?)標準偏差の計算方法について

    あるデータで、 上限・下限の範囲のみわかっているータがあります。(n数は不明) 例 下限データ 2.4   上限データ 4.4 この時、平均は(上限+下限)/2     標準偏差(上限ー下限)/4 で良いのでしょうか?(平均はわかるのですが、標準偏差が・・・) 理由もわからず、このように言われたのですが・・・ 説明もわかりずらいと思いますが、補足説明もしますので よろしくお願いします。

  • 箱ひげ図(箱ひげプロット?)を作ろうと思っているのですが、以下の計算で

    箱ひげ図(箱ひげプロット?)を作ろうと思っているのですが、以下の計算であっているか教えていただけないでしょうか。 ・データ 17.0 、20.7 、21.4 、22.1 、22.2 、22.4 、23.5 、23.6 ・中央値 22.2 ・最大値 23.6 ・最小値 17.0 ・第1四分位数 20.7 ・第3四分位数 22.4 ・四分範囲 1.7 ・上側の髭 24.95 ・下側の髭 18.15 ・はずれ値 17.0

  • こんにちは

    中三数学の箱ひげ図を見て説明?する問題が全く解けません。箱ひげ図から見て分かることって何がありますか?(ひげの長さや四分位範囲の大きさなど)

  • Excelの箱ひげ図を使うと表示が遅い

    最近になって、Excelで箱ひげ図というデータのばらつき具合を見やすくするグラフがあることを知りました。 しかし、このグラフを使うと表示が異様に遅くなってしまいます。 そのグラフがあるシートを表示させようとしたとき、そのシート内のセルを変化(データの書き換えなど)させたとき、セルの幅を変えたとき、などなど、グラフと関係ないセルに対してでも1,2分フリーズします。 今のところ必ず復帰する(フリーズのままではない)のですが、ちょっと操作しようとしただけで数分の時間が無駄になってしまいます。 グラフをほかの(散布とか)に変えるとストレスなく表示可能なので、箱ひげ図特有の現象と思われるのですが、箱ひげ図のままで対処できないでしょうか。

  • 箱ひげ図

    海外在住です。現地校6年生の子どもの算数の宿題に箱ひげ図が出て、困っています。 どなたか助けてください!(教科書は学校に置きっぱなしなので手元にありません。) 箱ひげ図の基本的なことは今ネットで調べて、与えられた箱ひげ図を次のように読むことができました。 最小値 2 第1四分位点 20 中央値 21 平均値 21 第3四分位点 25 最大値 30 問題は、この箱ひげ図が表す15の数値を書けというものなのです。お手上げです・・・・ ついでに、私は日本で義務教育を終えましたが、学校で箱ひげ図を習った記憶がありません。 日本ではいつ習うものですか?小学6年にこんなもの必要なの?って思ってしまいます。 よろしくお願いします。