• 締切済み

外れ値について。

箱ひげ図で、外れ値を含むデータを作っていただけないでしょうか?後、箱ひげ図のヒゲの長さは、上限下限1,5くらいとは、どのくらいの誤差でしょうか?目安だとは思うのですが。教えていただけないでしょうか?すみません。

みんなの回答

  • muturajcp
  • ベストアンサー率78% (508/650)
回答No.3

2.741733307←最大値(ひげの上端) 2.089425011 1.91615562 1.783655497 1.671540009 1.579809155 1.498270618 1.426924398 1.365770495 1.304616592 1.24346269 1.192501104 1.141539518 1.10077025 1.049808664 1.009039396 0.968270127 0.927500859 0.88673159 0.856154639 0.81538537 0.784808419 0.74403915 0.713462199 0.682885248←箱の上端 0.652308296 0.621731345 0.591154393 0.560577442 0.530000491 0.499423539 0.468846588 0.438269636 0.417885002 0.387308051 0.356731099 0.336346465 0.305769514 0.275192562 0.254807928 0.224230977 0.203846343 0.173269391 0.152884757 0.122307806 0.101923171 0.07134622 0.050961586 0.020384634 -0.020384634 -0.050961586 -0.07134622 -0.101923171 -0.122307806 -0.152884757 -0.173269391 -0.203846343 -0.224230977 -0.254807928 -0.275192562 -0.305769514 -0.336346465 -0.356731099 -0.387308051 -0.417885002 -0.438269636 -0.468846588 -0.499423539 -0.530000491 -0.560577442 -0.591154393 -0.621731345 -0.652308296 -0.682885248←箱の下端 -0.713462199 -0.74403915 -0.784808419 -0.81538537 -0.856154639 -0.88673159 -0.927500859 -0.968270127 -1.009039396 -1.049808664 -1.10077025 -1.141539518 -1.192501104 -1.24346269 -1.304616592 -1.365770495 -1.426924398 -1.498270618 -1.579809155 -1.671540009 -1.783655497 -1.91615562 -2.089425011 -2.741733307←最小値(ひげの下端) 箱の長さ=0.682885248*2=1.36577 箱の上端+箱の長さ*1.5=0.682885248+1.36577*1.5=2.73154 だから 2.73154を越えるZを外れ値とみなすのだから 標準正規分布表で Z≧2.73上側確率は0.003167≒0.3%だから 正規分布に従っていれば 0.3%の確率でZ≧2.73となる事はあり得る その場合は 外れ値ではない 2.73を越えるZを外れ値とみなすのだから 外れ値ではない値2.74等を 外れ値としてしまう確率は 0.3%なのです

  • muturajcp
  • ベストアンサー率78% (508/650)
回答No.2

データを A={0,3,4,5,6,7,8,12} とする A1={0,3} A2={4,5} A3={6,7} A4={8,12} のようにデータを4等分する A2∪A3={4,5,6,7} を箱データとする 箱の下端4が第1四分位数 箱の上端7が第3四分位数 12←最大値(ひげの上端) 8 7←第3四分位数(箱の上端) 6 5 4←第1四分位数(箱の下端) 3 0←最小値(ひげの下端) 箱の長さ=7-4=3 箱の上端+箱の長さ*1.5=7+3*1.5=11.5 を越える値は12だけ 箱の下端+箱の長さ*1.5=4-3*1.5=0.5 を下回る値は0だけ 外れ値を考慮した場合 12←外れ値 8←11.5以下の最大値(ひげの上端) 7←第3四分位数(箱の上端) 6 5 4←第1四分位数(箱の下端) 3←0.5以上の最小値(ひげの下端) 0←外れ値 ------------------------------------- データを B={0,6,7,8,9,10,11,12,13,14,15,21} とすると B1={0,6,7} B2={8,9,10} B3={11,12,13} B4={14,15,21} のようにデータを4等分する B2∪B3={8,9,10,11,12,13} を箱データとする 箱の下端8が第1四分位数 箱の上端13が第3四分位数 21←最大値(ひげの上端) 15 14 13←第3四分位数(箱の上端) 12 11 10 9 8←第1四分位数(箱の下端) 7 6 0←最小値(ひげの下端) 箱の長さ=13-8=5 箱の上端+箱の長さ*1.5=13+5*1.5=20.5 を越える値は21だけ 箱の下端+箱の長さ*1.5=8-5*1.5=0.5 を下回る値は0だけ 外れ値を考慮した場合 21←外れ値 15←20.5以下の最大値(ひげの上端) 14 13←第3四分位数(箱の上端) 12 11 10 9 8←第1四分位数(箱の下端) 7 6←0.5以上の最小値(ひげの下端) 0←外れ値

  • muturajcp
  • ベストアンサー率78% (508/650)
回答No.1

データを A={0,3,4,5,6,7,8,12} とすると min(A)=0 max(A)=12 |A|=8 第1四分位は第(|A|/4+1/2)=第(8/4+1/2)=第2.5 第2.5以上の最小値第3の値4を第1四分位数とする 第3四分位は第(3|A|/4+1/2)=第(3*8/4+1/2)=第6.5 第6.5以下の最大値第6の値7を第3四分位数とする 12←最大値(ひげの上端) 8 7←第3四分位数(箱の上端) 6 5 4←第1四分位数(箱の下端) 3 0←最小値(ひげの下端) 箱の長さ=7-4=3 箱の上端+箱の長さ*1.5=7+3*1.5=11.5 を越える値は12だけ 箱の下端+箱の長さ*1.5=4-3*1.5=0.5 を下回る値は0だけ 外れ値を考慮した場合 12←外れ値 8←11.5以下の最大値(ひげの上端) 7←第3四分位数(箱の上端) 6 5 4←第1四分位数(箱の下端) 3←0.5以上の最小値(ひげの下端) 0←外れ値 外れ値を考慮しない立場から 12,0を外れ値にするのは誤りなので 正しい外れ値は存在しないので誤差等ありません ------------------------------------- データを B={0,6,7,8,9,10,11,12,13,14,15,21} とすると min(B)=0 max(B)=21 |A|=12 第1四分位は第|B|/4+1/2=第12/4+1/2=第3.5 第3.5以上の最小値第4の値8を第1四分位数とする 第3四分位は第3|B|/4+1/2=第3*12/4+1/2=第9.5 第9.5以下の最大値第9の値13を第3四分位数とする 21←最大値(ひげの上端) 15 14 13←第3四分位数(箱の上端) 12 11 10 9 8←第1四分位数(箱の下端) 7 6 0←最小値(ひげの下端) 箱の長さ=13-8=5 箱の上端+箱の長さ*1.5=13+5*1.5=20.5 を越える値は21だけ 箱の下端+箱の長さ*1.5=8-5*1.5=0.5 を下回る値は0だけ 外れ値を考慮した場合 21←外れ値 15←20.5以下の最大値(ひげの上端) 14 13←第3四分位数(箱の上端) 12 11 10 9 8←第1四分位数(箱の下端) 7 6←0.5以上の最小値(ひげの下端) 0←外れ値 外れ値を考慮しない立場から 21,0を外れ値にするのは誤りなので 正しい外れ値は存在しないので誤差等ありません