• ベストアンサー

統計のデータ処理について

あるデータについて統計処理をおこなおうと思い、まずは箱ひげ図を作成しました。そこで外れ値と極値が出てきたので、それを外してまた箱ひげ図を作成したのですが、このとき出てきた外れ値や極値は、また除いてよいのでしょうか?外れ値・極値がなくなるまで処理してから、次の段階へ行った方がよいのか程度がわかりません。とても初歩的なことなのですが教えて下さい。

noname#56526
noname#56526

質問者が選んだベストアンサー

  • ベストアンサー
noname#21649
noname#21649
回答No.1

>また除いてよいのでしょうか? だめです。 異常値を除く作業は.1回の方法で除くことができて.かつ.同じ作業を繰り返したときに除く数値がないことが必要です。というのは.正規分布と仮定して.端の数値を異常値と除いた時に全体で分布の状態が変化します。すると.正常な分布を示していた場合には.端から順番にいつまでも除くことが可能な分布を示す場合があるためです。 度数分布をみて.除外したい数値(単数または複数)が発生する確率を計算して.異常値かどうかを判断してください。 単なる1/4点だけを見ていると間違います。

noname#56526
質問者

お礼

とても分かり易い回答です。ありがとうございました。

関連するQ&A

  • 統計外れ値について。

    1.5 倍を外れ値とする箱ひげ図のデータを作り、その箱ひげ図と任意のデータで、最大値、最小値のいずれかの箱ひげ図を作っていただきたいのです。エクセルでも、手書きでも、それは、問わないです。ご教授願いたいです。すみません。

  • 外れ値について。

    箱ひげ図で、外れ値を含むデータを作っていただけないでしょうか?後、箱ひげ図のヒゲの長さは、上限下限1,5くらいとは、どのくらいの誤差でしょうか?目安だとは思うのですが。教えていただけないでしょうか?すみません。

  • この様なデータは統計処理できますか!?

    この様なデータは統計処理できますか!? 統計処理に関して素人です。 次の様なデータでも、統計処理することはできますか? 薬A,B投与時のスコア(N=3) 薬A(0日目)100,99,99 薬A(2日目)80,82,77 薬A(4日目)70,71,69 薬A(6日目)65,65,64 薬B(0日目)100,100,99 薬B(3日目)50,53,51 薬B(7日目)30,28,29 薬B(14日目)20,20,21 薬Aと薬Bの効果に差が有るか無いかを知りたいです。 よろしくお願いします。

  • お願いします

    数1データの分析の分野です。 箱ひげ図で最大値が外れ値かどうか調べる際、四分位範囲×1.5+第三四分位数が最大値より小さかったら最大値は外れ値で最大値より大きかったら最大値は外れ値ではないということでよろしいですか?またこれは最小値でも同じことが言えますか?

  • 箱ひげ図の中央値について

    現在、研究でシミュレーションを行っております。 いくつかデータがあり、統計学には詳しくないのですが データの分散を知るために箱ひげ図を作成しました。 この箱ひげ図を作成する際に中央値も算出したのですが、 「これらのデータから○○といえる」と言う際に用いることができる数字は、 この中央値でいいのでしょうか。それとも平均値でしょうか。

  • 統計データ処理

    質問の場所がわからなかったので場違いであればすみません 統計データ処理に関する簡単なHP知ってる方教えてください  学校の授業で習ってるのですが教科書見てもまったくわかりません よろしくお願いします

  • 統計処理について

    統計処理の選択がわかりません、どうかお教えください。 例えば。 太っているグループと痩せているグループの2グループについてその要因を検討する場合。 二つのグループに対して年齢や御飯を食べている回数、運動の回数など の具体的数字によるデータが検出されるものと、アンケートによる二件法、五件法のデータで出る検出される場合の統計処理方法についてお尋ねします。  この場合には、t検定とX二乗検定で統計処理ができ、有意差の有無が判 定できるものなのでしょうか?   それとも他にもやった方が良い統計処理があったらお教えください?

  • 有意差をだすための統計処理について教えて下さい

    エクセルで統計的に有意差があるかどうかを検定したいのですが、統計について全くの素人でどの統計処理をすればいいのかよくわかりません。 統計処理したいデータは (例 ある病気にかかった患者120人の年齢と患者の病気の重篤度を5段階に分けて調査した グレード1 10人 グレード2 20人 グレード3 40人 グレード4 20人 グレード5 30人 それぞれのグレードと年齢に相関があるのか調べたいのですが、どのような統計処理をすれば有意差があるかどうか調べられるのかわかりません。 ネット上で統計について調べてみたのですが、似たような例を見つけられずよくわかりませんでした。 統計について詳しい方がいたらご教授下さい。 ソフトはエクセルのOffice2007を使っています。 よろしくお願いします。

  • 修論、統計処理に困ってます。

    修論で、アンケート調査(郵送)をしました。貴重な回答も得られたのですが、統計について自分がまったくの素人であることに気づき、慌てて苦しんでいるところです。   そこで、教えてください。 回収できたのが30数通(率としても3割をこえた程度)。 この少ない数で、統計処理をして意味があるのでしょか。 それとも、別の扱い方をする必要があるのでしょうか。 もう1つ。 現在、統計のごく初歩的な本などを見ています。 ど素人が、理解できるいい資料がありましたら教えてください。仕事をしながらの取り組みで時間も頭もなく、難しい処理はキツく、エクセルでできる程度でと考えています。クロス集計より深める必要があるかと思うのですが、どこで何を使えばよいのやら…、と頭を抱えております。 どうかよろしくお願いします。

  • 統計用語の正しい英語訳を教えて下さいm(__)m

    初めて教えて!gooを利用します。統計用語の多い文章を英訳しているのですが、用語の正しい英語訳がわからず途方に暮れています・・・。どなたか正しい英訳をご存知の方、あるいは参考になるサイトをご存知の方、お手数ですが教えて下さい。訳が分からず困ってる単語: ・多変量連関図→multivariate link diagram? ・基本解析と予備解析→? ・外れ値と異常値→? ・箱ひげ図→boxplot? ・対数変換→logarithmic transfortion? ・四則演算→? ・乱数→random digits? ・定数→constant number? ・関数→function (number)? ・演算子→operator? ・代入→substitute? お手数ですがどなたか教えてください。お願いします。