• 締切済み

統計学 メディアンの定義

品質管理の仕事で毎日数個のデータをメディアン(中央値)で毎日継続して記録、管理しています。 メディアンの定義として確認したところ値(あたい)が奇数個の場合は順序の中央値、偶数個の場合は順序の中央2個のデータの平均値となっていますが、 現在記録している毎日のデータ数が2個以下になってしまう場合があります。 データが2個の場合は平均値と同様の値、1個の場合はそのままの値となってしまうのですが、それをメディアン値 として管理して良いのでしょうか? メディアン値としてはデータ2個以下は成立しないのでしょうか?

みんなの回答

  • Willyt
  • ベストアンサー率25% (2858/11131)
回答No.2

>メディアン値としてはデータ2個以下は成立しないのでしょうか? ダメですね。統計値が意味を持つのはかなり多くのデータが必要です。1日に1個、2個しかデータがないときには1週間分をまとめるとか、データが集まる期間を選ぶべきです。計算できるからと平均値や標準偏差をとっても数が少ないほどその意味がなくなって来ます。  最低でも6個くらいは必要と教わったことがありますが、その根拠は忘れました(^_^;)

  • ppg-2
  • ベストアンサー率39% (77/193)
回答No.1

>データが2個の場合は平均値と同様の値、1個の場合はそのままの値となってしまうのですが、それをメディアン値 として管理して良いのでしょうか? それでいいと思います。 >メディアン値としてはデータ2個以下は成立しないのでしょうか? 厳密な定義ではないので2個以下は算術平均と同じになると捉えていいと思います。 そもそも代表値をもとめるための考え方ですから母集団の数が1つならそれが代表値になるでしょう。 また偶数個であっても母集団の数が大きければ1つでも構わないという考え方もありますから。 また、モードも同様だと思います

関連するQ&A

  • 条件付きのMEDIANとAVERAGEについて。

    条件付きのMEDIANとAVERAGEについて、教えてください。 シート2のN列が"成約"だった場合に、シート2のK列の金額の中央値と平均の値を出したいのですが、うまく出せません。 =MEDIAN(IF(シート2!N1:N1000,"成約"),シート2!K1:K1000) では駄目でしょうか?

  • 統計学の問題です

    教えて下さい。 以下の確率分布において、なぜ確率変数XのMedian(中央値)が2になるのでしょうか?  Xがとる値   1    2    5    9  その確率   0.1   0.6   0.2   0.1

  • 統計学の問題について

    テストで実際に書いた答案なのですが、非常に低い評価が付けられていて 大変困惑しています。学部生の入門科目です。 問題1データの中心の尺度の概要を書け 回答 標本の性質を代表する数値的尺度を統計量という。 中心の尺度には平均、メジアン、モードがある。 平均はデータの値の合計をデータの数で割ったものであり、 メジアンとはデータを大きさ順に並べたとき、真ん中に来る値のことである。 データの数が偶数のときは、真ん中に2つあるので、真ん中2つの 算術平均をとってそれが中央値になる。 まだ、モードは標本のなかでもっともたくさん登場する数値である。 <ここは完全に間違えました> 図に表した時に右の裾が長い場合は 平均<メジアン<モードの大小関係になり 左の裾が長い場合は モード<メジアン<平均という関係になる。 問2 ローレンツ曲線とジニ係数の概要を書け ローレンツ曲線とは所得・人口・販売高などの 一定グループへの集中度合いを観察できる曲線のことである。 ローレンツ曲線は45度線に近いほど所得分配は平等であり、逆に45度線から 離れるほど所得分配は不平等である。 また、ローレンツ曲線は不平等度や集中の度合いを捉えるのに有用な手段であるが、 それを実用化した指標がジニ係数である。ジニ係数の定義は ジニ係数=2×(完全平等線とローレンツ曲線に囲まれた面積)である。 ローレンツ曲線が完全平等線に近いほどジニ係数は0に近くなり 逆に完全平等線から離れるほど1に近くなる。 よってジニ係数は0に近いほど平等で、1に近いほど不平等である。 このレベルで100点中何点ぐらいものになるのでしょうか? 問はそのままで制約(数式を書けとかグラフを入れろ等)はありません。 学部の入門科目です。

  • 統計学について

    n個のデータに対して以下のパラメータを求めよ。 1、平均値 2、分散 3、標準偏差 と、問題を出されたんですが、よくわからないので教えてください。

  • 中央値の大小関係について

    中央値の大小関係について n個のデータがあるとき、データの中央値 m を以下のように定義します。 中央値= 小さい方から (n+1)/2 個目のデータ 〔nは奇数〕   小さい方から n/2 個目のデータと n/2+1 個目のデータの平均 〔nは偶数〕 次にn個のデータを n1個とn2個のデータに分割(n1+n2=n)し、 n1個のデータの中央値を m1 n2個のデータの中央値を m2 とします。 このとき、  m1<m かつ m2<m となることは有り得るのでしょうか? 某プログラム言語を使ってデータ分析をしていたところ上記のような結果が発生しました。 直感的にはないと思うのですが。プログラムミスでしょうか?よろしくお願いします。

  • 統計予測による平均値と中央値

     最近 統計予測の勉強を始めました。元データに極端な異端値を含む場合 一般的に平均値よりもメジアンを用いるほうが予測の精度があがると いうのはその通りだと思いますが、最近おもしろいことに気がつきました。 元データの約3%分 異端値を除いて平均値を用いるとメジアンを用いる 場合よりも有効なんです。これにはもしかしてかっこたる理論があるのでしょうか? それと面白くなってきたので本気で統計予測の勉強をしたいのですが この程度のレベルの私にふさわしいお勧めの書物とかあればご推薦ください。 よろしくお願いします。

  • 数学 データ 中央値の求め方

    未知数aを含むデータでの中央値の求め方についてです。 aを含め偶数個あるデータの中央値の求め方は問題集で理解しました。 ですがaを含め奇数個あるデータの中央値の求め方の問題がなくてわかりません。 偶数個の方の私の求め方です↓ A,B,C,D,E,F,G と未知数a (1)a抜きのデータで中央値となる値(D)の前の値(C)≦aのとき D+a/2 (2)a抜きのデータで中央値となる値(D)の後ろの値(E)≧aのとき E+a/2 (3)C+1≦a≦E-1のとき 2+{(E-1)-(C+1)+1}=[答え] なんというか自分的に勝手に求め方を作った感じでわかりにくくてすみません。 奇数個のとき必ずしもこういう風で求めたいとかではありません。 よろしくお願いします。

  • 統計?

    知人から質問され、わからないので教えてください。 知人は、製品の品質管理の部署にいるのですが、データの入力をしており、基準となる値が350.0±0.5なのだそうです。2つのデータの比較をして、どちらがだめかを判定するそうなのですが、350.014と350.023では、350.023になり、350.060と350.078では、350.060がだめ、とのこと。このデータは、誤差を示すものなのでしょうか。単なる誤差であれば、後者は、350.078がだめってことになりそうなのですが・・・。 基本的なことなのかも知れませんが、わからないので教えてください。

  • 統計解析に関する質問です。

    2群間の値の分布を比較している場合に、「平均値±標準偏差」で表している場合と、「median[interquartile range(IQR)]」で表されている場合がありますが、それぞれでp値の出し方に違いはあるのでしょうか?正規分布に従っていなければMann-WhitneyのU検定だと思うのですが、どちらで表されていても同じ解析方法ではないのでしょうか?

  • 平均値と中央値の関係

    平均値は異常値に引っ張られ、データが大きくなったりすると聞きました。 中央値はそのような影響を受けないとも聞きました。 平均年収などは、一部の高給な人が平均年収を吊り上げているので より現実に近いのは中央値だとも聞きました。 中央値<平均値 となるケースはあると思いますが、 平均値<中央値 となることもあるのでしょうか? 無効な数字がある場合は、除外してエクセルのaverageやMedianは 異常値をはじいて出してくれるのでしょうか? (1,2,3,4 という数字の中に あ、か、さ、のようなひらがながある場合) 教えて頂ければと思います。