• 締切済み

離散データのときの四分位数の定義についてです。

離散データのときの四分位数の定義についてです。 例えば第1四分位数(Q1とします)を例にとると、本によっては、 「下から25%のところにQ1をとる」と書いてある本もあれば 「~Q1、Q1~中央値(M)、M~第3四分位数(Q3)、Q3~に同じだけデータがあるようにQ1をとる」 と書いてある本もあります。 下の定義はQ1、M、Q3を「含んで」分けるかどうかで議論が分かれる、ということは分かりますが、 そこを置いておいて、純粋に上の2つの定義だけで比較すると、本質的な違いはあるのでしょうか? 例えば、何かが変わってくるとか。。。お願いします。

みんなの回答

  • takurinta
  • ベストアンサー率71% (64/90)
回答No.1

参照URLを見ていただければ、分位点の定義が何通りかあることが分かると思います。計算方式によって分位点の数値が変わりますので、数値が違うと言うのが本質的であるというのなら、本質的な違いはあることになります。例えばエクセルとSASのデフォルトでは計算方式が違うので、四分位点が一致しないことがあります。

参考URL:
http://support.sas.com/documentation/cdl/en/procstat/63104/HTML/default/procstat_univariate_sect028.htm
Shauetsu
質問者

補足

私のいう定義とは「計算方法」ではなく「四分位数とはなんぞや」という意味なんです。 「数値が違う」というのが私が聞きたい「本質的」ではなく、質問に載せた2つの定義の「意味が違ってくるのか」ということです。よろしければお願いします。

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • ヒストグラムから求める第一四分位数と中央値について

    ヒストグラムから求める第一四分位数と中央値がわかりません。 講義で配られたものの解答の仕方が独特なので理解ができないです。 以下が問題です。 X:11、14、17、20、23、26、29、32、35、38、41、44、47、50、53 F: 2、、1、、2、1、、6、、7、、11、12、12、17、19、、9、、0、0、、1 (数字見づらくて申し訳ございません。左から順に対応しています) X:週辺りの労働時間 F:人数 です。 私は、階級の幅を5に設定してヒストグラムを作りました。 しかし、四分位数は全体の面積が1/4になる点なので25と26番目のデータの平均が 四分位点だと思ったのですが... 答え方が27.5+1.63=29.1という解答でした。 また、中央値は33.5+2=35.5という解答でした。 27.5という値と33.5という値は対象となる階級内の平均なのでは? と考えたのですが...間違ってますか? また、あたっていた場合1.63や2という値はどこから算出できるのでしょうか? 回答よろしくお願いします。

  • 「運」の定義

    こんにちは。 ちょっと質問したいことがあります。 「運」とは何か? 最近ネット上でなぜかよく「人生の9割は(10割と言う方も)運である」というものを見ます しかしながら、これらの議論はそもそもの「運」の定義をはっきりしないと答えには辿り着けません。 そこで調べても出てこない「運の定義」を教えてもらいたいのです 私が思うところの定義を述べますと次のうちの2つです ・因果関係の解析が困難、又は不可能なものにおいて、その解析を放棄した際に使われる逃げの表現 ・自分の予期せぬことより干渉してくる予測不可能なモノ 上のは起こった事、つまり過去に対して使われる表現で、下はこれから起こる未来への使い方。 どちらが正しいのかどちらも違うのか、はたまたどちらもあっているのか… 教えていただけないでしょうか? 参考までに「運」の使い方参考例(使っている側の認識違いも大いに考えられますが、あくまで参考程度に) ・宝くじで1等あたったよー。いやー運が良かった!! ・私は敵本陣に突っ込む!!どうなるかは天に運をゆだねよう!!! ・まさか君とあいつが知り合いだったとは。いやぁ運が良かった 等々。。。。。

  • NCデータでの座標定義について

    NCプログラムの初心者です。NCプログラムに詳しい方どうか教えてください。 下の方にNCデータのソースの一例を記入しております。 その中で、パートAを行1~5、パートBを行6~25と定義します。 ●パートAは、加工原点からみて機械原点の距離は(+100,+100)。加工原点を(0,0)と定義したい。 ●パートBは、加工原点を(?X,?Y)と定義したい。 (パートAとは相対的に(+?X,+?Y)ずらした位置で加工したい。) 上記のようにしたいのですが、パートBの冒頭でG91G00?X?Yとしても、その後、G90の絶対座標系で動いているので、 だめかな、と思います。それともG92で定義し直すのでしょうか。。 パートB部分全体をパートA部分で定義した加工原点からある値をずらした加工原点で加工するには、 ひとつのNCデータ内でどのように定義すればよろしいのでしょうか? #ちなみに座標定義は下記です。 ・水平方向:右→左をプラスX方向 ・垂直方向:下→上をプラスY方向 1 O1000 :メインプログラムO1000 2 G92X100.Y100.Z0. 3 G90G00Z10. 4 M98P4003 :サブプロO4003呼び出し 5 G90G00Z0. 6 G54G90 :ワーク座標系G54(現在オフセット値は0,0) 7 G17G40G00X140.Y42.S18M13 8 M11 9 G01Z-40.F6000 10 G64G43H27Z-63.F2000 11 G41D25X130. 12 X50.F3000 13 G42X80. 14 Y70. 15 G41Y42. 16 X-993. 17 Y22. 18 X-1360.F3000 19 G40X-1325.Y-10.F6000 20 M98P5555 :サブプロO5555呼び出し 21 G91G01G49Z63.F5000M92 22 M95 23 G91G28X0Y0M07 24 M31 25 M30 お手数ですが宜しくお願い申し上げます。

  • エクセルのデータの抽出

    質問させていただきます。 添付のファイルのようにA列に値が入っています。 例えば、C2に5を入力したら、A列上から5個のデータ(例では10~50)を取り出すようにして、C5に四分位数(引数1)を出力するようにしたいのですが、お力をおかし下さい。 よろしくお願い致します。

  • ステレオタイプの出てくる議論の定義の仕方について

    あくまで例にすぎませんが、 たとえば私が「なぜ日本人は(外国人と比べて)議論をするのが苦手なのか」について議論したいとします。 もちろん、議論が得意な日本人がたくさんいるのは知っていますが、 自分の経験や文化的背景を調べたことにより、日本人全体(ステレオタイプの日本人)として議論が苦手であると、ある程度確信を持てていると仮定します。(統計的根拠はないものとします) しかし、このままでは議論を進めることができないような気がします。 なぜなら、議論が得意な日本人がいるために、 例えを変えれば、妻を殴っていない夫に「なぜ妻を殴ってしまったのですか?」と聞いているのと同じような気がしてならないからです。 このような事態を避けるために、日本人を「典型的な日本人」と定義したい場合、どうすればいいのでしょうか。「典型的」だとあいまいな気がしますし、「議論が苦手な日本人」ではなんか本質をとらえられていないような気がしてしまいます。 …これを書いているうちに思ったのですが、「日本人は議論が得意だ」と主張する人が現れたら議論が破綻してしまいますね(笑)。先ほどの夫妻のように。 これを解決するにはまず「日本人が議論が苦手であるか」を議論する必要がありますが、個人レベルでは不可能な気がします。(統計的根拠がないため。)そして私の知りたい「なぜ~」を深められないような気がします。 そもそも結論ありきで議論をするのが間違っていますね。 しかしこれらを回避するにはどうしたらいいのでしょうか? 「日本人が議論が苦手であるとするならば、それはなぜだろうか?」 「日本人が議論が苦手であるステレオタイプはどこから来るのだろうか?」 などなどいろいろ回避を試みようと思ったのですが、どうも納得できません。 どうか、皆さんの知恵をお貸しください。

  • 箱ひげ図(箱ひげプロット?)を作ろうと思っているのですが、以下の計算で

    箱ひげ図(箱ひげプロット?)を作ろうと思っているのですが、以下の計算であっているか教えていただけないでしょうか。 ・データ 17.0 、20.7 、21.4 、22.1 、22.2 、22.4 、23.5 、23.6 ・中央値 22.2 ・最大値 23.6 ・最小値 17.0 ・第1四分位数 20.7 ・第3四分位数 22.4 ・四分範囲 1.7 ・上側の髭 24.95 ・下側の髭 18.15 ・はずれ値 17.0

  • カイ2乗

    カイ2乗が理解できません。 なんとなくしか判らず、噛み砕けてません。 離散値のDataを比較するのですよね・・・ すいません、簡単な具体例を含め教えて頂ければ 嬉しいです

  • 人間の意識の定義ってもうされているのですか?

    人間の意識の定義ってもうされているのですか? 脳神経科学者の渡辺 正峰が脳の意識 機械の意識という本を出して、人間の脳の意識と機械の意識の違いを解説してますが、そもそも人間の脳の意識の意識についての定義もされてないはずなのにどうやって比較するのですか? もう人間の脳の意識についての定義が出来ているのでしょうか?

  • 得られたデータの比較

    職場内での勉強会用(聴力検査)に、検査データの比較検討をしています。 いくつかデータも集まり、比較したいと思っていますが、どのような比較方法がベストなのかよくわかりません。 データはこのような感じ(例です)       0    5    10 ←この列は変化したdB 250   4    2    0 500   1    4    1 1000  3    2    1 ↑この列は検査周波数(Hz) 4とか1とか0は人数 周波数をX軸、人数をY軸にとりエクセルでグラフを作成しました。 結果を比較検討したい(どこで一番変化が大きかったとか)のですが、平均値を取ればいいのか、中央値を取ればいいのか、標準偏差なのか。それとももっと別の何かなのか・・・。とどんな比較方法で検討したらいいのかわかりません。 統計学は大学のときに一応習いました。が、今は自信ありません。 手元には医学統計学だったかそんな本があります。 わかりにくい書き方なら補足します。 ご教授おねがいします。

  • javaにおけるクラスの定義

    クラスとは「データ(属性)とその操作手順であるメソッドをまとめたオブジェクトの雛型(形式・様式を示す見本)を定義したもの。」という意味であるようですが、これは具体的にどういうことでしょうか? 私なりに考えてみたので、それが正しいかどうか判断してください。その上で、より本質的且つわかりやすい例えがあればご教示ください!(私はプログラミング初心者なので、それを念頭に置いた上で、より分かりやすい解説お願いします。) 上記の定義をもとにした私が考えるクラスの具体例 →例えば、属性として「血液型」、メゾットとして「家事」というオブジェクトの雛形を定義すると、Aさん(血液型A)、Bさん(血液型B)、c(血液型o)さん、そして家事をする主婦としての人間オブジェクトが生成できる。このオブジェクトをまとめて管理する仕組みがクラス。このクラスに属しているオブジェクトは、必ず属性として「血液型」、「家事」としてメゾットを持つ。 私の例えは、なんかいまいちしっくりきません。 もっとわかりやすく且つ厳密で本質的なご教示お願いします!

    • ベストアンサー
    • Java