• ベストアンサー

Rで最頻値の出し方を教えてください。

densityを用いて最頻値(モード)を算出しようと思っています。 グラフまでは書くことができたんですが,結局のところモードがいくつなのかが分かりません。 どのように算出すればよいのでしょうか。

質問者が選んだベストアンサー

  • ベストアンサー
noname#227064
noname#227064
回答No.2

すみません。 こっちの方が良いですね。 y$x[which.max(y$y)]

cherry77_
質問者

お礼

回答ありがとうございます。

その他の回答 (1)

noname#227064
noname#227064
回答No.1

これでは駄目でしょうか? x <- rnorm(100) y <- density(x) plot(y) y$x[y$y == max(y$y)]

関連するQ&A

  • モード(最頻値)について

    突然ですが、教えてください。 モード(最頻値)についてです。 [9,9,9,8,8,7,6] この場合のモードは「9」ですよね? では、 [9,9,9,8,8,8,6] この場合はどうなるのでしょうか?

  • 最頻値の実際の資料での使い方を教えてください

    統計学の基礎を学んでいるのですが、最頻値を使う場合がいまいちわかりません。 中央値は平均値と同じく、資料を半分に分けるので順位を求める場合に使えるのはわかりまが、最頻値は何の基準にするのでしょうか?

  • 最頻値の計算について

    データが、 1,1,1,1,1,2,2,2,2,2, 3,3,3,3,3,4,4,4,4,4, 5,5,5,5,5,6,6,6,6,6, 7,7,7,7,7,8,8,8,8,8, 9,9,9,9,9,10,10,10,10,10 という値を取っている時、最頻値はどう表せば良いのでしょうか。 また、このようなデータをExcelのMode関数を使って計算すると、 「1」となってしまいますが、どうしたら正しい答えになるのでしょうか?

  • 【MySQL5.7】IDごとの最頻値

    お世話になります。MySQLでidごとの最頻値を抽出しているのですが、 select id, hantei,count(*) as ModeCount from member a group by id,hantei having count(*) >= all(select count(*) from member b where b.id=a.id group by hantei asc) order by id,hantei レコード数は5000件ほどなのですが現在の方法では10.485sと時間がかかりすぎて困っています。MySQLでは最頻値を出すのにサブクエリを使うしかないのでしょうか? こうすればもっと速くなるよって方法があれば教えてください。お願いします。

    • ベストアンサー
    • MySQL
  • 配列から最頻値を求めるアルゴリズム

    電子回路の初心者です。 Arduinoボードをいじっており、温度センサから温度を取得してLCDに表示しているのですが、値がコロコロと変わってしまいます。そこで取得した値を配列に一つずつ格納していき、一定個数そろったら、そこから最頻値を探してLCDを更新しようと思っています。 (例) buf[10] = 3,2,3,3,3,2,3,4,5,3 上記の場合、10個格納した時点で、最も多く格納されている3を抽出したい 配列の左端から値を1つずつ取り出して、残り9個と比較して個数をカウントすることを繰り返す方法を考えたのですが、かなり時間が掛かりそうに思えます。もっと良い方法、一般的なやり方等がありましたら教えて頂けないでしょうか?

  • EXCELのピボットテーブルで最頻値を集計できないか

    ピボットテーブルフィールドの集計の方法は、ウィザードによれば、   合計   データの個数   平均   最大値   最小値   積   数値の個数   標本標準偏差   標準偏差   標本分散   分散 の中から選ぶことになっているのですが、ここに、   最頻値 ・・・関数で言えばmode関数 を持ってきたいのですが、何とかそのようにするやり方はないものでしょうか。

  • Excelで条件付き平均値、中央値、最頻値算出

    ・『A列 顧客名』『B列 出荷日』『C列 返却日』『D列 個数』となるリストを作成 ・G列の対応したセルに『G2セル 顧客名』『G3セル 出荷日』『G4セル 返却日』を入力すると対応する『D列 個数』の『G5セル 中央値』『G6セル 最頻値』『G7セル 平均値』『G8セル 最大値』『G9セル 最小値』を算出 上記をできるようにしたいです。 まずは検索内容を『検索顧客名 A』『検索出荷日 2018/1/1』『検索返却日 2020/4/20』とした場合の中央値の計算式をいかにしたのですが (1) =MEDIAN(IF(B3:B21>=G3,IF(B3:B21>=G3,IF(A3:A21=G2,D3:D21,""),""),"")) この場合の結果が『4』となりましたが、確認のため別数式で (2) =MEDIAN(D3,D6,D7,D8,D13,D18,D20) とした場合の結果が『6』となりました。 おそらく(1)の数式に問題があるかと思うのですが原因を特定できませんでした。 皆さんに理由と正しい数式をご教授いただきたいです。 また、同様に不具合があった為、最頻値、平均値、最大値、最小値も教えていただきたいと思います。 よろしくお願いいたします。

  • 実際の最頻値と理想的な最頻値のズレ

    質問内容 データ上の最頻値とグラフ上の最頻値のギャップを埋めるには? 本文 初めまして お世話になります。 私最近統計に少し興味を持ちだしたもので Excelにて1・2・3・4・5・6を示す乱数の 30回分の総和を取ったデータを2500件ほど用意して 興味本位でヒストグラムを書いてみたのですが、 この際に このヒストグラムから得られる度数分布表上での最頻値 (平滑化して得られる頂点とおぼしきポイント:理想的な最頻値)と データから得られる最頻値に著しいズレがあることに気付きました このヒストグラムのデータは2500件用意できましたが 実際に何らかの目的で運用する場合は これほどデータが揃えられないことが多々あるように思います そうなってくるとこの 「理想的な最頻値とデータ上の最頻値の間に発生するズレ」は 顕著な方向にシフトするのではないかと不安に感じてしまいます。 そこで質問なのですが このズレを解消するには どのような計算をすればいいのでしょうか? 出来れば解説付きで宜しくお願い致します。

  • 資料の整理の問題です。

    下の図は,ある高校の1年1組の数学の小テスト(30点満点)の結果をヒストグラム(度数分布のようすを表したグラフ)に表したものである。次の問に答えなさい。 (1)下の度数分布表を完成させなさい。 (2)25点以上30点未満の階級の相対度数を求めなさい。 (3)メジアン(中央値)の入る階級を答えなさい。 (4)モード(最頻値)を答えなさい。 お願いしますm(_ _)m

  • 最頻値について

    前略 Excel2013です。 MODE関数、MODE MULT関数についてです。 C2からC96までのセルに1から20までの数字がランダムに表示されています。 表示回数の多い数字をC100からC104までのセルに多い順から表示させたいのですが、 C100からC104のセルには、1の数字しか表示されません。 ご指導をお願いします。 早々