• 締切済み

標本数が50以上のデータが見つからない 

標本数が50以上のデータを見つけてデータ解析を行えという問題が出たのですが、 標本数が50以上のデータを見つけることができません。 もし、どこかのHPにあれば教えてください。 値はなるべく少ないほうがありがたいです。 よろしくおねがいしますm(_ _)m

みんなの回答

  • zinchan
  • ベストアンサー率49% (97/197)
回答No.4

 データ数が50以上ときわめて多数ということから、問題を出された方の意図としては、データの分布の仕方が何らかの分布様式に近づく可能性を問いているのではと想像します。  とすれば、手っ取り早いのがさいころを振って出た目の数を記録するのがいいと思います。10回程度振っても何らかの目に偏ることがありますが、50回も振れば、それなりに一様に分布してくると思います。  さいころがなければ、エクセル等でランダム関数を用いて1~6を表示させる式を作り、それを50個ほどコピーし、そこで現れた数値をコピーして形式を選択して貼り付け→値を選択→OKを押せば、データを固定できます。そして、1~6の項目ごとに、いくつ出たかをcountif関数で計数すれば、分布のグラフでも検定でも可能になると思います。  または、総務省や地方の気象台のHPから「過去のデータ・統計」などのリンクから、データが多数ある統計データを抜き取って解析してみてはいかがでしょう。気象データの場合、風向きとか風速のデータを時間毎で取り出せば、すぐ集められるでしょう。

  • hasega2
  • ベストアンサー率52% (165/316)
回答No.3

>標本数が50以上のデータを見つけてデータ解析を行えという問題 どのようなデータ解析をしたいのかわからないと、 どのようなデータが50個ほしいのかわかりません... 「標本数が50以上」とあるので、ヒストグラムを作りたいのでしょうか? #ヒストグラムを作るソフトは何をお使いですか? #エクセルなら、下記ホームページからサンプルをダウンロードできます。 #ただし、ここのサンプルは48個ですが...

参考URL:
http://fat-rika.hp.infoseek.co.jp/exceldat1.htm
  • neKo_deux
  • ベストアンサー率44% (5541/12319)
回答No.2

こちらのサイトのアンケート結果で、総得票数が50以上のものならば良いのでは? タイケツ.com http://taiketsu.okweb.jp/ > 値はなるべく少ないほうがありがたいです。 エントリー件数が相当すると思いますが、○か×かの2件とかだと、解析しても面白くないような?

参考URL:
http://taiketsu.okweb.jp/
  • 12m24
  • ベストアンサー率23% (193/817)
回答No.1

 株価なんかはどうでしょうか? 50どころか2000以上有ります。  このあたりは、「Yahoo!ポートフォリオ」など、株の情報を集めるツールがありますので、割と簡単に集まると思います。(どれを選ぶにしても、番号を探さないとだめなんですが) http://www.tse.or.jp/REALIDX/index.html ↑には、東証がまとめたたくさんの指数があります。

関連するQ&A

  • 標本数の決め方

    整数10000個からなる母集団から5000個抜き出した標本の総和が500なら,母集団全体の総和は1000前後と推定でき,5000個の平均が500なら,母集団全体の平均も500前後と推定できると思います.このように総和は標本数に依存しますが,平均は標本数に依存しない性質があると思います.以下,操作Fは単なる平均ではないのですが,平均のように標本数に依存しない値を返す操作とします. N個のデータからなる母集団全体に操作Fを行った値をある誤差,ある信頼区間で推定したい場合,どのような考え方で標本数を決めればよいでしょうか.Fが単なる平均をとる操作,つまり母平均の推定の問題であれば分かるのでが,そうでない操作Fの場合についての質問です. よろしくお願いします.

  • 標本化について

    標本化について  周期が1Sのとき周波数は1Hzでいいのでしょうか? あと標本化周波数が、信号の周波数の4倍、2倍、1倍のとき、標本化した値を書きたいのですが、どのような感じで書けばいいか詳しい方、アドバイス下さい。 今、通信の勉強をしているのですが、標本化がどういった事か、教科書には簡単な説明しかなく、周期とか周波数の求め方も書いてなくホームページで調べたのですが、自身がなく、標本化の値の書き方は、ホームページで調べても出てこなかったのですが、標本化の値の書き方についてどのような本に初心者でもわかりやすく書いてあるか知ってる方、教えて下さい。 よろしくお願いいたします。

  • 抽出する標本数について

    100,000個のケーキにおける良品率を調査する場合、 標本誤差:0.1%、信頼水準:99.7%(λ=3)、標本比率:0.99999 と設定した場合、 標本数は89.99≒90となったのですが、 これで抽出した標本数は正しいと言えるのでしょうか? 標本比率は0.5にして計算すべきなのでしょうか? また、信頼水準λは3以上はないのでしょうか? 宜しくお願いします。

  • 標本数が少ないときの検定の仕方

    まず、私が今、行おうとしている検定の仕方をご説明します。 1. 非常に時間のかかる測定結果が数件あり、そのうちの1件(標本A)が平均から大きく外れた値を示しています。おそらく測定時になにかの外乱があり、このような値を示したのでしょう。原因を追求するのは、困難なのでこの値をすててしまいたいところです。 2. そこで平均、分散、標準偏差を計算しました。*** 3. 標本が正規分布をなすことを仮定して、標本Aよりも大きな平均よりのずれを示す確率を正規分布確率表で確認したところ、16%と出ました。 4. と、いうことはそのような値が生じる確率は16%ある訳で、この値を捨てるのは適切ではない。うーん。残念。←今、ここ。 さて、お聞きしたいのは***の部分です。 今回の場合、この異常値・標本Aを平均、分散、標準偏差の計算に用いることで、大きくこれらの値が変わってしまっています。 たとえば、標本Aを取り除いた上で、平均、分散、標準偏差の計算を行ってみると、標本Aの値が生じ得る確率は0.04%になります。ということはなにか変なことが起こったんだろうね、ということでこの値は捨てていいことになると思います。 しかし、異常値かもしれない値を、最初から取り除いて(つまり特別扱いして)行う検定というのもなんだか、ズルをしているようで変な気がします。 このような計算の仕方(検定の対象となる異常値をあらかじめ除いて検定を行うやりかた)は統計上、正しい手順なのでしょうか? そもそも標本数が少ないときにはもっと別の手順で検定を行うべきなのでしょうか? なにぶん、素人なので定義に反した用語の使い方をしているかも知れませんが、何卒よろしくお願いいたします。

  • 標本数の求め方についての疑問

    標本数の求め方についての疑問 二つの問題があったのですが、 【例】ある工場で生産される製品の重さを無作為抽出した標本で検査したい。予備調査の結果、この製品の重さには約10(g)の標準偏差があることが分かっている。信頼度95%で誤差の範囲を1(g)以内で推定するには,標本の大きさを何個にすればよいか. (解答)誤差 =z・σ/√n  つまり、式は 1.96・10/√n=1 n≧= 384.16 … 385個   と書かれています。次に、 【1】母標準偏差30(g)である大量の玉葱から標本を無作為抽出する。母平均の95%信頼区間の幅(つまり、誤差の2倍)を3(g)以下で得るには,標本の大きさを何個にすればよいか。 (解答)誤差×2=z・σ・2/√n つまり、標本数を求める式は 1.96・30・2/√n=3 n≧1537個 とありました。 ここで疑問なのですが、なぜ【例】の問題では、誤差×2(z・σ・2/√n)ということをしないのでしょうか。統計初心者なので詳しく解説して頂けると助かります。

  • CDと電話の標本化周波数について

    CDの標本化周波数は44100Hz、電話の標本化周波数は8000Hzに決められている。 その理由を考察せよ。 ヒント 人の話し声:300~400Hz     人に聞こえる音:20~20000Hz という問題がわかりません。 わかる方、お願いします。

  • 標本化定理について

    標本化定理によると、信号の最高周波数をfmaxとするとき、標本化周波数fsはどのような条件を満たすことが必要か?数式で示しなさい。って問題が大学の試験ででたのですが、まったくわかりませんでした。 標本化定理がどのようなものかって程度しかネットワークの講義の中でも説明がなく、本屋に行って参考書とか見てみたのですが、ネットワーク関係の本では、標本化定理がどのようなものか簡単な説明しかされていませんでした。 この問題がわかります方いましたら、アドバイス下さい。 よろしくお願いいたします。

  • t検定の標本数

    はじめまして。 卒論で対応のない2変数のt検定を行っているのですが、どうしてもわからないことがあるので投稿させていただきました。 一方の標本数が259で、もう一方が5という検定を行ったところ、教授から「標本数が7以下だとt検定ではない検定を行うはず」と言われました。テューキーの方法かもしれないとも言われたのですが、調べたところ違うようなので、どうしたらよいかわかりません。2つの標本数の差が200近くあり、なおかつ一方の標本数が7以下の場合に、両者に差があるかを検定するにはどうすればいいか、ぜひ教えてください。よろしくお願いします。

  • 標本化定理について

    標本化定理によると、信号の最高周波数をfmaxとするとき、標本化周波数fsはどのような条件を満たすことが必要か?数式で示しなさい。って問題が大学の試験ででたのですが、まったくわかりませんでした。 標本化定理がどのようなものかって程度しかネットワークの講義の中でも説明がなく、本屋に行って参考書とか見てみたのですが、ネットワーク関係の本では、標本化定理がどのようなものか簡単な説明しかされていませんでした。 この問題がわかります方いましたら、ぜひアドバイス下さい。 よろしくお願いいたします。

  • 標本抽出について

    大学の授業で説明されたのですがよくわからなかったのでおしえてください。 平均45、標準偏差15の正規分布から無造作抽出した標本数9の標本から求めた標本平均が次の範囲の値をとる確率をそれぞれ求めよ。 (1)p(x≥50) (2)p(40≤x≤50) (3)p(35≤x≤55) できれば解法詳しく書いていただけると助かります。