• ベストアンサー

身近にあるデータ

高一です。 数学Iで、 「身近にあるデータについて分析し、考察する」 という宿題が出ました。 インターネット上のデータ使用可能なので おもしろいデータを探しているのですが なかなか見つかりません。 データの例としては、 北海道と沖縄の年間の気温、TDLとUSJの入場者の関係、 父親の身長と子供の身長、など。 そしてそのデータの四分位数、最大値、最小値を自分で出し 箱ひげ図やヒストグラムを作成し、分散を求め、 データの散らばりで数値を確認...という宿題です。 なにか、面白そうな、みんなが興味を持てそうなデータがネット上にあったら 教えてください! お願いします^^

質問者が選んだベストアンサー

  • ベストアンサー
回答No.1

宿題をネットを利用して解決する人の割合なんてどう? 地域差、学年差等 (皮肉をいっているわけじゃないよ)

makimansan
質問者

お礼

自分で集計するのはダメみたいです^^; ありがとうございます^^

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • (数I)データの分析の問題

    分析の問題です。 A市の月の日ごとの平均気温についてのデータを以下に示す 平均値:15.8℃ 最小値:9.5℃ 第1四分位数:14.1℃ 中央値:16.40℃ 第3四分位数:18.1℃ 最大値:19.8℃ x℃をFで表すと(9/5)x+32(F)となる A市の平均気温をFで表すと、平均値は( )Fとなり、分散の値は25.6となった。したがって、℃で表したときのA市の平均気温の分散は( )である。 この( )の求め方を教えてください。 お願いします。

  • お願いします

    数1データの分析の分野です。 箱ひげ図で最大値が外れ値かどうか調べる際、四分位範囲×1.5+第三四分位数が最大値より小さかったら最大値は外れ値で最大値より大きかったら最大値は外れ値ではないということでよろしいですか?またこれは最小値でも同じことが言えますか?

  • 箱ひげ図(箱ひげプロット?)を作ろうと思っているのですが、以下の計算で

    箱ひげ図(箱ひげプロット?)を作ろうと思っているのですが、以下の計算であっているか教えていただけないでしょうか。 ・データ 17.0 、20.7 、21.4 、22.1 、22.2 、22.4 、23.5 、23.6 ・中央値 22.2 ・最大値 23.6 ・最小値 17.0 ・第1四分位数 20.7 ・第3四分位数 22.4 ・四分範囲 1.7 ・上側の髭 24.95 ・下側の髭 18.15 ・はずれ値 17.0

  • 実験調査計画法のレポート課題

    実験的な手法に基づいて収集された何らかのデータを対象に分散分析を行い、その実験の問題・目的から結果と考察までを記入するという課題なんですが…どういう風に書けばよいのでしょうか??また、分散分析を行うのに適当と思われるデータは、例えばどんなものでしょうか?(仮想データで結構です) 申し訳ありませんが教えて下さい!

  • 統計学の課題で困っています

          A  B 北海道   5.5  4.7 青森    4.5  4.7 岩手    4   4.1 というA,B二つのデータがあるとき 1、2つのデータをそれぞれ標準化しなさい。 2、2つのデータ間の共分散を求めなさい。 3、標準化した2つのデータ間の共分散を求めなさい。 4、一方のデータを説明変数、他方のデータを被説明変数とする回帰式と決定係数を求めなさい。また、被説明変数の理論値と残差を求めなさい。 5、上記2及び4の計算結果について、標準化、共分散、相関係数の意味を説明しつつ、分析・考察を加えなさい。 6、回帰式を求める際の基本的考え方と決定係数の意味を説明しつつ、計算して得られた回帰式、決定係数について分析と考察を加えなさい。 7、残差において正または負の大きな値が出た地域について、なぜそのように大きな値が出たと考えられるか、地域の特徴を考慮しつつ思いつくことを述べなさい。 という課題が出された時どのようにして解けばいいのですか?

  • 分散とは何ですか?

    友達の大学の問題で、エクセルで身長の分散を求めなさいという宿題がありました。身長のデータが20個ぐらいあり、分散を表示させるセルに求めるという問題です。(ちょっと見ただけなので、この程度しか情報がなく申し訳ありません。どうも身長と体重などの相関関係を調べているようです。) 相談されたのですが、よくわかりません。分散というのは何なのでしょうか?あと標準偏差、中央値、最頻値、母集団という言葉もあり、言葉の意味が全くわかりません。どなたかわかりやすく言葉の意味を説明していただけたらと思います。 どうぞよろしくお願いいたします。

  • USJについて初歩的な質問です。

    すみません、近々USJに行こうと考えており、初歩的な質問なのですが教えていただけますでしょうか。 1)現在、パートナー・フレンドリーチケット20というものを持っております。このチケットでそのまま入場できるのでしょうか。(それともゲートに並んで正式なチケットに引き換えるのでしょうか) 2)TDLのファストパスみたいなシステムはあるのでしょうか。あるとしたら、上記パートナー・フレンドリーチケット20をその機械に挿入すればよいのでしょうか 3)3才の子供(男・身長90cm)と行くのですが、子供が楽しめるアトラクションでお勧めがありましたら教えてください。 USJはジョーズや、バックドラフトなどしか知らなくて、どちあかというと激しく音の大きい大人向けのアトラクションのイメージがあるのですが、小さな子供が楽しめるものを知りたく。 よろしくお願いいたします。

  • 回帰分析におけるデータの正規化の意味

    重回帰分析をプログラム作成することを考えています。 しかし、データの正規化について疑問が2つあります。 まず一つは、例えば、画像の解析をする場合にデータの正規化をすることは、 ノイズを除去したり、画像の向きを正しくすることを意味しますよね。 しかし、回帰分析においてデータの正規化をすることは何を意味しているのでしょうか? 画像のように見てイメージがわけばよいのですが、数値データなのでどういう意図があるのかよく分かりません。 2つ目の疑問です。 また、データを正規化して重回帰分析をしたとします。 ↓の重回帰分析を例に挙げます。 http://homepage2.nifty.com/crop_shimane-u/multipleregression_excel.htm この例では、入力として年平均気温、降水量、日照時間とし、出力を単収としています。 このときデータを正規化せずに解析し、次のような予測式を推定しています。  水稲単収=713.932-17.336×年平均気温+0.010666×降水量+0.017851×日照時間 ・・・ @ この場合に、正規化していないので新しいデータとして、例えば、  年平均気温=14.8、降水量=2431、日照時間=1721 ・・・ (*) から単収を推定したいとき、上記@の回帰式に代入することで単収を計算して推定できます。(1) しかし、データを正規化(平均が0、分散が1になるように)した場合、入力と出力のデータが0以上1以下の値しかとらなくなるので、 重回帰によって上記@のように予測式が得られてもその予測式の出力は0以上1以下の値しかとらないことになり、 新しいデータ(*)をそのまま予測式に代入しても正しい単収を推定できないのではないかと考えています。 この場合のように、データを正規化して得られた予測式で(1)のように正しく単収を推定するにはどうしたらよいのでしょうか? 長くなりましたが、回答よろしくお願いします。

  • 分散分析で有意差が確認された場合、データの水準を解析範囲から外して再解析を行うことは駄目ですか?

    統計初心者の一人です。ご指導宜しくお願いします。基本的な質問で恐縮ですが、2元配置の分散分析で有意差が確認された場合、他と異なるデータの水準を解析範囲から外して再解析を行うことは統計上問題ですか? 分散統計で要因の一つを操作因子、もう一つは濃度因子にした2元配置の分散分析を行なっております。その結果、操作因子並びに濃度因子共に「有意差」が確認されました。 このため、元のデータの範囲設定を変更し、影響のありそうな操作因子や濃度水準を分散分析の計算範囲から除外して再計算を行なってみました。そうしたところ「有意差ありとはいえない」との結果が得られました。当然、信頼限界を計算してそれから有意な濃度範囲を求めることも行っています。 この結果をもとに報告書に実験の操作要因と影響する濃度の範囲として考察に加えようと考えていますが、この考えは統計的な観点からは邪道な考えでしょうか?もともと実験計画はR.Aフッシャーの3原則の一つである実験番号の割り当ての無作為化(ランダムに実験番号を割り付ける)が基本であるので、この様な解析はその考え方から逸脱するため意味を持たないかとも思っていますが、本当に駄目なのでしょうか? 理由を含めご教授願いたく宜しくお願い致します。レベルを下げて具体的にご教授願えれば幸いです。 <例> Data 水準-1 水準-2 水準-3 SampleA n=1 24 24 22 n=2 25 24 22 n=3 25 24 22 SampleB n=1 25 24 22 n=2 25 25 25 n=3 25 25 25 SampleC n=1 21 20 17 n=2 21 20 17 n=3 21 20 17 分散分析・・・Sample間(濃度)、水準間(条件)で有意水準5%で有意差あり →ここで、濃度、水準がどの範囲まで影響しているかを確認するために、下記のよ うにデータ範囲を変更して再解析 Data 水準-1 水準-2 SampleA n=1 24 24 n=2 25 24 n=3 25 24 SampleB n=1 25 24 n=2 25 25 n=3 25 25 分散分析 有意差なし 以上です。

  • [統計] こんな検定をして意味がありますか?

    2グループあります。 各グループにはいくつかのサンプルがあって、 各サンプルにたいしてある試験を行い、 得られたデータを最小二乗近似したときの傾きの値(A)をサンプルごとに得ました。 このAの平均値がグループ間で異なるかどうかを検定したいのですが、 通常のt検定や分散分析で解析しても大丈夫でしょうか?