- 締切済み
緑チャートのデータの分析のところの質問です。
今緑チャート数IA数II・B合版をやっています。 データの分析をやっているのですが、共分散がよくわかりません。 チャートには2つの変量の偏差の積の和と書いてあったのですが、知っていた公式は偏差の積の和÷データの数でした。 なぜこのような違いがでるのか、どちらが正しいのか教えてください。 (チャートの方には変化を考えるとあったのでもしかしたらそれが関係してるのかもしれませんがなぜ変化だとデータの数で割らなくていいのかわかりません...)
- 横田 愛美(@ringo0411resin)
- お礼率49% (57/115)
- 数学・算数
- 回答数1
- ありがとう数0
- みんなの回答 (1)
- 専門家の回答
みんなの回答
- asuncion
- ベストアンサー率33% (2126/6288)
共分散を求めるに際し、データの組数で割らないという選択肢は 聞いたことがありません。
関連するQ&A
- データの分析 118
nを2以上の自然数とする。次の問いに答えよ。 (1)変量xの値がx(1),x(2),・・・,x(n)であるとし f(a)=1/nΣ[k=1,n](x(k)-a)^2 とする。f(a)を最小にするaはx(1),x(2),・・・,x(n)の平均値で、そのときの最小値はx(1),x(2),・・・,x(n)の分散であることを示せ。 (2)cを定数として、変量y,zのk番目のデータの値が y(k)=k(k=1,2,・・・,n),z(k)=ck(k=1,2,・・・,n) であるとする。このときy(1),y(2),・・・,y(n)の分散がz(1),z(2),・・・,z(n)の分散より大きくなるためのcの必要十分条件を求めよ。 (3)変量xのデータの値がx(1),x(2),・・・,x(n)であるとし、その平均値をxバーとする。新たにデータを得たとし、その値をx(n+1)とする。x(1),x(2),・・・,x(n),x(n+1)の平均値をx(n+1),xバーおよびnを用いて表せ。 (4)次の40個のデータと平均値、分散、中央値を計算すると、それぞれ、ちょうど40,670,35であった。 120,10,60,70,30,20,20,30,20,60 40,50,40,10,30,40,40,30,20,70 100,20,20,40,40,60,70,20,50,10 30,10,50,80,10,30,70,10,60,10 新たにデータを得たとし、その値が40であった。この時、41個のすべてのデータの平均値、分散、中央値を求めよ。ただし、得られた値が整数でない場合は、少数第1位を四捨五入せよ。 この問題を解いてください。お願いします。
- ベストアンサー
- 数学・算数
- 例として使うよぅな元データを探してます エクセル・統計
エクセルを使ってみるために 標本数(n)30以上、変量の数(p)5以上のデータが欲しいのですが、 例えばW杯メンバーの身長体重肺活量 なんかをすれば面白いかな?とも思ったのですが、 変量が5以上というのがなかなか難しくて…。 何か良いデータはなぃでしょうか?? 関数は平均と分散と標準偏差を使おうと思ってます。 averageとvarpとstdevpです。
- ベストアンサー
- 数学・算数
- 分散分析の誤差について
現在,心理学の統計で分散分析を行っています。 1要因に対応が無く,1要因に対応がある2要因の混合分散分析を行っています。(データ数が異なる) 現在使用しているソフトのバージョンでは混合分散分析ができないため手計算を行っています。 そこで問題が発生したのですが,参考書(心理学のためのデータ解析テクニカルブック)を見てやっているのですが, 平方和(SS)の誤差がどうしてもマイナスの値になってしまいます。 主効果の誤差は大丈夫なのですが,交互作用の誤差ででます。 良いのでしょうか? 以前,習った時にマイナスは出ないので出た場合には計算間違いだよ!と言われた気がして前に進めません。 すみませんが,よろしくお願いします。
- ベストアンサー
- 心理学・社会学
- 標準偏差の成り立ち
標準偏差の意味について、質問致します。 (質問を簡潔にするため、母集団を分析の対象とします) 標準偏差を求める場合、偏差の2乗和をデータ数で割り、 その値の平方根を計算しますよね。 なぜ、偏差2乗和の平方根で求めた数値を、 データ数で割るという方法ではないのでしょうか?? (偏差2乗和)^0.5÷データ数 の方がイメージがつかみやすい気がします… 分散は、対象データとは次元(単位?)が違うので、 感覚的に分かり易いように、標準偏差が使用されると 理解しています。 単位を揃えることが目的ならば、データ数で割るという 行為はルートの外に出すべきなのではと考えてしまいます。 私は、どこで訳がわからなくなっているのでしょうか。。。 アドバイス頂ければ幸いです。
- ベストアンサー
- 科学
- Excelでの統計分析
Excelを使っての回帰分析の質問です。 単位がそれぞれ異なるA~Hまでの8項目の説明変量があり、 目的変量Yは良、可、不良の3種類です。 データ数は1500です。 Excelを使って相関を調べたいのですが、 どう手をつけてよいやら考えています。 ご指導いただけたらうれしいです。
- 締切済み
- SE・インフラ・Webエンジニア
- 二元配置の分散分析、多重比較法のときデータの数が合わない場合は?
反応時間を測定して分散分析を行ないたいのですが、外れ値を検出してそのデータを捨てると、各水準のデータの数が異なってくるため、繰り返しのある二元配置分散分析や多重比較(方法によっては)ができません。 ボタンを押して反応時間を測定してもらうため、押し間違えや押しそびれなどがどうしても生じてしまいます。そのためデータの数が少し異なってしまいます。 このような場合は平均値を代用値として使って埋めてもいいのでしょうか? 代用値の決め方や他の分析方法があればご教示のほうお願いします。
- ベストアンサー
- 数学・算数
- 分散分析について
統計初心者です。 分散分析についての質問です。 今実験データを分散分析にかけて主効果を見ようと試みています。 その中で要因が、「色1、色2、文字、環境」と 4要因あり4元配置で分析を行っています。 色1は、白、黒、灰で3水準、 色2は赤、青、黄、緑、白、黒、灰の7水準なのですが、 色1と色2が同じ色の組み合わせ (色1の白と、色2の白など) でのデータは存在していません。 つまり、色1には色2が6水準かかってくる。しかし、6水準は同じ種類ではない。といった状況です。 この状況で分散分析を行った場合、主効果として色1、色2は効いていると言えるのでしょうか? なんとなく腑に落ちません。よろしければどなたかよい方法を教えていただけると 大変助かります。 よろしくお願いいたします。
- ベストアンサー
- 数学・算数