- 締切済み
相関係数を指定して二変量データを作成する
相関係数、平均、標準偏差を指定して二変量データを作成しようとしていますが、なかなかうまくいきません。 http://oshiete1.goo.ne.jp/qa2413827.html こちらの回答を参考にしてエクセルで試してみたのですが、出力されたデータの相関係数、平均、標準偏差を調べて見るとどの値も微妙にずれてしまいます。
- forever754
- お礼率80% (4/5)
- 数学・算数
- 回答数2
- ありがとう数2
- みんなの回答 (2)
- 専門家の回答
みんなの回答
- rabbit_cat
- ベストアンサー率40% (829/2062)
あそこに書いた式どおりに計算すれば、そんなにずれるはずがないのですが。 あの式は、AとBの対称性が悪いので、標準偏差や相関係数の収束が遅めというのは分からなくもないんですが(本当は、あの式にさらに直交行列を掛け算してAとBを対称にするほうがbetter)、少なくとも平均がずれるってのはあんまり考えられないと思います。
- rabbit_cat
- ベストアンサー率40% (829/2062)
微妙にってのはどの程度ですか? ランダムにずれる範囲内とは思えないほど、ずれてしまっているんでしょうか。
補足
相関係数、標準偏差は標本数を500くらいにすればそれほどずれないのですが、平均だけがかなりずれまして、標本数500でも指定した平均との乖離の標準偏差が80%くらいあるようです。ずれないようにすることはできるのでしょうか。
関連するQ&A
- (数I)相関係数について
相関係数の性質について質問します。 ●一方の変量がもう一方の変量に比例するとき、相関係数は1である ●2つの変量のどちらを散布図の横軸・縦軸にするかで、相関係数の値は変わる ●もとのデータの一方の変量に定数を加えても、相関係数の値は変わらない すべて正しいのでしょうか? 宜しくお願いします。
- 締切済み
- 数学・算数
- 標準偏差,相関係数が綺麗になるデータの求め方
標準偏差,相関係数がある程度綺麗になる(小数第2位程度まで)ようなデータを人工的に作りたいのですが,何か良い方法はありますでしょうか。 理想としては,プログラミングを用いてデータと標準偏差,相関係数がそれぞれ出力されるのが良いですが,より良い方法があるならば教えて頂きたいです。 プログラミングならばその内容まで教えて頂けると幸いです。 なお,データの数は5~20個程度で,数値は1~3桁です。 よろしくお願い致します。
- 締切済み
- 数学・算数
- 三次相関係数について
三次相関係数について質問です。 三種類の変量についての相関を調べたいです。 できるだけ簡単に三次相関係数が出せるフリーソフトってありますか? エクセルでできなそうだということは分かったのですが・・・・(統計解析に不慣れなもので、もしかしたらエクセルでも簡単にできるのかもしれませんが・・・)。 ご教授宜しくお願いします。
- 締切済み
- 数学・算数
- 相関係数を使ったサンプルデータを生成する方法
相関係数を使ったサンプルデータを生成する方法を教えて下さい。 変数Aの中央値、標準偏差と変数Bの中央値、標準偏差、相関係数・・・リンク先Excelのピンクのセル を入力すると、 変数Bのサンプルデータ・・・リンク先Excelの水色のセル が出力されるようなものをExcelで作れたらと思います。 宜しくお願いします。 http://exp026.dataweb.ne.jp/Excel/sample.xls
- ベストアンサー
- 数学・算数
- 相関がないのに相関係数が1???
相関係数の意味を考えていて、理解できないことが出てきたので教えて下さい。 変数Xと変数Yの相関係数の求め方は、データ数がnの時、 1.変数X,Yの平均値を求める。ここでは、X^、Y^と書くことにします。 2.変数X,Yの標準偏差を求める。ここでは、σx、σyと書くことにします。 3.変数X,Yを基準化する。 基準化したX=(X-X^)/σx、 基準化したY=(Y-Y^)/σy 4.基準化したX,Yの積の平均が相関係数である。 r=1/n・Σ{(基準化したX)・(基準化したY)} となります。 基準化したXと基準化したYの積が全て1のデータの場合、 例えば、(1,1)、(0.5,2)、(0.4,2.5)、(0.1,10)、(0.01,100)、(-1,-1)、(-0.5,-2)、(-0.4,-2.5)、(-0.1,-10)、(-0.01,-100)‥‥‥ 双曲線になりますが、平均値と標準偏差で元のデータに戻しても、双曲線みたいなデータの散布図になります。つまりXが大きければYも大きいという関係がないにもかかわらす相関係数は1になってしまいます(というか1になるようにデータを選んだ)。 考え方に間違いがありますか。
- 締切済み
- 数学・算数
- 授業で平均・分散・重回帰係数・寄与率・相関係数・検定(F0)・標準回帰
授業で平均・分散・重回帰係数・寄与率・相関係数・検定(F0)・標準回帰係数(Y=で定数項がない式)を学びました。 あるデータ(説明変量(x1~x3)と目的変量(Y))を渡されて、来週にレポート(結果と検討など)として提出しなければなりません。 先生は「標準化したものだけでやっていい」とおっしゃったのですが、そもそも標準化とは説明変量の度合いをみるだけではないのでしょうか?? 一応回帰係数を求め、寄与率、相関係数、検定を行いましたが、危険率10%で「式は役立たない」という結果に、 はじめに標準化し、寄与率、相関係数、検定をするも、危険率10%で「式は役立たない」 という結果にいたりました。 検定で「式は役立たない」というのはいったいどういう意味なのでしょうか。教えてください。
- ベストアンサー
- 数学・算数
お礼
回答ありがとうございます。 どうやら単純に指定した平均の値が小さすぎてX,Yの平均と0との誤差の影響が相対的に大きかったようです。X,Yの平均の誤差を補正したらほとんどずれなくなりました。お騒がせしました。