相関係数から別の値を導く方法ってありますか?
- 2つのグラフのデータから求めた相関係数を使用して、1つのグラフに新たなデータを追加する方法を知りたいです。
- 相関係数が1に近づくまでプログラムを使って計算し、閾値に達したらその時の入力値を出力する方法もありますが、他に方法はないでしょうか?
- 式変形だけでは難しい場合もあるので、他の方法を知りたいです。
- ベストアンサー
相関係数から別の値を導く方法ってありますか?
今、2つのグラフのデータが A:69,105,42,23 B:133,181,127,59 となっていて 2つのグラフA,Bの相関係数を求めたら0.93でした。 AとBのグラフが似ているので、Aに新たなデータ(数値)が追加されたときに、 Bには相関が保たれるような値が追加されるはず!」ということを前提に Bに追加される値を求める方法を知りたいんですが、 求める方法をご存知の方がいらっしゃったら教えてください。 プログラムを書いて相関係数が1に近づくまで計算させて、閾値に達したら、 その時の入力値を出力するという方法もあるようですが、 やはりそれでしか求められないでしょうか? 式変形だけでは難しいですか?
- kreboa
- お礼率90% (19/21)
- 数学・算数
- 回答数2
- ありがとう数2
- みんなの回答 (2)
- 専門家の回答
質問者が選んだベストアンサー
相関係数の定義式を確認してください。 分母に√があるのが厄介なので、二乗して (A,Bの相関係数)^2 = (A,Bの共分散)^2 / { (Aの分散)・(Bの分散) } として扱いましょう。 Σを使って書くと一見ややこしい式ですが、 (A,Bの共分散) が 各 B_i の一次式、 (Bの分散) が各 B_i の二次式であることに気がつけば、 A_1 ~ A_(n+1), B_1 ~ B_n が与えられたとして 1 ~ n と 1 ~ n+1 で A,B の相関係数が同じであるという式は、 (定数) = (B_(n+1) の二次式) / (B_(n+1) の二次式) という形であることが解ります。 (Bの平均) が、定数ではなく、B_(n+1) の一次式であること には注意が必要ですが、相関係数の二乗が B_(n+1) の 二次式 / 二次式 であることには違いありません。 分母を払えば B_(n+1) の二次方程式ですから、解公式などで 解くことができます。係数の整理は面倒だけれど、地道にやれば 答えは見つかります。 ただし、この計算でデータの捏造ができるとは 思わないほうがよいです。上記のように、 相関係数が変わらないというだけで、与えられた A_(n+1) に対する B_(n+1) の値は決まってしまうので、それによって、 A,B 間の回帰式が変わります。
その他の回答 (1)
- 麻野 なぎ(@AsanoNagi)
- ベストアンサー率45% (763/1670)
まず、相関係数から直接値を予測する方法はありません。 また、相関係数自体も(多分、普通は直線近似によるR値を使うと思いますが)どのような式でBを近似させるかで変わってきます。 お手元にExcelはありますか? もしExcel があるのなら、 A:69,105,42,23 B:133,181,127,59 を使って、「散布図」という種類のグラフを作ってみてください。 グラフができたら、グラフの中のデータを右クリックして、「近似曲線の追加」をやってみてください。 オプションとして、直線近似を選ぶと、近似の線を引いてくれます。 ※このデータが、理論的に、どういう式で表されるかわかれば、適切な式を(多項式近似とか)選べばいいのですが。 このとき、近似曲線の「オプション」タグで、 ・グラフに数式を表示する ・グラフに R-2 値を表示する をチェックしておくと、近似式と、相関係数の自乗が表示されます。
お礼
丁寧なご説明に感謝します。 無事解決することができました。 線形回帰法というのがあるようで、それでも解けるみたいですね。
関連するQ&A
- 相関係数の差について求めたいのですが
相関係数の値の差を求めたいのですが、求めたいAとBのデータの数値が、それぞれ一つしかない状態です。 関数のCORRELを用いて相関係数を一度求めようとトライしたのですが、数値がそれぞれ一つしかないせいか、求められませんでした。 やはり、データの数値が一つしかないから求められないのでしょうか? 無知ですみませんが、よろしくお願いします。
- ベストアンサー
- 数学・算数
- 相関係数が1になるのはなぜ
データ群Aとデータ群Bの相関係数を調べようとしています。 データ群Aはy=x データ群Bはy=2x-5 0<=x<=10 このデータ群の相関係数を 共分散/(√Aの分散×√Bの分散) で計算すると相関係数が1となります。 明らかにデータ群AとBが違っているのに相関係数が1になるのはなぜなのか、また、このデータ群の相関係数の正しい求め方を教えてください。 よろしくお願いします。
- ベストアンサー
- 数学・算数
- 相関係数について教えて下さい
算出された相関係数の見方について疑問があります。 知識のある方、教えて頂ければ幸いです。 下のようなデータがあるとします A 100→200→400→800 B 50→100→200→400 C 50→150→350→750 AとB AとC、の数列の相関について考えるとします。 *BとC の相関については考えません。 Aの数列は100からスタートして次は2倍、その次は前の数字の2倍と、倍、倍で増加します。Bの数列は、50からスタートして、次は2倍、その次は前の数字の2倍と、倍、倍で増加します。 AとBは数の増加率が同じ場合です。ここでA,Bの相関係数を 計算すると、1と算出されました。 次にCですが、Cの数列はAの数列の増加する値と同じ値を 加算していきます。Aは最初の100に対して、次は200なので、 100の増加、するとCも、最初の50に対して100増加させています。 2行目以降も同じです。このAとCの相関係数を計算しても、1と算出されました。 AとB の相関係数は1 AとC の相関係数も1 Bと、C の数の増加は明らかに違うのに、両方共に Aに対する相関係数が1と出てきてしまいました。 どのように解釈して良いのか困っています。 私が素人判断で勝手に考えていたのは、 AとBは相関が一致していて、 AとCは増加する傾向は同じであるが、変化量の割合に違いがある為、 AとBほどには相関が高くない数字が出るとばかり思っていました。 相関係数も様々な種類があるようなのですが、変化の量も測定できるような、統計数値はありませんでしょうか?
- 締切済み
- 数学・算数
- 相関係数、決定係数からの考察
説明変数x、被説明変数a,bがあったとします。 そこで例えば xに対してaの相関係数、決定係数がそれぞれ0.5、0.6 xに対してのbの相関係数、決定係数がそれぞれ0.7,0.8 であったとします。 この場合では、xはaよりもbの方をよりよく説明していると思うのですが、その理由は何でしょうか? 相関係数、決定係数の値が高いから…というのは何となく違うというかすっきりしないです(間違ってるのかもですが) 回答の程お願いします。
- ベストアンサー
- 数学・算数
- 相関係数の求めかたbyエクセル
エクセルの分析ツールにある相関ですが、一般的に使用される場合はどの相関を方法を使用すると良いのでしょうか。CORRELでの方法またはPEARSONの方法かよく分かりません。 内容的には、サンプリングを行ったものの2種の測定数値、例えばA値(30,50,55)B値(0.5,0.35,0.7)というような数値より相関を求める内容です。 また、その相関係数をどの様に判断をする良いか、例えば、0~0.2までは相関はない。0.2~0.3やや相関があるなどの目安の様な物はあるのでしょうか。
- ベストアンサー
- オフィス系ソフト
- 標準偏差,相関係数が綺麗になるデータの求め方
標準偏差,相関係数がある程度綺麗になる(小数第2位程度まで)ようなデータを人工的に作りたいのですが,何か良い方法はありますでしょうか。 理想としては,プログラミングを用いてデータと標準偏差,相関係数がそれぞれ出力されるのが良いですが,より良い方法があるならば教えて頂きたいです。 プログラミングならばその内容まで教えて頂けると幸いです。 なお,データの数は5~20個程度で,数値は1~3桁です。 よろしくお願い致します。
- 締切済み
- 数学・算数
お礼
丁寧なご説明に感謝します。 無事解決することができました。 線形回帰法というのがあるようで、それでも解けるみたいですね。