• 締切済み

0か1をとる約1290個の実測値列に関して、ある推定法が他より優れている事を示すには?

どうしたら良いでしょうか。測定値と、推定値がともに実数だと、相関係数を取って、その値が1に近いほど、優秀な推定値だというと聞いたことが在ります。 今回私が悩んでいる場合のように、測定値と、(複数ある推定方法から一つ選んだ推定方法での)推定値がともに、0か1です。この場合、実測値と推定値の相互の、相関係数、を算出し、その値の大きさから、その推定方法が(他の推定方法に比べて)優秀であると、主張する、ことはできるのでしょうか。あと、こういう、0,1の値の場合用に、ぴったり使える、特殊な相関係数算出方法は、世の中にはあるのでしょうか。 今、質問を書いていて気づいたことですが、測定値と、推定値との間で、合致した個数を、複数の推定法の間で、シンプルに比較したら、それはそれで、ある特定の推定方法の結果の優秀さをアピールすることになるのかな、と。。。そんな気もしてきました。しかしあまり見栄えがよくないような。。。 相関係数という概念はこういう0,1の場合、使えないのでしょか。 何かの課題ではありません。どうぞよろしくお願い致します。

みんなの回答

  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.4

0か1の値しか取らない出力をどんどん出す信号源があって、次の信号が0であるか1であるかを予測する方式が幾つかある。 予測が当たったか外れたかだけを問題にして、なるべく当りが多い方式を「優秀」としたい、というのであれば、当りが多かった方式を採用すれば良い。 それだけじゃダメで、「有意に当りが多いのか、あるいはたまたま偶然よく当たったかも知れないのかを判別したい」ということですと、まず信号源が1を出す確率を推定して、それに基づいて統計的検定を行うことになります。 しかしもうちょっとマジメに考えますと、「優秀」さの評価は0,1の意味や用途に依るんです。例えば「1/100の確率で1が出る。1が出たら君んちを爆破するよ」と言われていたら、1が出るものと予測して逃げるのが正解。この場合予測は99%外れるわけですが、それでも1と予測する予測法の方が0と予測する方式より「優秀」ですよね。 そんな訳で、信号の意味・価値を考慮せずに、一般にどの方式が「優秀」かを論じることはできないでしょう。

  • ymmasayan
  • ベストアンサー率30% (2593/8599)
回答No.3

間違ってたらすみません。 単純に考えて4つのエリアに分けます。 a:(予測=0:実測=0)の件数 b:(予測=0:実測=1)の件数 c:(予測=1:実測=0)の件数 d:(予測=1:実測=1)の件数  (a+d)/(a+b+c+d)が相関係数になりませんか。   

  • tnt
  • ベストアンサー率40% (1358/3355)
回答No.2

すみません。その1と0の、順番、もしくは パターンは、必要ですか? つまり、11001010を1の確率50% とするのか、 1(またはゼロ)の連続する確率25%(もしくは50%)とするのか、 010というパターンの出る回数2回とするのか これによって、回答は大きく変わると思います。 1270回目に1が出ることを予測するかどうか なんてのもありますね。

  • sen-sen
  • ベストアンサー率31% (66/211)
回答No.1

1を取る確率が推定法によって異なるかどうかを調べてみたいということであれば、1の値の数を集計してフィッシャーの正確確率計算法を使うか二項分布を使うかロジステイック回帰分析を行うのはいかがでしょうか。

関連するQ&A

  • 散布図における予測値と実測値のばらつきの数値化

    よろしくお願い致します。 異なる3種類の方法で予測をし、予測値を出しました。 それらを実測値と比較するため、散布図をつくり、y=xの直線を引き、見た目ではどの方法が近いかは分かります。 しかし、これを数字でどの方法が実測値に近づくのか示したいのですが、方法が思いつきません。 相関係数は試したのですが、直線上にさえ乗れば実測値から離れていても1に近づいてしまいます。 以下の場合はどうすればいいでしょうか。 よろしくお願いします。 方法(1) 実測値  予測値 80.7  78.8 88.0  75.8 68.8  75.8 51.6  54.9 方法(2) 実測値  予測値 80.7  70.1 88.0  70.1 68.8  70.1 51.6  48.5

  • エクセルで最大列を増やす

    エクセルで最大列を増やす方法を教えてください。 現在,最大の列がIVまでしかなくて困っています。 その為,最大列を増やす方法が知りたいです. また,エクセルのマクロで相関係数算出する際の関数を教えてください. エクセルで使えてた相関係数を算出する関数では出来ないっぽいんで・・

  • 実測値と予測値の同異の検定

    内容を見ていただき,ありがとうございます。 心理学のカテゴリから移ってまいりました。  (前QNo.1479096) 先日,以下の反比例式で予測できる値について,実験を行いました。  予測 : Y=Ax^-1 そして,2つの実験条件で測定を行った結果,以下の2つの式で表せる実測値を得ました。  (式は,Excelの近似式とSPSSにて算出しました)  実測1: Y=0.3x^-0.2  実測2: Y=0.8x^-0.9 これらの式をグラフにプロットしたところ, 予測と実測1は似たような反比例の曲線を描き, 予測と実測2はあまり一致しているようには見えませんでした。 そこで,予測で立てた式と実測で得られた式とが一致しているかどうかについて 検定を行いたいと考えているのですが,どのように行えば良いかわかりません。 愚考の末,対応のあるt検定にかけた結果, 予測と実測1の間はp<.05の差があり, 予測と実測2の間には差がありませんでした。 もちろん,この方法が正しいかどうかについて自信はありません。 このような予測式と実測値の式の同-異について,直接的に検定できる方法をご存知でしたら, なにとぞご教授いただけますよう,よろしくお願いいたします。

  • Q値は計算するの?実測するの?

    この度高断熱高気密住宅を新築中ですが、最後にQ値を測定してもらおうと思って、設計士さんと工務店さんに話したところ、C値は実測してくれましたが、Q値は計算で求めるものだと言われました。 確かに実測は難しいので、多くは計算上算出することが多いようなことが、どこかに書いてありましたが、実際のところどうなのでしょうか?実測する場合はどのように実施するでしょうか? ご存じの方いらっしゃいましたら、教えて頂けると幸いです。 よろしくお願いいたします。

  • 最小値の推定方法について

    現在、別々のシステムにそれぞれある顧客データをつき合わせをしています。 合致度を算出して怪しいデータを絞り込むところまできました。最終的に人間よって同一と判断をするステップを踏む予定にしているのですが、数万件になるため合致度が一定以下のデータに関しては人間のステップを飛ばして同一データなしと判断したいと考えています。 手元に、600件ほどの人間が作業するステップのテストデータがあるので、これから同一データなしと判断する基準点を導き出したいのですが、統計は勉強を始めたばかりで今考えている方法が適切なのかわかりません。 【現在考えている方法】 600件のデータを、60件毎の副標本として10組の標本からなる複合標本とする。 10組から得られる最小値を用いて最小値の平均を算出する。 標準偏差の2倍小さい値を基準点とする。 最小値の推定方法について調べてみてもこれといったものが分からず、複合標本を思いついたのですが、勉強したときは平均に対するもので最小値にも用いてよいのか分かりません。 そもそも発想が誤っているなど、最小値の推定方法に関してのポイントなどありましたら教えていただければと思います。

  • 解析の評価について

    解析がよくできているか検討するため実測を行いました。 測定箇所は20点ほどで誤差の最大は10%くらいでした。 解析を実測の相関係数は0.9です。 測定点が少ないかと思ったのでt検定しました。 母集団が無相関であるという仮説は有意水準0.005(0.5%)に対して 棄却されました。 結局のところCAEの解析値は頼りにならず分布傾向だけみるもんだという 意見を聞いたことがあります。今回相関係数が0.9あったから分布傾向は いいのかなと思います。 誤差の大きさ10%ってどうですかね?自分はこれくらいなら解析はよくできたと いっていいのではないかと思うのですが他人にどうなのと言われました。 こんなもんだと思うと言ったのですが、経験ある方としたら境界条件やメッシュ条件を 見直せと思います? それともやっぱりCAEはそこまで数値を追い求めるものでもないのか? 自分は相関関係がとれたので線形で回帰分析をして補正式を求め、これから測定できない箇所に おいてもこの補正式から推定値を出せばいいかなと思っています。 ただ解析自体の誤差を小さくするのが一番だと思います。 10%なら十分小さくしたかな? それと補正式を使うにも測定箇所は線形の関係がありましたが、別の場所はそうとは限らないと自分で思ってしまいます。 大学でCAEやっていなかったので考え方が適当です。 経験されている方、解析の評価ってどうしていますか?

  • 画像パターンマッチングの演算について

    画像認識のパターンマッチングの中で正規化相互相関法がありますが、 テンプレートとして使う画像と比較画像において、 例えば、「し」という画像のテンプレートに対し、比較画像が「じ」である場合は「゛」が余分にあり正規化相互相関法では相関1になりませんが(背景濃度値は同じとして)、 これを「し」の部分が合致しているため、相関1としたいのですが、何か良い演算方法はありますでしょうか。 つまり、テンプレートに対し全く同じ領域が合致してさえすれば、テンプレートの画素以外にノイズがあっても相関を1としたいのです。 相互相関の手法以外でももちろん結構です。詳しい方ご教授ください。

  • 相関係数について教えて下さい

    算出された相関係数の見方について疑問があります。 知識のある方、教えて頂ければ幸いです。 下のようなデータがあるとします A 100→200→400→800 B 50→100→200→400 C 50→150→350→750 AとB AとC、の数列の相関について考えるとします。 *BとC の相関については考えません。 Aの数列は100からスタートして次は2倍、その次は前の数字の2倍と、倍、倍で増加します。Bの数列は、50からスタートして、次は2倍、その次は前の数字の2倍と、倍、倍で増加します。 AとBは数の増加率が同じ場合です。ここでA,Bの相関係数を 計算すると、1と算出されました。 次にCですが、Cの数列はAの数列の増加する値と同じ値を 加算していきます。Aは最初の100に対して、次は200なので、 100の増加、するとCも、最初の50に対して100増加させています。 2行目以降も同じです。このAとCの相関係数を計算しても、1と算出されました。 AとB の相関係数は1 AとC の相関係数も1 Bと、C の数の増加は明らかに違うのに、両方共に Aに対する相関係数が1と出てきてしまいました。 どのように解釈して良いのか困っています。 私が素人判断で勝手に考えていたのは、 AとBは相関が一致していて、 AとCは増加する傾向は同じであるが、変化量の割合に違いがある為、 AとBほどには相関が高くない数字が出るとばかり思っていました。 相関係数も様々な種類があるようなのですが、変化の量も測定できるような、統計数値はありませんでしょうか?   

  • 計算の仕方

    相関係数のZ-変換を行いたいのですが… rを相関係数とした場合,Z=1/2・loge{(1+r)/(1-r)}という数式も分かっているのですが,そのまま計算式にrを代入しても正しい値が算出されません.ちなみに,例題にはr=0.505の場合Z=0.556となるはずなのですが,全く違った答えになってしまいました… 計算の手順を教えてください. よろしくお願いします.

  • 相関係数の特徴

    A群とB群のデータがある場合、A群の値にB群の値はどれだけ近いか示すために相関係数を用いたのですが、その後、重相関係数があることを知りました。 しかし、相関係数と重相関係数の違いがよくわかりません。 相関係数と重相関係数の違いや、用いるべき現象等について、ご存知の方がいましたら教えてください。よろしくお願いします。