• ベストアンサー

実測値と予測値の同異の検定

内容を見ていただき,ありがとうございます。 心理学のカテゴリから移ってまいりました。  (前QNo.1479096) 先日,以下の反比例式で予測できる値について,実験を行いました。  予測 : Y=Ax^-1 そして,2つの実験条件で測定を行った結果,以下の2つの式で表せる実測値を得ました。  (式は,Excelの近似式とSPSSにて算出しました)  実測1: Y=0.3x^-0.2  実測2: Y=0.8x^-0.9 これらの式をグラフにプロットしたところ, 予測と実測1は似たような反比例の曲線を描き, 予測と実測2はあまり一致しているようには見えませんでした。 そこで,予測で立てた式と実測で得られた式とが一致しているかどうかについて 検定を行いたいと考えているのですが,どのように行えば良いかわかりません。 愚考の末,対応のあるt検定にかけた結果, 予測と実測1の間はp<.05の差があり, 予測と実測2の間には差がありませんでした。 もちろん,この方法が正しいかどうかについて自信はありません。 このような予測式と実測値の式の同-異について,直接的に検定できる方法をご存知でしたら, なにとぞご教授いただけますよう,よろしくお願いいたします。

質問者が選んだベストアンサー

  • ベストアンサー
  • selfer
  • ベストアンサー率76% (104/136)
回答No.2

こんにちは。心理学カテゴリで投稿されている時から質問を読んでいました。 気になっていたのですが,質問者さんは何を調べられようとしているのでしょうか? 確かに質問タイトルには「予測値と実測値との同意の検定」とは書かれています。このタイトルを見たときには,「a)予測値データと実測値データがどの程度一致しているのか?」を調べたいのだと思いました。その場合であれば,下記の(1),(2)のいずれかを行えばよいと思いました。 (1)「予測値と実測値の相関係数を求める,この相関係数が有意であるかどうかを調べたいのならば相関係数の有意性判定」 (2)χ2の適合度検定 しかし,質問を読んでみると,予測値と実測値の一致性というよりは,「b)複数の予測式の中で最も精度が高い式を選ぶ」ということに関心があるように思われます。 目的(a)と(b)は一見似たようなものと思われるかもしれませんが,明確に異なります。統計学的に考える場合,両者のどちらを調べるかを明確にしなければなりません。 さて,後者の(b)を調べたい場合。予測式が似ているかどうかを調べると言っても,係数が異なるわけですから直接的に式を比較することはできません。そこで,「複数の予測値のうち,実測値をなるべく的確に調べているものはどれか,予測の説明力(適合度)はいくらか?」という適合度指標の考えを導入して考えざるを得ないと思います。適合度指標としてたくさん開発されていますが,有名なものに(基本的なものに)AICがあります(専門書を見て下さい。今ではAICを改良したものとして多数の指標があります)。 * ただし……本来,実測値データの式を作ると言うことはしません。式を作っても,その式では説明できないロスト情報を生んでしまうからです。 しかし,正直意図がよく分かりませんが,質問者さんがどうしても実測値の表現式を作りたいならば,この表現式を予測式とみなして,他に作った予測式とで比較するという方法を思いつきました。 そして,表現式と予測式1と予測式2のAICを求めて,このAICという情報量がχ2分布に従うことを利用して,「表現式-予測式1」と「表現式-予測式2」の有意差検定を行い,有意差がないペアの予測式を表現式と類似していると考える……という判断を行うやり方があるかもしれません。 説明している本人がいうのもあれですが,正直*の方法で精度の高い予測式を選んだ研究報告を出されても,「何で,実測値データを式に変換するんだ?」と考えてしまうと思います。実測値データの表現式を使う方法を,私ならばしないと思います。

Caryo_t
質問者

お礼

丁寧に回答いただき、ありがとうございました。 教えていただいたことをもとに、『適合度指標』について、調べてみたいと思います。 ご教授、本当にありがとうございました。

その他の回答 (1)

  • age_momo
  • ベストアンサー率52% (327/622)
回答No.1

予測される式があり、実験結果があるのなら通常は予測される式に回帰して、その相関係数を検定するのではないですか?

Caryo_t
質問者

補足

回答いただき、ありがとうございます。 ただ、予測式に回帰する方法が分かりません。 もし、その方法が掲載されている本などご存知でしたら、教えていただけますと、大変ありがたいです。 よろしくお願いいたします。

関連するQ&A

  • 予測値と実測値の同異の検定

    現在,以下のように表せる2つのデータの間に差があるかどうかを調べたいと思っています。  データ1:Y=Ax^-1  データ2:Y=0.8Ax^-0.9 なお,データ1は予測値,データ2は実測値です。 2つの違いは,データ2(実測値)の曲線の方が若干緩やかであることぐらいです。 2つの式に近似曲線を当てはめてr二乗値をとって比較するのではなく, もっと直接に2つの曲線を比較したいのですが,方法はありますでしょうか。 なお,現在のところ,両者をt検定にかけて有意差が無いという結果を得ているのですが, この方法は間違っていないでしょうか。併せてご教授いただけると幸いです。

  • 予測濃度と実測値の比較方法 検定、相関

     地下水の汚染物質の濃度分布をある方法で予測しました。実測値がある地点(20地点程度)について予測値との比較をして予測方法の妥当性を検討したいと思っています。何かいい方法はありませんでしょうか。とりあえず思いつくのは実測値を横軸、予測値を縦軸に取って散布図を作って相関を見てみようかというくらいしかありません。何かの検定で統計的に実測値と予測値はよく一致しているというように言えるようだといいと思うのですが。。。回答よろしくお願いします。

  • 散布図における予測値と実測値のばらつきの数値化

    よろしくお願い致します。 異なる3種類の方法で予測をし、予測値を出しました。 それらを実測値と比較するため、散布図をつくり、y=xの直線を引き、見た目ではどの方法が近いかは分かります。 しかし、これを数字でどの方法が実測値に近づくのか示したいのですが、方法が思いつきません。 相関係数は試したのですが、直線上にさえ乗れば実測値から離れていても1に近づいてしまいます。 以下の場合はどうすればいいでしょうか。 よろしくお願いします。 方法(1) 実測値  予測値 80.7  78.8 88.0  75.8 68.8  75.8 51.6  54.9 方法(2) 実測値  予測値 80.7  70.1 88.0  70.1 68.8  70.1 51.6  48.5

  • 実験データの検定方法について(数式の比較)

    実験データの検定についての質問です. ある実験を行うときに,実験結果はy=a*x^nという冪法則になるという理論があるとします(xは実験から得られる数値,aは定数,nは実験材料によって異なる冪指数(材料によって0.1~10程度まで異なる)). 実際に実験をし10個のデータをとりその近似曲線をとると,材料Aではy=1.5*x^(2.3)となり,材料Bではy=1.3*x^(1.06)になりました. このときに実験Bの冪指数nは1に近いために今回行った実験範囲ではyとxを比例関係に近似することもできるのではないかと主張したい時はどのような検定を行えばよいでしょうか. 初めは10個のデータの y(冪関数に従う時y=1.3*x^(1.06))と,y(xと比例関係にある時y=1.4*x) のデータの平均,分散を取りt検定によって有意差があるか調べたらよいのではないかと思ったのですが,数式同士の比較を行うときにt検定をしてもよいのかが分からず質問させてもらいました.

  • 実測値に5以下がある場合のχ2乗検定 残差分析

    実験結果を分析するため2×6の分割表を作りました。 この分割表でχ2乗検定と残差分析を行ないたいと思っています。 ですが、実測値に0や5以下の数字があります。 この場合はどんな検定を使って有意差を見たら良いのでしょうか? よろしくお願いします

  • グループごとの度数について順序性を検定する方法を教えてください。

    学年毎に何らかの度数を算出し、その割合が 学年と比例(または反比例)した順序性があるか? また、その有意差について検定するには どのようにしたらよろしいでしょうか? 初学者です。SPSS14.0を使用しています。 やや急ぎで教えていただけましたら、大変助かります。 よろしくお願いいたします

  • LSDの下位検定の書き方

    こんにちは、今夜も再び卒論の事で質問させて下さい。 その前に前回の質問にお答えいただいたselferさん、backsさん、 sismoonさん、ありがとうございました。 なんとか自力!?で結果の章まで書き終えて担当教授から ある部分を書き終えたらOKだというサインを頂きました。本当に感謝しております。 さて今回の質問ですが、そのある部分についてです。 それは下位検定の表記の仕方。 spssで分散分析して有意と出た後、どことどこの間に有意な差が出ているのかを調べるためLSDの下位検定をやりました。 例のごとくズラーッと表みたいなんが表示されて、下の方に ペアごとの比較で実験開始直前、10分後、終了後、終了5分後の4つの時間の間でどことどこに有意な差が出ているかを示す表が現れました。 おそらくここの有意確率を見れば良いと思うのですが、論文に結果を書くにあたりどのように書いたらいいのかさっぱり分かりません。 分散分析みたいに(F(○、○=○P<○))と書くのでしょうか。 ですがその場合F値が表には載ってないし。。 実は3回生の頃の自分の実験論文を読みあさったりしたのですが、当方かなり不真面目学生だったもので分散分析が有意であるのにもかかわらず下位検定をしてなかったりともうめちゃくちゃの論文で、まったく参考になりませんでした。ですが最後の卒論だけは真面目に友達の力を借りずにやりたいと思っております。 もしよろしければ下位検定の表記の仕方を教えて頂けないでしょうか。 LSDの下位検定を行った結果SPSSで出力されるのは 平均値の差と標準誤差と有意確率と下限と上限です。 このうつ”どれ”を”どうやって”論文に表記すれば良いのでしょうか。よろしくお願いします。 確か分散分析と同じ書き方ではダメだったと思います。 またそうであったとしてもF値が乗っていないので書きようがありません。

  • カイ二乗検定の多重比較について

    SPSSで4×4の名義尺度のカイ二乗検定を行ったところ、Pearsonのカイ二乗検定で5%水準で有意差が出たと出力されました。 そこで質問です。 1.この結果は4×4のデータのどこかの組み合わせに差があるということを表している、と解釈していいのでしょうか? 2.差があるとすれば、どれとどれのデータの間の差なのか知りたいので、分散分析のように多重比較をする方法があるのでしょうか? ご指導お願いします。

  • ランキングに関する統計検定

    現在、ある2つモデル式によりWebサイトの評価のスコアを導き、ランキングしたデータがあり、それに関する検定を行いたいと考えています。 いくつかのWebサイト(a1,a2,・・・,an)に関して2つのモデル式X,Y別々に算出して、それぞれランキングを算出しました。 X[a1:1位,a2:5位,・・・an:20位] Y[a1:3位,a2:4位,・・・an:19位] 最初、各差分(a1のXランク-a1のYランク)をとって分散を求めて2つのモデル式が似ているか否かの判定を行おうとおもっていました。 結果としてX,Yの両モデルではランク付けした結果が似ているというような結果がでるはずなのですが、それをどのように有意であるか検定したいのですが、その手法がわかりません。 つたない文章で伝えきれているかわかりませんが、是非ご教授いただけたら幸いです。 よろしくお願いします。

  • 重回帰分析で得られた予測式の妥当性について

    ある集団のデータから重回帰分析である値の予測式を作成しました。 その予測式を他の集団に当てはめてみましたが、その予測式が妥当か否かはどう判断したらよろしいのでしょうか? 予測値と実測値で有意差がなく、有意な相関があればいいのでしょうか?