• ベストアンサー

対象の値を推測するときのパラメータの選別方法

数学初心者です。 現在Rを使って数学を勉強しています。 複数のパラメータ(推測対象データと無関係なデータも含む)から対象データを推定したいとき、 どんなパラメータを使えばよいか悩んだとします。 こういうとき、どんな方法を使用してパラメータを選別すればよいのでしょうか?

質問者が選んだベストアンサー

  • ベストアンサー
  • trytobe
  • ベストアンサー率36% (3457/9591)
回答No.1

数学と言うより、統計学のほうが良いと思うのですが、(R言語もお使いのようですし) 推定には、推定したい項目(目的変数)の数値に関連するのは、測定された項目(説明変数)のどれなのか、 説明変数1つと目的変数の相関係数が高い場合には、 とりあえず目的変数と各説明変数の相関係数を全部算出してみて、横軸に説明変数、縦軸に目的変数、でプロットしたときに、どこかの1データが離れたところにあるせいで相関係数が高いだけのものはそれは除去し、近似した直線にまんべんなくデータがプロットされている項目こそが、近似できる範囲が広い「本命」と言えます。 説明変数1つだけでは目的変数を推定できなくても、近似直線との差を埋めることができる、「第2の説明変数」「第3の説明変数」・・・を見つけるのが「多変量解析」で、 分散分析によって説明変数として有力なもの(F値が高いもの)を順に、近似多項式に盛り込むことで、重回帰分析による近似式を得ることができます。 主成分分析も同様に、重回帰式を得るためにどの説明変数を用いるか、説明変数n個のn次元空間でどのような直線にそって分布しているデータが多いか、という観点で活用できます。

okwaver85758
質問者

お礼

大変参考になりました。 よく読み返して勉強させていただきます。

関連するQ&A

  • パネルデータを使ったパラメータ推定の方法を教えてください

    都市に関する簡単な式を1つ作ったのですが、経済学、数学ともに知識が浅く、パネルデータの処理方法、パラメータの推定方法(通常最小二乗法と一般化最小二乗法の違い)が共にわかりません。80都市×15時点のパネルデータがあります。何かご存知の方、教えてください。よろしくお願いします。

  • 類似度の高いものを取り出したい。

    数学・統計学初心者です。 現在Rを使って統計学を勉強しています。 ある、パラメータA,B,C,D,E,F.・・・・・・を持った対象データがあり、 さらに同じパラメータを持った複数のデータ集団(標本の集団)があったとします。 そのデータ集団から対象データと類似度が高いものを取得したいとします。 以前、類似度を求める場合、対象データと集団との相関係数を求めれば良い、というHPは見たのですが、 この方法だと、各パラメータのデータの分布の大きさが異なれば、変な値が出てきそうな気がします。 かと言って各パラメータデータを正規化しようとすると標本集団のため、どこかのパラメータでばらつきが出てきそうな気がします。 そもそも私には一般的な知識がないので、類似度を求める際、頭の良い人たちがどういった感じで類似度を求めているかわかりません。 このような場合、どうやって類似度が高いものを取り出してくれば良いのでしょうか?教えてください。

  • 時系列データを使ったパラメータ推定

    以前に、時系列データを使ったパラメータ推定について質問させて頂き、有効なソフトを教えて頂いたのですが、そのソフトが周りにないことがわかったうえに、購入する余裕もありません。 私が作った企業の長期利潤に関する式は線形なので、対数をとり、最悪手計算でもできるはずだと考えました。 しかし、時系列データ(80都市×15年)を見ると、例えば一つのx値に対して80都市×15年のy値があるのにパラメータの値が1つだけ推定されるという理論が理解できません。 まず、時系列データを処理して値を絞り、最小二乗法でパラメータを推定するのか、とりあえず80×15のパラメータを出して何か処理をするのかもわかりません。経済学、数学ともに専攻外の大学院生で、困っています。時系列データの処理のしかた、考え方をご存知の方、教えてください。お願いします。

  • 非線形回帰式のパラメータ推定について

    あるデータの予測値がこの関数に当てはまると考え 関数のa,b,y∞のパラメータを推定したいと考えています. そこで実値と予測値の誤差から,最小2乗法を用いてのパラメータ推定は行いました. が,初期値に依存することから,別のパラメータ推定を考えています. そこで最尤法を用いたいと考えているのですが,この場合どのような確率密度関数になりますか. その後パラメータで偏微分を行い,ニュートン法により最適解を求めたいと考えています. こちらの方法も初期値に依存することは理解していますが, 文献より最尤法の初期値は最小2乗法で求めた値を使用しようと考えています. 要はこの場合,最尤法でパラメータ推定はできるのか. どのような手順で行うのか. 最小2乗法と何が違うのか. の回答をよろしくお願いします. また,似たようなことを行っている文献紹介などもしていただけると嬉しいです. 式は,添付ファイルにて.

  • パラメータからの説明についての件

    y=a b*exp(-(x-c)^2/d^2)に実践データを使用しフィッティングを行ったとします。 パラメータ推定の結果 a=6076.4 b=349.5 c=48.9558 d=0.09921 が得られたとします。 ここであるxの値を代入してy1を得ます。 その次に、新たにフィッティングに使用するデータを加えて、 フィッティングした結果、 a=6020.4 b=370.5 c=2.1092 d=0.00028 が得られたとします。 ここで、先ほどと同じxを代入してy2を得ます。 例えば、パラメータcの値が48→2に変わったから、y1→y2のような推移になった。 ということを調べることは可能でしょうか? 可能であればどのような方法がありますか? ※ここで示している値は適当です。

  • パラメータ推定量の共分散

    あるデータ集合Yに対して、AとBの2つの異なったモデルをあてはめるとします。 AとBを規定するパラメータ・ベクトルはそれぞれα、βであるとします。 このとき、同じデータにそれぞれのモデルをあてはめて、最尤推定量αhat、βhat を得たときに、これら推定量同士の共分散を得る方法があるでしょうか? ちなみに、αhatとβhatは陽に得られず、このため、直接に共分散を計算する事は できないとします。 たとえば、一般論として、Fisher情報行列や、スコアベクトルなどを使って導く方法があれば ご教示いただきますと幸いです。

  • FET・トランジスタのSパラメーターについて

    初心者的な質問なのですが、FET・トランジスタのSパラメーターについて教えてください。 1MHZ~2MHZ程度の高周波の増幅なのですが、FETなどでスミスチャートの勉強をしたのですが、Sパラメーターがデータシートに記述されていない場合はどうすれば良いのでしょうか? ネットワークアナライザなどは持っていませんので無理なのでしょうか? 初心者の質問なので的外れかもしれませんが宜しくお願いします。

  • 実験データからモデル式の4変数パラメータ推定方法

    実験データからモデル式の4変数パラメータ推定を MATLAB Global Optimizationツールボックスの patternsearch関数を使用してフィッティングしています。   サンプル毎に重みを適切に設定しないとうまくフィッティングできなく困っています。おすすめの関数や、 なにか、適切なアドバイスがいただたけましたら、 幸いです。

  • 3次元混合正規分布のパラメータ推定

    3次元混合正規分布のパラメータ推定 標本(X,Y,Z,値)が大量にあり、これを3次元の混合正規分布で近似しようとしています。 現在、平均や分散などのパラメータの算出をEMアルゴリズムを用いて行おうと考えています。 いろいろ調べて勉強してみましたが、標本をどのように使えばいいか理解することができません。 この標本はどのような形で式につかえばよいでしょうか? そもそもEMアルゴリズムを用いてこの問題を解くことができるのでしょうか? また、この標本をもとにパラメータを決定する代替方法があれば、教えていただけると助かります。 説明不足な点があるかもしれませんが、よろしくお願いします。

  • CGIから値を得るには

    今、JAVAの勉強をしています。 CGIから送られてきたパラメータを使用して、web上で画像の加工をしようと思っています。 CGIから直接JAVAに値を渡すことはできるのでしょうか? 初心者なのでなるべく詳しくご返答ください。 よろしくお願いします。