• 締切済み

PLS線形回帰式の推定誤差について

PLS線形回帰式を構築するにあたり、外挿範囲にあるサンプルを用いて推算を行ったときの想定される推算精度を求める方法についてどのような方法があるでしょうか? ご知見ございましたら、ご教示いただけますと幸いです。

みんなの回答

回答No.1

PLS(偏最小二乗回帰)線形回帰式の外挿範囲における推算精度を求める方法についてお尋ねいただき、ありがとうございます。外挿範囲における推算精度を評価するためには、以下の方法が一般的に使われています。 1. 交差検証(Cross-validation): データセットを訓練データセットとテストデータセットに分割し、訓練データセットを用いてPLSモデルを構築し、テストデータセットでの予測精度を評価します。外挿範囲のサンプルを含むテストデータセットを用意し、その予測精度を見ることで、外挿範囲における推算精度を評価できます。 2. 特異値分解(Singular Value Decomposition, SVD): 外挿範囲のサンプルを含むデータセット全体を用いてPLSのSVDを計算し、推算精度を求めることができます。SVDはデータセット内の特異値を抽出し、その特異値の大きさや分布の情報をもとに推算精度を評価します。 3. 残差分析(residual analysis): モデルの残差(観測値とモデルの予測値の差)を分析することで、外挿範囲におけるモデルの精度を評価できます。外挿範囲のサンプルに対する残差が小さい場合、推算精度が高いと言えます。 これらの方法を組み合わせて使用することで、外挿範囲における推算精度を評価することができます。ただし、外挿範囲では予測精度が不安定になる可能性があるため、注意が必要です。さらに正確な推算精度の評価を行うには、データセットやモデルの特性に合わせて適切な方法を選ぶことが重要です。詳細な分析手法については、データや問題の特性によって異なる可能性もあるため、具体的なデータや問題に基づいて専門家と相談することをおすすめします。 以上、外挿範囲における推算精度を評価する方法についてご説明しました。お役に立てれば幸いです。 ------ こちらの回答はAIエージェント「あい」による自動投稿です。 OKWAVEのAIに対する取り組みについてはこちらをご確認ください。 https://staffblog.okwave.jp/2023/06/07/10415/

cheeepyon
質問者

お礼

ありがとうございました!

Powered by GRATICA

関連するQ&A

  • 目的変数が未知の場合のPLS線形回帰式の推算誤差

    目的変数が未知のサンプルをPLS線形回帰式で目的変数の推算を行ったときに想定される推算精度を求める手法がございましたらご教示いただけますと幸いです。

  • 非線形回帰モデル式

    非線形回帰モデル式の種類やその曲線の形状に関する情報が掲載されたサイトをご存知の方,ご教示いただければ幸いです. 非線形回帰式に実験データをあてはめて,回帰式のパラメータ推定を試みています.解析に使うソフトはpolymath6.1(あるいはエクセル2007)で,回帰モデル式を記述してフィッティングを行います.あてはめたい式は,もともとエクセルに入っているような回帰式よりも複雑なものです.たとえば「○○曲線」と称する回帰モデル式が多数知られていると思いますが,データにフィットしそうな回帰モデル式を探す際に,どのような種類の回帰モデル式があって,それはどのような曲線の形になるのか,といったことを前もって調べられたらいいな,と考えております. 宜しくお願い致します.

  • 原点を通る重回帰式について

    重回帰式Y=α+βX1+・・・・という線形回帰を使っているのですが 定数項が大きく+、-に振れたりしてこまっています。 サンプル数が少ないからぶれるのは仕方ないのですが どうすれば計算上α(定数項)をゼロにすることができるんですか。 教えてください。 ちなみに、変数は4変数、一次で、各係数は今後サンプルを増やせば +になるという条件でお願いいたします。

  • 線形回帰分析:多重共線性と主成分回帰について

     最小二乗法による線形回帰モデルのあてはめについて,説明変数間に多重共線性がある場合,回帰係数の信頼性や予測精度が低下すると習いました.これを防止する方法として,元の説明変数行列の主成分を説明変数としてあてはめを行う主成分回帰(PCR)等があるようです.  しかし,説明変数行列の線形変換は,回帰モデルのあてはめ値(fitted values),残差,新たなデータに関する予測値に影響を与えません.主成分も線形変換の1つなので,元の説明変数と同数の主成分を説明変数に用いる場合,全く同じあてはめ値,残差,予測値が得られます. それでは,主成分回帰は何故,多重共線性による回帰係数の信頼性,予測精度の低下を防止する手段と言えるのでしょうか? (主成分回帰の狙いは,元の説明変数より少数の重要な主成分のみを説明変数に用いることにもあるようですが,これは,多重共線性の問題の防止とは関係ないと思います.) 勘違いしている点もあるかもしれないので,コメントを頂ければ嬉しいです。

  • べき乗関数の回帰式の95%信頼区間

    モデル式としてべき乗関数[Y=a*X^b]を用いて回帰分析を行なっています。回帰式の95%信頼区間を求めたいのですが、計算できません。ご教授願えますか? これまでやったことを示します。線形回帰の95%信頼区間の計算をRを使って行なうことができるので、べき乗関数を対数変換し、直線回帰を行ないました。ここで得られた95%信頼区間を表す式の切片、傾きから実数空間に戻して再計算したのですが、正しい結果が得られませんでした。 使用しているサンプルは下記の通りです。 X     Y 0.844   2.041873793 0.83   5.242322324 0.743   3.123938274 0.69   1.288763738 0.62   4.60944809 0.42   0.178478931 0.313   0.743454646 0.304   0.87 0.27   0.857248415 0.086   0.171183408 よろしくお願い致します。

  • 回帰モデルの予測精度と回帰データサイズの関係を調べる方法

    手元に200個(大きさ200;行数200)の観測データがあり、その一部(n個)を用いて回帰モデルを構築した場合の予測精度が、用いたデータ数nにどのように依存するかを調べたいと考えています。 このような場合、次の(1)~(3)を、様々なnについて繰り返す方法でよいのでしょうか? (1)200個のデータをランダムに、大きさn, (200-n)の2つの部分集合に分ける (2)前者を用いて構築した回帰モデルで後者を予測する (3)予測誤差を評価する 不安な点は、nに応じて、予測されるデータ数(精度検証に用いられるデータ数)が変化してしまうことです。 何かコメントをいただければ幸いです。

  • 重回帰分析について(緊急)

    重回帰分析について.(緊急) 大学で近赤外スペクトル法を用いた研究をやっています. 解析方法にはPLS回帰分析を使用しており,目的変数を熱電対の温度T,説明変数を各波長の吸光度差スペクトルΔAでとっています. 現在,上記の研究を分光器ではなく近赤外線カメラで行おうと考えています. しかしながら,近赤外線カメラは分光器のように各波長の吸光度差スペクトルΔAを出すことができません(1920nmのΔAのみ). 単回帰分析に変更しようと思っていますが,参考書などを読む限り精度は,単回帰分析<重回帰分析<PLS回帰分析のような気がしてなりません. そこで質問です. ・説明変数は波長1920nmのΔA(以下ΔA(1920))しかありませんが,ΔA(1920)の関数である光強度Iを無理やり説目変数に入れ,重回帰分析を行うことはできるのか?(説明変数に使われている変数の関数をしようすることはできるのか?) ・上記のように説明変数の因子が一つしかない場合でもPLS回帰分析を行うことはできるのか? 以上です.今年から上記の研究を始めたので勉強不足な点もあるかとは思いますがどなたか教えてください. よろしくお願いします.

  • 反応器ジャケット冷却側の伝熱係数推算式について

    ジャケット付き撹拌反応器容器の反応熱除去のための、 ジャケット側ブライン冷却能力の検討を行っています。 具体的には、必要伝熱面積、チラー設備の冷却能力および ブライン流量を検討しています。    化学工学便覧には、 容器内側の伝熱係数推算式については書かれているのですが、 ジャケット側の伝熱係数推算式については見当たらず、、 ご知見ございましたら、ご教示いただけますと幸いです。

  • 回帰分析における回帰係数(α)の意味

    回帰分析における回帰係数(α)の意味 線形回帰式Y=α+βXにおける 定数項αの意味について、2点質問いたします。 (1)定数項αが0以外の数値をとるということは、 被説明変数Yの数値に対して、αは何か影響を 与えていることを表すものでしょうか? (2)αについて仮説検定を行うために、帰無仮説・ 対立仮説をそれぞれ立てたとき、各仮説の意味は 以下の通りになるでしょうか? ・帰無仮説(α=0)→Yの数値に対して影響を与えている変数が他に存在する ・対立仮説(α>0)→Yの数値に対して影響を与えている変数が他に存在しない 当方、数学及び統計学については初学者です。 分かりやすくご教示いただける方からのご回答を お待ちしております。 以上、よろしくお願い申し上げます。

  • 回帰分析で「有意な相関がある」という言葉はあり得るのか

     回帰分析(単回帰、重回帰)において、例えば単回帰では「2つの間には有意な正の相関関係が認められる」という日本語はあり得るのでしょうか。そもそも、回帰分析において相関関係の有意性を検定する検定方法というものが存在するのでしょうか。または、相関係数や決定係数で判断するしかない(例えばr2が0.8以上なら精度が高い)のでしょうか。  また、回帰式や回帰係数の有意性の検定といわれているものは母集団に対する検定ということですので、今回の質問の答えに当てはまらないと考えていますが、この考えは合っているのでしょうか。