• 締切済み
  • すぐに回答を!

多変量解析のサンプル数の妥当性

こんにちは。重回帰分析を実施して一応,よい精度(決定係数)が出たのですが,この時の解析対象サンプル数は300でした。これのサンプル数を1000とか2000に増やすと,当然かもしれませんが,精度は下がりました。重回帰分析等におけるサンプル数の妥当性はどのように判断すればよいのでしょうか?いくつ以上が妥当というような目安があるのでしょうか?

共感・応援の気持ちを伝えよう!

  • 回答数1
  • 閲覧数1633
  • ありがとう数0

みんなの回答

  • 回答No.1

サンプル数を増やして、精度が下がるのならば 増やす前のサンプル増やしたサンプルが、サンプルとしての適性を欠いている と判断すべきです(母集団を代表していない) 対象範囲を決めることも重要です、むやみに広範囲のデータを扱うと結果はおかしくなります きちんとした検定を行ってください 参考までに 外挿検定を行っていますか 9割程度のサンプルで回帰係数を計算し、その式を除外したサンプルに適用して精度を見る方法です

共感・感謝の気持ちを伝えよう!

関連するQ&A

  • 多変量解析の理解はどれくら時間かかる?

    統計学は難関です。 医療統計で使う簡単ないくつかの検定などはだいたい理解できました。実践もだいたいできると思います。t検定や分散分析程度です。 しかし、もっと難関な重回帰分析?これを理解する必要があります。重相関係数R? 決定係数R^2 ? 線形? まあ、勉強するつもりですが、これらを理解するのに今から始めたらどれくらいの時間と労力がかかりますか? 数学は、高校レベルの簡単な微分積分や行列などはだいたい覚えています。最近、正規分布やt検定など、だいたい勉強しました。だいたい理解できていると思ってはいますが。。。 目安として、多変量解析は毎日4~6時間勉強したとして2週間程度でだいたい理解することは可能でしょうか?

  • 重回帰分析における効果量と決定係数は違いますか?

    重回帰分析について質問があります。 重回帰分析において効果量と決定係数は違うものでしょうか? というのは、表記の仕方はどちらもR2なのですが、効果量に関するCohenの基準をみると、0.3くらいで中程度の効果量があると説明されており、決定係数の説明を見ると、重回帰式の当てはまりを示すもので一概には言えないが0.6-0.7くらいあるといい(6,7割説明できることになる)と書いてあり、同じ表記なのに、解釈が別々になっていてよくわかりません。 効果量と決定係数の意味の違いを理解していなくて恐縮ですが、このあたりの考え方の違いを含めて教えていただけるとありがたいです。

  • 重回帰式の応用

    重回帰分析の結果と回帰式の使い方、応用の方法について質問です。相関係数0.85、決定係数0.72と出たのですが、全部で7つの説明変数のうち6つは有意ではありませんでした。多重共通性の問題に該当する説明変数を省き、再度分析したのですが結果として有意と判断されるのは1つの要因のみでした。そこで、その1つの要因に対して単純回帰分析を行うと相関係数0.72、決定係数0.51と重回帰分析よりも数値が低下してしまいました。この場合有意性の問題を無視し、はじめの重回帰式を用いて被説明変数を求めること(有意ではない説明変数を多く使うことで、被説明変数の誤差を少なくすること)に何かしらの問題はありますでしょうか? 素人のため質問内容がわかりにくかったら申し訳ありません。よろしくお願いします。

  • 多変量解析の使い方を教えてください。

    多変量解析の方法について質問です。 当方、統計学は素人です。ご協力お願いします。 都道府県別合計出生率と食品の消費量との相関を解析するには多変量解析のどの解析方法をもちいればよいのでしょうか? みたいのは、都道府県毎の酒類(清酒・ビール・焼酎など)消費量と合計出生率の相関です。 フリーソフトで重回帰分析など試しましたが、結果の見方すら分からない状態です。 (1)分析方法の選択 (2)結果の見方 以上2点、よろしくご教授いただけませんか? 何卒、ご尽力の程よろしくお願いします。

  • 重回帰分析について

    お世話になります。 階層的重回帰分析において、決定係数が0.253→0.431→0.468とあがっていきます。 そこで、最後の0.468という決定係数は、まだ説明できる要因が他にもあるということでしょうか?段階的に説明力の向上はあると言えると思いますが、他にも「関係があると否定できない」項目があることについて言及する必要はありますか? 全ての決定係数はp<0.001となっています。 どなたか詳しい方、お願いします。

  • 多変量解析・重回帰分析・クラスター分析

    こんばんは。 多変量解析と重回帰分析とクラスター分析について勉強したいのですが、素人でもわかりやすく解説したサイトと書籍をご存知の方、教えてください。 よろしくお願いします。

  • マーケティングで用いる多変量解析

    現在、マーケティングを勉強しており、それに伴って多変量解析を勉強している学生です。 質問は 『実際のマーケティングの現場で主に使われている分析方法はどのようなものなのでしょうか?(3つ程度を目安に挙げていただきたいです)。』 ということです。 回帰分析、因子分析を勉強し、今は共分散構造分析を勉強しているのですが、実際にマーケティングの現場で使われているのは共分散構造分析がほとんどなのかなと思い質問しました。必要であればクラスター分析などのほかの手法を学ぶつもりなので、その参考のために現場で本当に必要な手法を教えていただきたいです。 どなたかお詳しい方、お忙しい中申し訳ありませんが、よろしくお願いします。

  • 重回帰分析について

    重回帰分析で、増減(ステップワイズ)法を選んだ際の結果として、変数A-Fのうち、変数A-Dがモデルに含まれました。その中でABが偏回帰係数が有意でした。CDについては有意でありません。なぜ、CDはモデルに含まれるのですか?これを抜いたらモデルの適合度(決定係数)が下がるからでしょうか。有意でないなら最初から含まなければいいのに、と思います。

  • 回帰分析で「有意な相関がある」という言葉はあり得るのか

     回帰分析(単回帰、重回帰)において、例えば単回帰では「2つの間には有意な正の相関関係が認められる」という日本語はあり得るのでしょうか。そもそも、回帰分析において相関関係の有意性を検定する検定方法というものが存在するのでしょうか。または、相関係数や決定係数で判断するしかない(例えばr2が0.8以上なら精度が高い)のでしょうか。  また、回帰式や回帰係数の有意性の検定といわれているものは母集団に対する検定ということですので、今回の質問の答えに当てはまらないと考えていますが、この考えは合っているのでしょうか。

  • パス解析

    パス解析って、どういった分析なのですか?SPSSでも出来るものなのですか?私は論文でパス解析の結果の図しか見たことないので、どういったものなのか知りたいです。今のところの私のパス解析による分析に対する結果の解釈方法は、重回帰分析の繰り返しを行っているといった感じです。ただ、実際にSPSSなどを使って重回帰分析を繰り返しやっていると、場合によっては恐ろしく手間がかかると思いますので、専用のソフト(フリーを含む)などで出来るものはないのかと思っています。宜しくお願いします。

専門家に質問してみよう