• ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:重回帰分析と数量化理論(1)類の両方を一緒に使いたい時は?)

重回帰分析と数量化理論(1)類を組み合わせてスポーツのタイム予測をする方法は?

tabaの回答

  • ベストアンサー
  • taba
  • ベストアンサー率61% (349/567)
回答No.2

何のために分析をされるのか分かりませんが、例えば大学などの論文や、ビジネス上の判断材料にしようとするのであれば、専門家に相談することをお勧めします。失礼な言い方で申し訳ないのですが、補足欄に書かれているコメントを読む限り、正しい分析をすることは難しいと思います。 多変量解析は、手法の適用も大切ですが、入力する変数の取捨選択(試行錯誤)や、結果的に出てきたモデルの誤差などを読む力が無いと、使えるとは言えません。「タイムに影響するのは、1に○○、2に△△、…」と書いたところで、ちゃんとプロセスを見る力がある人がデータを見れば、穴がいくらでも見つかるものです。 連続変数(←→離散変数)というのは、量的変数(←→質的変数)と同じで、身長や体重のように連続する変数です。 >天気やその他の変数だけでタイムとの関係を見ることは、距離によってタイムが大幅に左右されるので、あまり意味がなさそうです。 よく分からないのですが、距離が長くなればタイムが伸びるのは当然です。もし、距離「以外」の要素だけの影響を解析したいというのであれば、同じ距離のデータだけを分析するか、距離の影響を除くような加工(例えば100mあたりタイムとか、標準タイムからのプラスマイナスとか)をするとかしないと駄目ですよね。しなければ「距離」が最も大きな要因になるのは当たり前で、ならなければその分析は間違いでしょう。普通は距離が一番大きな要因であることは自明で、2番目の要因が何かを探るのではないですか? >例えば重回帰で数値を持っている変数で予測式を出し、それにI類で出した式をなんとか組み合わせることはできないのだろうか これはできません。多変量解析というのは、そもそも2つ以上の変数(=多変量)が、どのように1つの被説明変数に影響を与えるかという構造を、一度に分析するためにあるのです。Xという被説明変数をA,B,C…という説明変数で説明しようとするとき、問題なのはAとB、AとC…などの説明変数内の相互に相関が存在してしまうということです。これを加味(というか排除)しつつ、Xに対するA,B,Cそれぞれの「単独の」影響力を測定するために、多変量解析の手法が存在するのです。 ↑もしこの文章で言っていることが初耳なら、悪いことは言いませんから書籍等で勉強することをお勧めします。入門書としては、少し古いですが、以下の本がいいかもしれません。 ★創造の方法学(講談社現代新書 553) 高根 正昭著

nst-silver
質問者

お礼

度々のご回答ありがとうございました。 スキーレースでこの人であれば順当にいけばこのコースでどのくらいのタイムで滑れていただろうかと予測したいと思って何とか予測式がたてられないものかと考えた次第です。 距離が一番大きな要因で・・という点で例えば100mあたりタイムで分析するということにまるで気づいていませんでした。 このことと、天候や雪面の状況(これはあくまでもアバウトな人の感覚に頼ったwetであるとかsoftといった表現での状況ですが)の各々のケースに分けてもう一度、その他の変数(標高差や旗門の数)などから分析をしてみます。 無論、雪面をスキーの板が滑る際に発生する摩擦熱で雪が溶け・・・・といった、とても難しい領域に入りきれるはずもなく、また、あくまでも人が滑るタイムのこと。技術面のバラツキやコースのセットの難易度などまで考えれば、到底数式だけで表すことができるわけもないのですが、私が得ることが出来る変数を使ってある程度の傾向をみて「大体この程度のタイムならはずれじゃなさそう」という予測式をたてられるよう頑張ってみます。 教えていただいた本、探してみます。もっとちゃんと勉強します。 ありがとうございました。

関連するQ&A

  • 重回帰分析と数量化理論について

    データ分析を行っているのですが、例えば売上を分析するときに、説明変数として気温などの量的データと曜日や天気などの質的データ(ダミー変数を用いる)を一緒にしてExcelの回帰分析の機能を使用し分析することは、数量化理論(1)類といえるのでしょうか?それとも重回帰分析というのでしょうか?それとも他に呼び名があるのでしょうか?

  • 重回帰分析で

    「エクセル多変量解析」というソフトを使って重回帰分析を行おうとして、データの範囲を指定したのですが、「サンプル数(時期数)が足りません!」というメッセージが出て計算ができませんでした。重回帰分析に最低限必要なサンプル数というものがあるのでしょうか。  私は文系の学生で数学的なことは良く分かりませんが、よろしくお願いいたします。

  • 重回帰分析と分散分析

    R≒0のとき、p値が有意であることは何を意味していますか 分散分析の帰無仮説は全ての係数が0であるですが、 Rがゼロに近いとき、p値が有意になることはありますか 持っているデータで回帰分析を行ったところ R=0.11xx、R2=0.012xx、P<0.001xx となりました。これは、相関がないことを示しているのでしょうか。 それとも弱いながらも相関があることを示しているのでしょうか。 よろしくお願いします。

  • 【統計学】重回帰分析と正準相関分析の違いを教えてください。

    統計学初心者です。 文系でも分かる統計学といった類いの本を 読んでいるのですが、重回帰分析と正準相関分析の違いが分かりません。どうも同じように思えてしまうのですが・・・ 素人なので分かりやすく説明してください。

  • 重回帰分析による売上予測について

    洋菓子屋の日々の売上データを基に重回帰分析を行い、 説明変数を入力することによる売上予測を行いたいと考えておりますが、 説明変数に「気温」を採用する際の「季節」の扱いに悩んでいます。 現在の変数候補は下記の通りです。(天気/気温は気象庁の過去データより引用)  ・天気(晴れ/曇り/それ以外)  ・最高気温、最低気温  ・曜日  ・季節指数(過去4年間の売上を元に作成) 例えば12月の売上データを元に重回帰分析を行ったところ、 「天気」より「最高気温」を変数にしたほうが相関関係が強いことがわかりました。 ところが、気温は季節によってその値の持つ意味が変わってきます。 冬の間は「暖かいほうが客の入りもよく売れ行きが良い」と考えられ、 「最高気温」変数が「高い」ほうが売上は向上します。 一方、夏になると「涼しいほうが売れ行きが良い」となることが予想され、 単純に「最高気温」を変数に用いることはできないと考えられます。 気温の絶対値でなく「季節に応じた快適気温」からどれくらい乖離しているかで求めるなども考えてみましたが、いまいち強い相関関係が得られませんでした…。 どなたかこういった場合の対処、お知恵おもちでないでしょうか。 宜しくお願い致します。

  • 重回帰分析かロジスティク分析か?

    多変量解析で、教えてください。 20人のケースで、Xという現象がー100~100%の幅で、増減したとして、事象A,B,C,D.E.Fが関与しているかどうかを調べるとします。 それぞれが、それぞれA~Fの現象と、変動率を散布図にて、表示すると、A,B.Cで相関があり、相関係数は R=±0.4~0.7でした。D,E.Fは、r=0.2以下でした。 単回帰分析をすると、要因A,B,Cでの回帰式は、有意とされました。A,B.Cの要因がどの程度のつよさで、Xという現象に関与しているかを調べる必要があるとすると、多変量解析をする必要があると思いますが、 その方法論として、X現象に対する重回帰分析が良いのか、X現象が増加するか、減少するかという現象に置き換えて、ロジスティク回帰分析の方が良いでしょうか? それとも、症例数から言うと多変量解析は無意味でしょうか? また、もし重回帰分析、ロジスティク回帰するとすると、A~F全て組み込むのか、単回帰で、有意だったA~Cだけで良いのでしょうか? 見よう見まねで、A~Cだけで重回帰すると、分散分析ではすべて有意でしたが、回帰式では、A,Bの組み合わせでは、A、B共に有意、A~Cの組み合わせだと、Aだけ有意とでました。この所見の記載として、 単変量解析では、A,B,Cが有意だったが、多変量解析では、Aのみが有意であるとして良いのでしょうか?

  • エクセルでの重回帰分析が上手くいきません

    エクセルにて重回帰分析を行っています。下記の状況になりますが何が原因か、また、対策はどうすべきかご教授ください。 <元データ> ・説明変数16個 <エクセルの統計データ機能を使用した結果> 回帰統計 重相関 R 1 重決定 R2 1 補正 R2 65535 標準誤差 0 観測数 3 分散分析表   自由度 変動     分散    観測された分散比 有意 F 回帰 16  1.646666667 0.823333333 #NUM!     #NUM! 残差  0    0     65535 合計  16 1.646666667 t値 65535 P値 #NUM! 以上です。 どうぞよろしくお願い致します。

  • 回帰分析について教えてください

    統計に関する質問です。 私は勤務先(金融)で特定の業種の財務分析をしているのですが、データの分析方法(回帰分析)で分からない点があります。 具体的には下記の通りです。 【状況】 ある業種業界について、2つのデータ(例えば、総資産と売上高)を収集しました。 データは5年間分をパネルとして扱っており、総数は400くらいです。 2つのデータ間に何らかの関係をあると考え、総資産を横軸、売上高を縦軸、としてエクセルで散布図を作成したところ、右上がりの関係があるように感じました。 エクセルの機能で近似値線(直線)を引いて、算式とR2を表示したところ、算式の傾きはプラスで、R2は0.2程度でした。 その後、回帰分析を行い、分散分析表を作成しました。 相関係数の有意性を検定したところ、1%水準で有意な関係、となりました。 回帰係数も検定したところ、1%水準で有意な関係、との結果でした。 【私の主張】 私は「統計学的に考えて、総資産の増加に伴い売上高が増加する傾向がある」と述べたいのですが、 (なお、背景にある理論は別途構築しており、業界内でも理解が得られると思われます。) 【ご質問】 1. 回帰分析の結果から、回帰直線の傾きがプラスで、相関係数の関係が1%の有意水準で有意であることから、統計学的に私の主張は正しいと言えるのでしょうか?評価は個人ですべきものだとは存じますが、考え方・説明方法に無理があればご教示をお願い申し上げます。 2. もし、上記1の質問が的外れであれば、どのような点がおかしいのでしょうか。ご教示いただきますようお願い申し上げます。 抽象的な部分もございますが、何卒ご教示のほど、お願い申し上げます。 【前提】 上記は私の職務柄、個人で利用する目的で作業を行っています。 論文その他レポートの作成を目的としておりません。

  • 回帰分析の論文の書き方について質問です。

    回帰分析を使用して論文を書くことになりました。 回帰分析は習ったことがないので、独学でやっています。 論文を書くときに回帰分析に結果としてアスタリスクのついた表を作成しないといけません。 *** p<5%←こういうのが表の下についたものです。 これは、Excelの分析ツール「回帰分析」を使用し分析した時に、どのデータ(数字)を使用すればいいのですか? また、XとYの散布図を作成したいのですが、こちらもどうやれば良いのか分かりません。 恥ずかしながら、初心者同然なので分かりやすい回答お願いいたします。 ちなみに、相関するかしないかという分析をしています。 よろしくお願いします

  • エクセル 重回帰分析 補正R2の数値について

     エクセル(2007)  データ分析ツールを使い重回帰分析を行いました。  そうすると、 【 回帰統計 】  重相関 R    1  重決定 R2 1  補正 R2  65535  標準誤差 0  観測数 9 と表示されました。 以前参考にした資料には「補正R2は1に近いほど良い」と書かれていましたが、 今回の「65535」と、1をはるかに超える数字はどの様に解釈すればよろしいのでしょうか? 何卒よろしくお願いいたします。