- 締切済み
統計 質的変数
Rを用いて主成分分析をしたいと考えています。 37国ある国名を質的変数で表して分析に投入したいんですが、 37ある国名に1番から37番まで順番に番号をつけていき 分析に投入していいんでしょうか。 また、Rが出した分析結果の解釈の仕方がわかりません。 解釈の仕方を教えていただけませんか。 またはそのことが説明されているサイトがあれば教えてください。
- みんなの回答 (2)
- 専門家の回答
関連するQ&A
- 主成分得点から変数の予測
ある変数の共分散行列を用いて主成分分析を行いました。 各サンプルの主成分得点が得られました。 どのサンプルにも該当しない架空の主成分得点から基の変数を予測することはできますか。 例えば、第一主成分が0.1を示し他の主成分は全て0のときの基の変数値を予測するなどです。 可能か否かの概念的な説明に加えて、もしできるのならばR、SPSS、NTSYSなどの統計ソフトを用いた実践的方法も教えていただけるとありがたいです。 よろしくお願いします。
- ベストアンサー
- 数学・算数
- 交互作用項の標準偏回帰係数の解釈の仕方について
重回帰分析などにおいて投入した説明変数の主効果だけではなく,交互作用についても検討したい場合,二変数を掛け合わせた交互作用項を投入するものかと思いますが,その分析結果における標準偏回帰係数の解釈の仕方がいまいちよく分かりません。 主効果と同様,プラスであれば従属変数のプラスに寄与し,マイナスであればその逆であろうと思われますが,交互作用の検討として用いた説明変数1と説明変数2の関係はどうなっているのでしょうか? 符号のプラスやマイナスと関係あるのでしょうか? どなたかご存知の方がおられましたら,ご教授ください。 よろしくお願いいたします。
- ベストアンサー
- 数学・算数
- 重回帰分析で、独立変数を分けて投入したら…
重回帰分析で、独立変数を分けて投入したら、結果を表にする時、R2乗値をどのように記載すればよいのかがわかりません。 独立変数が多く、分けて分析をしたら、その投入した変数によってR2乗値が変わります。しかし、先行研究を見ていると、どの論文でも、結果として載せている表のR2乗値は一つだけです。 私のように、独立変数を分けた場合、どのR2乗値を採用して表に載せればよいのでしょうか? 統計初心者で、的外れな質問かもしれませんが、どうかよろしくお願いいたします。
- ベストアンサー
- 心理学・社会学
- 1変数と複数の変数の相関をみるには
1変数と複数の変数、例えば、「変数a」と「変数b、c、d」の相関関係をみるにはどうすればよいでしょうか? 重回帰分析でもみれますでしょうか? 重回帰分析は、説明変数で目的変数を予測することができるかどうかを分析することだと思いますが、得られた重相関係数と、同時に行う分散分析のP値によって、相関関係の強さをみれるのではないかと思うのです。 最終的には、「変数a」と「変数b、c、d」は"有意"に相関があるといたいのですが、重回帰分析の場合、説明変数と目的変数の方向性の問題もあるので「変数a」⇔「変数b、c、d」とは言えないのでは…と悩んでいます。 「変数b、c、d」を主成分分析で合成してから相関分析をすれば…などいろいろ考えているのですが、分析の精度としてそれでいいのか分かりません。 何卒、アドバイスよろしくお願いします。
- 締切済み
- 心理学・社会学
- 主成分分析でのばらつき
主成分分析において、因子のばらつきが多いところを見つけるには出力結果の何を見ればよいのでしょうか? 例えば、月を変数として、ある商品の価格を全国の都道府県ごとに主成分分析すると、 結果として、固有値、寄与率、固有ベクトル(各月に対して)がでますよね?ここで、全国の都道府県間の価格のばらつきが多い月は何月か見るためには、主成分分析の結果のどこに着目して解釈すればよいのでしょうか? よろしくお願いします。
- ベストアンサー
- 経済学・経営学
- 心理統計に詳しい方へ
数学のカテで同じ質問をしたのですが、なかなか回答がないのでカテを変えて再投稿しました。 研修課題で、商品イメージと商品魅力の関係を調べています。SD法で商品イメージを測り、主成分分析を行いました。 そこで、学生時代に因子分析では因子負荷量の絶対値が0.4未満の項目は削除して因子分析を繰り返すようになど習いました。【質問(1)】「主成分分析」でも同じように項目削除→繰り返しを行うものなのでしょうか? また、二重負荷項目の扱いはどうしたらよいのでしょう? 【質問(2)】項目削除して因子分析を繰り返す理由って何ですか? 因子の妥当性だか信頼性だかが上がるから、習った記憶がありますが、“日常会話”で表現するとどういうことですか? 【質問(3)】この調査の目的は、魅力ある商品開発のために人気商品のイメージを探ることです。この動機だと、そもそも主成分分析と因子分析のどちらが適していたのでしょう・・・? この後、各主成分得点を説明変数、商品評価(良い―悪い)を目的変数にして重回帰分析を行います。 ちなみに、Excelで解析しています。 ドシロートなのにビジネス文書の中で統計プロセスを説明して行かなければならず、四苦八苦しています。親切な回答をどうかよろしくお願い申し上げます。
- 締切済み
- 心理学・社会学
- 主成分分析の変数の減らし方
主成分分析の変数の減らし方についてです。 現在サンプル数200程度、変数30個→5個程度に絞ろうと思っています。 累計寄与率を出すところまではサイトも充実しており理解できたのですが、そこからの変数の減らし方が載っているサイトがほとんどなく分かりません。 数式だけですと理解が難しい面もあるので、できれば具体例を挙げてイメージしやすいもので教えていただけると有難く思います。 サンプル数、変数共にそんなに高いものでなくて結構です。 よろしくお願いいたします。
- 締切済み
- 数学・算数
- 統計 ロジスティック回帰の従属変数
従属変数についての質問。 多変量解析を行う場合従属変数を決めます。で、例えば従属変数が「疾患がある」と「疾患がない」という2値になるものにしようと設定したとします。その場合、変数としては「ない=0」「ある=1」としなければいけないのでしょうか? 自分の考えとしては、たぶんこれはダミー変数だと思いますが、2値だからロジスティック回帰で分析する場合、疾患のある・なしを確率でとらえるなら、確率は0~1までなので「ない=0」「ある=1」としておかなければダメなのでしょうか? 例えば「ない=1」「ある=2」としてはダメなのですか? あと、ロジスティック回帰の結果、従属変数に対する独立変数のそれぞれが調整オッズ比とその95%CIという形でよく論文に表が載せてあるのですが、・・・その解釈の仕方として、独立変数が「男」「女」の場合のような2値なら男より女は相対危険(オッズ比)が「いくらです」。という解釈ですよね。しかし、独立変数が「年齢」や「身長」など連続的な数量データなら、オッズ比に関してどう解釈すればよいのでしょうか? また、「年齢」が例えば4層くらいのわけてあったりもしますが、結局、オッズ比の解釈がわかりません。 結構権威ある先生の論文に年齢のところは「1歳の増加」とか書いてあって、そのオッズ比と95%CIが書いてありますが・・・ 「1歳の増加」? 意味がよくわかりません。連続データの独立変数の場合、「1の増加」に対するオッズ比と解釈しなければいけないのでしょうか?
- 締切済み
- 数学・算数
- 統計学についてお聞きしたいです.
現在,統計ソフトRを使って,プログラムを書いています. 内容は多重共線性問題のあるデータを主成分回帰分析を使って,解決するということをやっています. データはRを使って,変数を数個を発生させ,その中の3つの変数を足すと0になるというデータを使っています.相関関係が高い場合のみの多重共線性のデータは自分のプログラムでうまくできたのですが,線形関係をつくると多重共線性のある変数が0に近づいてしまいます.実際は1に近づくはずなのですが.それがなぜだかが分かりません.どなたかご教授お願いします.線形関係の作り方は平均1, 分散0のデータを発生させ,そのデータをエクセルを使って,並び替えて作ります.その時データは平均1,分散0のままです.また,ヒントとなるようなプログラムやコマンドなどでも全然構いませんのでお願いします.今,3カ月かかってできません.本当に困っているのでお願いします.
- 締切済み
- 数学・算数
- Fujitsu Battery Toolを続けていくと、「このパソコンに搭載されているバッテリーパックは交換対象ではありませんでした。そのままご利用ください。」のメッセージが表示されます。このメッセージが出た場合、バッテリーパックの交換は必要ありません。
- Fujitsu Battery Toolで表示されるメッセージ「このパソコンに搭載されているバッテリーパックは交換対象ではありませんでした。そのままご利用ください。」は無視しても問題ありません。バッテリーパックの交換は不要です。
- Fujitsu Battery Toolを使用していると、「このパソコンに搭載されているバッテリーパックは交換対象ではありませんでした。そのままご利用ください。」というメッセージが表示されますが、バッテリーパックの交換は不要です。
補足
37は多すぎるので4分類してみました。 Rを使っているんですが、これをカテゴリー変数だと認識させるにはどうしたらいいでしょうか。 青木先生の本を見て真似たのですが、データをインポートした後に df[,1]<-factor(df[,1],levels=1:4,labels=("a","b","c","d"))と スクリプトウィンドウに入力すればいいんでしょうか。