- ベストアンサー
単回帰分析(?)について教えてください
現在、大学院入試の出願のため研究計画を考えているのですが、研究の中でどのような統計的手法を使用したらいいのかがわからず、質問させていただきました。 以下に分析したい内容を書きますが、内容はちょっと置き換えてあるので意味不明な研究になっていますが、ご容赦ください。 Aという人は、食事には主に箸を使います。。 そのAに恋人ができたのですが、その恋人は食事には主にナイフとフォークを使います。 その恋人と長く付き合ううちに、Aはだんだんナイフとフォークを使うことが多くなりました。 このA、Bそれぞれが食事でナイフとフォークを使った回数を数えたデータがある場合(付き合う前~付き合って一年後まで)、このAのナイフとフォークを使用する割合が増加したことは、Bの影響によるものだということは、どのように示せばいいのでしょうか? 一応、予備調査としてデータは持っていますが、大学院に入ったら改めてデータの収集をします。 ただ予備調査の結果として研究計画に載せたいので、実際に分析を行ってみたいと思っています。 統計を学んだことがなく、基礎知識が全くないのですが、一応調べたところでは、単回帰分析というものなのかな?と思いました。 でも、単回帰分析の例をみると、「最高気温とアイス屋の客足」など、二つの変数(?)を比べているのですが、 私の見たいのは、Bと付き合う前のA→付き合って1年後のAへの変化に、Bが影響しているかどうかなので、3つの数字を比べることになると思うので、実際に何と何とで分析をしたらいいのかがわかりませんでした。 もし単回帰分析であっているのであれば、実際にどのような表を作り、何をXにし、何をYに指定して分析を行えばよいのか、 もし単回帰分析ではできないのであれば、どのような分析をすればよいのか教えてください。 思いっきり私事ですが、年明けに出願しなければならず、焦っています。 どうかよろしくお願いいたします!
- みんなの回答 (3)
- 専門家の回答
質問者が選んだベストアンサー
#1です。 >その分析でBの影響だといってもいいものなのでしょうか? 人間相手の統計の場合、実験的に正確に比較する事が 困難なので実例を数多く集める必要があります。 例えば薬の効き目を確かめる医療の世界なら薬を与えた 人が回復しても、もしかしたら自然治癒かもしれませんから 薬を与えた人たちと与えなかった人たちの体調を示す変数の 平均値に差があるかどうかを検定し、それを以って効き目が あったなかったを結論つけると思います。 もっと具体的に標本を集めることができるならBさんのいる いないでダミー変数をたてることも可能かもしれませんし、 質問者さんの言うようにBさんのナイフを使う頻度を説明変数として 付き合いの時間も入れてAさんのナイフを使う頻度との重相関を 取ることも可能かもしれません。具体的な内容が分からないので これ以上は何もいえませんが、現時点では 『過去と現在でAさんのナイフの使う頻度には変化があることが(t検定で) 確認できた。ナイフを良く使うBさんとの付き合いが影響していると 予想される。』ことを根拠に具体的な関係を調べることをテーマと すればよいのではないでしょうか?実際にどのような調査をして 統計を取るかは担当教官との話し合いだと思います。 むしろ大事なのはその研究からどのような結論が導けるか、 それがどれぐらい興味深いかということのはずですので。
その他の回答 (2)
- backs
- ベストアンサー率50% (410/818)
こういう問題は時系列的にデータを取るべきだと思います。単に最初の観測時と1年後の観測時とでのフォークの使用頻度を比較しても、単に1年後にはそういう機会が多かっただけかもしれませんし、そもそもその女性(恋人)の"せい"なのかも分かりませんからね。 もしフォークの使用頻度が増えているかどうかなら、各期間ごとの使用頻度を観測していって、 使用頻度 = 時間 というようなモデルを考えればよいのかもしれません(あまり扱ったことの無い内容なので自信はありません)。ただし、これだと既に述べたように女性の"せい"なのかどうか分からないので、上のモデルに加えて女性の"せい"を説明できる変数を取り入れる必要があるでしょう(それは私が考えることではありませんが)。 というか、既にデータは仮にでもとってしまっているのですね。。。それなら、今はとりあえず対応ありの2条件間の平均値の差の検定を行っておいて、それではどういうところがダメなので~するほうが良いという改良点を書くべきでしょう。 完全に私的な意見ですが、 野間口訳『一般線形モデルによる生物科学のための現代統計学―あなたの実験をどのように解析するか』共立出版 という本を1度は読んでおいたほうが良いですよ。内容は生物学の例で解説されていますが、統計学的な考え方は非常に参考になります。
補足
ご回答ありがとうございます。 > こういう問題は時系列的にデータを取るべき 説明不足ですみません、使用頻度は一か月ごとにとってあります。 > 女性の"せい"を説明できる変数を取り入れる必要 そうですよね・・・。 どうやって取り入れたらいいのか全然わからないのですが、引き続き調べてみます。 本の推薦もありがとうございます。 統計の本はたくさんあり、どれで勉強したらいいものやらわからなかったので、参考になります。
- age_momo
- ベストアンサー率52% (327/622)
全く統計の知識がないなら基礎的な勉強はしてください。 研究に応用するなら必須です。 >Bと付き合う前のA→付き合って1年後のAへの変化に、Bが影響しているかどうか まずは影響があるかどうかを検定する必要があると思います。 とりあえずこの場合に適しているのはt検定だと思います。 参考URLを入れておきます。 回帰分析は影響があることが確認できた後、例えば付き合った 年数とフォークを使う頻度の関係などを定量的に評価するときに使います。
補足
おっしゃる通りだと思います。 あまりに時間がないためこちらで質問いたしましたが、大学院では統計の授業もあるようですし、今後統計の勉強もいたします。 > まずは影響があるかどうかを検定する必要 これは、Aが変化したかどうかということでしょうか? 一応、付き合う前と一年後のフォークを使う割合の変化を、この「対応のある場合の平均値の差の検定をしてみていたのですが、危険率が0.0106となり、有意差があったといえそうでした。 (こういう書き方であっているでしょうか・・・?) > 例えば付き合った年数とフォークを使う頻度の関係 これだと、恋人Bが直接的には分析に入らないと思うのですが、その分析でBの影響だといってもいいものなのでしょうか? たまたまでしょ、とかは言われたりしないのでしょうか? (そういうこともわからなくて・・・すみません。) 私のイメージでは、Bがフォークを使う割合の高低によって、Aの変化への影響の強さを示す数字(?)も変わる、と思っていたのです。 例えば、Bが食事でフォークを使う割合が90%だったなら、「Aの変化に影響を強く与えたと言える」という結果が出るけど、 70%だったなら、「そこそこ影響を与えたかもしれないけど原因は他にもあるかも」、という結果が出るとか・・・。 用語がわからなくて、意味不明なことを書いていると思います。 理解していただけたら幸いです(>_<
補足
再びありがとうございます! 対象者が一人しかおらず、Bさんと付き合っていない人との比較も行えない状態では、回帰分析をしても正確な結果が出ないということでしょうか。 言われてみれば、確かに・・・と思いました。 研究計画書ですので、無理にでも回帰分析やりましたと言ってみたい (アピールとして)気は今もしていますが、実際論文を書くにあたっては意味がないことなのですね。 > 根拠に具体的な関係を調べることをテーマと > すればよいのではないでしょうか? そうですね! 大事なヒントをありがとうございます。 その研究からどのような結論が導けるかが大事、その通りだと思いました。 実際の研究を行う際には、よく考えて分析します。 ありがとうございました。