• 締切済み

行動パターンをグルーピングする統計分析の方法

数十社分、各社数十個の属性データ(金額等の数値)を時系列で年次5年分あります。 この属性データをもとに幾つかの会社のグループに分けられる行動パターンが分析できないかと思案しています。 この場合のパターンとは例えば各種資産の持ち方の時系列での推移がAグループとBグループで異なる傾向がある等です。 単純な相関分析では属性間の相関しかみれず、各社の行動パターンのグルーピングも出来ない気がします。 この場合適切な統計分析の方法を教えて下さい。よろしくお願いします。

みんなの回答

  • ramayana
  • ベストアンサー率75% (215/285)
回答No.1

基本的には、データと対話するしかないでしょう。あるやり方を試してみて、それが思わしくなかったら別のやり方を考える、ということを繰り返すのです。 グルーピングといえばクラスター分析がまず浮かびますが、解釈の苦しい結果に終わることもありがちです。手始めに、こんなのはどうでしょうか。 1 データを単純化するため、ひとまず時系列を無視し、各属性の5年間の平均を使うことにする。 2 平均を使うにしても、属性が数十個あると扱いにくいので、主成分分析により、主成分2つだけ抽出する。各会社の属性を、この2つの主成分に回帰する(主成分スコアを求める)。 3 主成分を2つに絞ったことにより、各会社の主成分スコアを平面上にプロットできる。そのプロット図をみて、グルーピングの見当をつける。そのうえで、2つの主成分だけを使ってクラスター分析でグルーピングする。あるいは、第1象限、第2象限、第3象限、第4象限と4つにグルーピングする。 4 元の数十個の時系列データに戻って、グループごとの特徴(増加/減少や、景気指標との相関など)があるかを確かめる。

kumatotoro
質問者

お礼

ありがとうございます。 時系列推移と属性項目の二つをみてグルーピングする手法を知らないので参考になりました。 確かにクラスター分析で意味ある結果と説明力があるかは分かりませんね。 地道にデータと対話してみます。

関連するQ&A

  • 統計、主成分分析について

     すいません。  勉強中の身なのですが、まだあまり理解度は低いと思われます。  統計学の主成分分析なのですが、  分析内容は  「グループ毎のデータを用意し、そのデータからグループ毎の違いを導き出すことができるか。つまりデータ→グループ分けをして元のグループのようになるか。」  で正しいでしょうか?    例えば、プロ野球選手を  身長、体重、握力、50m走タイム、遠投  などのデータを入れ、  を統計ソフトにかけ、  球団別にうまく分かれるか。  というのは主成分分析ですよね…?  また、上のような主成分分析を試行するのに  考えられる例はどのようなものがあるでしょうか?  データもあれば嬉しいのですが…。

  • 購買に関する統計分析

    統計初心者です。 商品の購買者の特徴を分析したいと思っています。 手元に、サンプルの属性(性別、年収、職業等)と、それぞれのサンプルが購入した品目(複数、かつ品名ではなく、既に類型化済み)のデータがあるとします。このデータから、次の目的で分析を行いたいと思います。 ・購入品目別に購買層を類型化し、どういった層にどういった商品が気に入られているのか、を把握する。 クラスター分析で良いのでしょうか。 宜しくお願い致します。

  • 統計エクセル 量的データと質的データの回帰分析

    エクセル2013を使用している、エクセル統計勉強中の者です。 量的データ(説明変数)と質的データ(予測したいデータ)があり、 質的データを、可能な限り詳細な数値に置き換え、相関関係を調べてみました。 すると、相関係数が0.05という、相関関係がないという結果になりました。 この時点で、回帰分析や予測などは、断念すべきなのでしょうか? 相関がないと考えられた場合の、別の対応方法などがあるのであれば、ご教授お願いいたします。

  • 分析方法はあってるのでしょうか?

     データ分析をしているのですが、「Pearsonの相関マトリックスを求め、直接バリマックス法による因子分析を行った。また、因子2と因子5を組み合わせて右へ25度回転した」と記述のある先行研究に記載されているデータを使って、SPSSで因子分析すると、「この行列は正値行列ではありません」となり、因子分析ができませんでした。ただ、このデータで主成分分析をして、バリマックス回転をかけると、似たような値はえることができました。しかし、因子2と因子5を「組み合わせる」という記述の意味がわからず、困っております。  また、別の先行研究では、「偏差積相関を求め、主成分分析からバリマックス回転によって因子分析を行った」とありますが、そもそも主成分分析から因子分析へと移行することはできないのではないかと思います。  統計処理に疎く、この先行研究ではいったい何が行われているのか、想像がつかず閉口しております。  どなたか、お分かりになる方がいらっしゃいましたら、お教えください。  よろしくお願いいたします。  

  • 相関分析で困ってます;統計初心者です。

    機械の故障発生の分析に統計手法が使えないか検討している者です。 例を上げますと、 ジュースの自動販売機の故障分析で、硬貨やお札を受付けて、何枚目程度で1件の詰まりが発生するのか?という分析です。 1ヶ月間に受付けた硬貨や紙幣の枚数と、詰まりが発生した件数はデータとして持っています。しかし、多くの台数を調べていくと、利用状況が当然ばらばらで、データも1つとして同じ物がありません。 このようなデータに対して、(硬貨・お札枚数)×(詰まりの発生件数)で相関分析(量×量それとも量×質??)を行っても良いものか決めかねています。受付枚数も詰まり件数も正規性がないので、データを変数変換等して正規化する必要があるのでしょうか? (データは詰まりが1~30件、硬貨・お札枚数が1000~5000のように非常にばらついています) なにぶん統計初心者でして、どうしてよいか困っております。ぜひご回答よろしくお願いします。

  • 心理学のデータ分析でどの統計処理を使えばいいのか?

    はじめましてわたしは心理学科の4年です 今現在SPSSで作成したデータを用いて分析しているのですが,どの統計処理を使って良いのか分からなくなっています。 得られたデータとして3つの尺度を用い,ソーシャルサポート尺度10項目、Lyubomirsky Happiness Scale尺度(幸福感)4項目、S-H式レジリエンス尺度3下位尺度27項目をそれぞれ得点化したのですが、どの分析を用いればいいのかわかりません。 仮説では、(1)レジリエンスは,ソーシャル・サポートと相関がある。(これはピアソンの相関分析で行いました)(2)レジリエンス及びソーシャル・サポートが高ければ主観的幸福感は高くなる。(この分析をSPSSでどう分析すればいいのか困っています。) わかりづらい文章で申し訳ないですが、よろしくお願いいたします。

  • どの統計手法を使うのかわかりません

    修士研究真っ最中のものです。 データ分析で迷っています。 以下のような場合、どのような統計手法を用いるべきでしょうか。 二つの集団(生徒と先生)のある行動パターンを知るため、アンケートをとって因子分析し、因子を抽出した これらの因子に、両集団でどのような差があるのか。とくに有意に高い、低いなど際立つ因子はあるか。 ----これを知りたいときに用いる検定はどのようなものなのか、はっきりとわかりません。 ご指南いただけましたら幸いです。 どうぞよろしくお願いいたします。

  • 統計学 クラスター分析について

    動物行動学研究においてアンケート調査のデータ分析を行っています。 質問回答が類似したサンプルをグループ分けしたいのですが、データ尺度が名義尺度と順序尺度が混ざっています。クラスター分析には階層、非階層、Two Stepがありますが、尺度が混合している場合にはどれを使うのが適切でしょうか。データサンプルが2,000近くあり、以前階層クラスターを使おうとした時に明確に結果が出なかったことがあります。 非階層は一般的に連続変数を扱うと言われているようですが、そうなるとTwo stepが適切なのでしょうか。解析ソフトはSPSSを使用しています。どうすべきか分析が進まず、困っています。ご存知の先生がいらっしゃいましたら導いていただけると非常に助かります。どうぞよろしくお願いいたします。

  • 時系列データの統計量

    こんにちは。 いま船の航跡データからクラスター分析を行い、いくつかのルートに分類することを考えています。 クラスター分析を行うために、3次元時系列データ(x座標、y座標、時間)を統計量で処理したいのですが、こういった多次元時系列データの場合にはどのような統計量を使えばよいのでしょうか? 何卒ご指導頂けますようお願い申し上げます。

  • 統計分析,解析法について

    動物行動学の研究でグループを2組(イギリス・日本)に分け前向きコホート研究を予定しています。動物の行動についてPower Pointの講義の後に動物のビデオをを見せ、見る前、後では行動の観察にどのような変化があるかを調査します。この介入(講義)がどれくらい効果があるか、2グループに違いがあるのかをテストするのが目的です。 この場合の分析法としてどの方法が適切かわからず困っています・・・。 カイ2乗検定、Mantel-Henzel検定がいいのか。暴露と非暴露グループには分けていません。このようなデータの解析に精通している方がいらっしゃいましたら適切と思われる分析法を教えていただけると助かります。よろしくお願いいたします。