• 締切済み

統計 多変量解析か決定木か

統計の分野かどうかはわかりませんが、お教えください。 数値では無く、下記のようなデータがあったとします。 クレームの件数,湿度,気温,季節,地域 クレーム高,湿度高,気温高,夏,XX市 クレーム高,湿度高,気温低,夏,YY市 クレーム低,湿度低,気温低,冬,ZZ市 ・・・ クレーム高い、低いはどのような条件下で多いのか知りたいと思っています。 統計的手法?で解決できないでしょうか?例えば上のデータから暑い時はクレームが多いんだな、寒い時はクレームが少ないんだなといった情報を読み取れたら便利だなと考えています。 宜しくお願いします。

みんなの回答

  • Gletscher
  • ベストアンサー率23% (1525/6504)
回答No.1

多変量解析と言っても十数種類ありますが、どれのことを言っているのでしょう? クレーム件数も温度も湿度も数値データーですが、数値ではないと言っているのが分かりません。 暑い/寒いは感覚的な判断ですから人によって違うし、まして故障解析なら人間の感覚ではなく、商品にとって暑いか寒いかであるはずだけど、人ではないので暑さ寒さは感じません。 数値化されていないデーターで共通性などを見つけたいとゆうことであれば、私なら数量化1類か、数値化して主成分分析でやるでしょうね。

関連するQ&A

  • ACCESS もしくはEXCEL条件によってコピー

    ACCESSもしくはEXCELで 口数の数量と同じようにそのデータ(行)をコピーしたいですが、お願い致します。 例: 住所   名前   口数 東京   XX XX  2 千葉   YY YY  1 神奈川  ZZ ZZ  3 を下の表ようにしたいです。 住所   名前   口数 東京   XX XX  1 東京   XX XX  1 千葉   YY YY  1 神奈川  ZZ ZZ  1 神奈川  ZZ ZZ  1 神奈川  ZZ ZZ  1 口数と同じようにその行を全部コピーしたですが、 宜しくお願い致します。

  • UNIXコマンドのjoinについて

    -------------- -------------- 1 XX XXX 1 xx xxx 2 YY YYY 2 yy yyy 3 ZZ ZZZ  3 zz zzz ~      ~ -------------- -------------- UNIXコマンドのjoinを用いて上の二つのファイルを結合させ、 ---------------------- 1 XX XXX xx xxx 2 YY YYY yy yyy 3 ZZ ZZZ zz zzz ~ ---------------------- としたかったのですが、一列目の数字が急に変化するとそれ以降の行が出力されなくなります。(例えば、100の次が1000になった時など) どのようしたらこのような事が防げるのでしょうか? もしjoinでは防げないなら、joinのように2つのファイルの1列目の数字が同じだった時に結合して出力してくれるプログラムを書ける方がいたら教えていただきたいです。 perlかC++だと助かります。よろしくお願いします。

  • 時系列統計データの解析について

    統計は、あまり得意ではありません。  作物の生産量と気象要因(温度、日射量、降水量等)との関係性を調べるため、15年間の月別生産量のデータと、15年間の月別平均気温、月別積算日射量を使用して、月別の生産量と気象要因との関係性を調べたいのですが、その作物の生産量の統計において、トレンド傾向(緩やかに減少傾向がみられる)や季節変動(夏場は生産量が多く、冬場は少なくなる)がみられます。  そのため、そのまま原データを比較して、関係性を調べた方がいいのか。トレンドや季節変動性を除去し処理したデータを行うべきなのか。さらに気象データなども季節変動性などの除去処理を行って解析した方がいいの迷っております。 初歩的な質問とは思いますが、どなたかご教授いただけますでしょうか。

  • A列にある文字データで△△を含むセルの値をB列に□□にして置き換えしたい

    A列に文字データが100行まであります。    A           B    1 ミカンを食べた     ZZ 2 イチゴを食べた     XX 3 西瓜を食べた      YY 4 ミカンを捨てた     ZZ 5 西瓜を拾った      YY 6 ミカンを無くした    ZZ 7 西瓜を貰った      YY 8 イチゴをあげた     XX それを表のようにB列(任意の列)に置き換えたいです。 イチゴを含むセルはB列にXXをミカンはZZみたいな感じです。 A列のセルには同じ文字列は(今のところ)含みません。 文字の一部を置き換えて変換し、それを繰り返すところまではできましたが、上記のことがができません。 VBAを使って一発で変換したいのですが教えていただけますでしょうか?

  • Excelのマクロで・・・

    こんな表があります。    A  B  C  D  E  F  G 1 XX XX XX 2 YY YY YY 3 ZZ ZZ ZZ ここでA1、B1、C1の変数を読み込み「ある計算」をさせてD1~G1にその答えを書き出させる、A2~C2の変数を読み込み「ある計算」をさせてD2~G2にその答えを書き出させる・・・というのを作りたいのですがデータの読み込みと書き出し方法がわかりません。 どうすればいいのでしょうか?簡単なことなのでしょうがエクセルのヘルプが入っていないので・・・(大学のPCなので自分で入れることも不可能です) (縦は同一の変数で対応しています) 必要ならば補足いたします。

  • 相関分析で困ってます;統計初心者です。

    機械の故障発生の分析に統計手法が使えないか検討している者です。 例を上げますと、 ジュースの自動販売機の故障分析で、硬貨やお札を受付けて、何枚目程度で1件の詰まりが発生するのか?という分析です。 1ヶ月間に受付けた硬貨や紙幣の枚数と、詰まりが発生した件数はデータとして持っています。しかし、多くの台数を調べていくと、利用状況が当然ばらばらで、データも1つとして同じ物がありません。 このようなデータに対して、(硬貨・お札枚数)×(詰まりの発生件数)で相関分析(量×量それとも量×質??)を行っても良いものか決めかねています。受付枚数も詰まり件数も正規性がないので、データを変数変換等して正規化する必要があるのでしょうか? (データは詰まりが1~30件、硬貨・お札枚数が1000~5000のように非常にばらついています) なにぶん統計初心者でして、どうしてよいか困っております。ぜひご回答よろしくお願いします。

  • 偏微分の問題?

    x, y, z の時間微分を: dx/dt = f(x,y,z) dy/dt = g(x,y,z) dz/dt = h(x,y,z) とします。この時、 x = f(xx, y, z) ...(1a) yy = f(xx, y, z) ...(1b) zz = f(xx, yy, z) ...(1c) ∂x /∂xx = (∂yy/∂y)(∂zz/∂z) ...(2) (1)かつ(2)を仮定すると  df/dx + dg/dy + dh/dz = 0 を簡単に示すことができるのだそうです。 ・・・なぜでしょうか?

  • fortran90

    fortran90 現在 fortran90 で計算プログラムを作っております。 プログラムはかけたのですが、実行画面にエラーが出ます。 解決方法が分かりません。どなたか分かる方いらっしゃいますか。 プログラム implicit real*8 (a-h,o-z) parameter(n=900) open (1,file='004.txt',status='old') do 10 i=1,n read (1,*,end=11)xx,yy,zz,ww theta=acos(zz) phi1=acos(xx/sqrt(1-zz*zz)) phi2=asin(yy/sqrt(1-zz*zz)) write(*,*)theta,phi1,phi2 10 continue 11 end プログラム内容 あるフォルダーに保存してあるテキストファイルから4×4行列のデータを読み込み、そのデータからθの値とφ1、φ2のアタを求めるプログラムです。 実行分のエラー画面には、 acos: DOMAIN error です。

  • 条件が複数のSUMIF関数について

    sum関数なので、合計欄のセルに ex.=SUM(C1:C6)などと書くときに、 a列が"1"の場合かつb列が"zz"の場合の時の合計欄のセルに加算したい場合は どうやって書けばいいでしょうか? (zzは任意の文字) __A B C 1 1 zz 100 2 0 zz 200 3 1 xx 300 4 0 yy 400 5 1 zz 500 6 0 zz 600

  • 統計学の多変量解析の考え方で困ってます

    1)症例数が23程度で、多変量解析をしています。重回帰解析において、ある物質がP<0.05となるのですが、独立変数の選択の仕方で、Pが出たり出なかったりします。独立変数の選び方で、変わるならば統計者の意図が入る形になり、biasがかかる気がします。症例数が23程度での重回帰解析に意味はないのでしょうか?また同じ独立変数でstep-wise解析を行っても、その物質のみが採用されるようです。多変量解析を行ううえで、step wiseと重回帰解析の使い分けについてご教授ください。教科書的には重回帰で目安をつけて、step wiseで確認するみたいに書かれていますが、その認識でいいですか?