• ベストアンサー

データ集計と分析について

データ集計と分析についてですが、データ集計には単純集計とかクロス集計とかありますが、どのようなやり方なのでしょうか。 また、分析はどのようなことをするのでしょうか。

質問者が選んだベストアンサー

  • ベストアンサー
  • hnd-oka
  • ベストアンサー率54% (56/102)
回答No.1

そうですね、具体的に一例を挙げますか。 例えば、この『教えて! goo』の一日のアクセス件数に関してのアンケートの設問項目があったとすると (計算上の適当な数字ですよ(^^;; 1.   アクセス  質問  200 回答 400   合計  600 この合計、和が"単純集計"の結果です。 一般的には回答者の属性設問(性別・年齢・居住地・職業・年収・家族構成……etc) や幾つかの設問項目が附加されますので、これらのクロスをかける事により、例えば性別を例に取ると 2. 質 問   回 答 男性 50   150 女性 150   250 合計  200    400 と、より細分化されていきますね。これを"単純クロス集計"と呼びます。 更に、 質問×性別×居住地×カテゴリー……と、どんどん3重、4重にクロスをかけていく事もしますが、細分化すればするほど良いというものでもなく、母数が少なくなりアクチュアルなデータとしての信憑性を阻害する結果ともなりかねません。 この様に、数字を色々な形に組み替えて様々な傾向を探る作業が"分析"です。 "クロス集計"肝心なのは知りたい事や分析手法を十分に意図してから調査票の設計に入る事です。 調査票を一瞥しただけで、調査主体側がを知りたいのか、或るいは、調査主体のレベルが判るというのも恐いものがあります。 今では、EXCELやACCESSがありますので、簡易集計は随分楽になりました。。

ryou001
質問者

お礼

とても判りやすいご説明有り難うございました。

関連するQ&A

  • エクセルデータの集計&分析をしたいのですが。

    今あるエクセル内のデータを使って、集計&分析をしたいと思っています。ソートやマクロでいままではやっていましたが、どうしても時間がかかり大変でした。エクセルやその他windowsのソフトを使って、データ入力時点で集計が自動的に行われ、傾向値が見て取れたり、前年との比較が出来たり出来ないかなと思っています。 そんなこと出来ますでしょうか?

  • 大規模データの集計・分析時のソフトウェアについて

    ある団体の保有しているデータの集計・分析作業を行うことになりました.以前同様の業務をしたことがあったのですが,そのときはデータを保有していた先方のシステムをお借りできたので何も考えずに集計・分析作業に集中できました.しかし,今回は先方にそのような環境がないとのことで,環境も構築する必要があります. 以下のような状況の場合,安価に集計・分析するためにはどのようなデータベースのソフトを選択するのが良いでしょうか? ・集計・分析の対象となるデータは月ごとに多くて5億件(これを四半期分なので三ヶ月分) ・1件あたりのデータに含まれる情報はせいぜい100バイト ・集計方法は単純な合計・平均がメインですが,ミクロな分析も必要なので,SQLなどでの制御も考えています. ・集計・分析時にデータの更新などは発生せず,利用者(分析者)は同時に複数アクセスすることはありません. ・データベースを動かす環境の候補は Windows か Linux (i386) のどちらかです. このような場合,どういったデータベースソフトを選択するのが良いでしょうか.よろしくお願いします.

  • SPSSでの分析 (初心者です)

     あるデータがあって,それをSPSSで分析しなければなりません.以前にも少ししたことはあるのですが,どの分析方法を使うかは決まっていました.今回は,分析方法の決定を自分でしなければならないのですが,この分析をするときにはどの手法が適している,または適していない,ということがほとんどわからない状態です.本をいくつか読んだり,ネットで検索をかけたりしてある程度絞ってはいるのですが,やはり今ひとつわかりません.そこで質問なのですが, ・質問項目どうしの関連性を調べたいと思っています.相関分析かなと思っていたのですが,クロス集計からの独立性の検定でも関連をみることができますよね.どちらがより適しているのでしょうか? ・それと,相関分析の「相関」とクロス集計での「関連」の違いがよくわからないので,それについてもよろしくお願いします.  質問でお分かりだと思いますが,基本的なところでつまずいています.これだけの情報では判断しにくいこともあるかとは思いますが,よろしくお願いします. 

  • データを集計して分析するような職種

    今年3月に理系の修士を卒業しましたが、就職活動を継続しています。もう1年以上就職活動していますが、一向に内定が取れないので、ここ1週間で自己分析を徹底的にやり直しています。自己分析ツールをいくつも試したり、周囲の人間に自分の評価を書いてもらったりしました。そしてその膨大な量の結果を集計しているのですが、そのデータを集計してそれを分析し何かを見出す作業に少々の面白みを感じました。このような興味の生かせる職種はありますでしょうか。 今までは院での専攻と結びつきそうなソフトやネットワーク関連のSE、コンサルティング、研究・開発・技術系公務員、または、地道な作業をコツコツ進めることや数値を扱うことが得意、スポットライトを浴びるよりも縁の下の力持ちになりたいことから、総務・経理等の事務系も挑戦してみたいと考えていました。これらと重なっても良いので教えて頂きたく存じます。宜しくお願い致します。

  • データ分析で何ができますか

    自分も一応大学でデータ分析の授業を履修してましたが、少し難しかったので、内容はほとんど覚えてません。 仕事でデータ分析の知識は具体的にどのようなときに役に立つのでしょうか。 エクセルで集計を出し、表を作成して、相関関係を見ることが一応できますが、それと比べてどのような違いがありますか。 いまはホームページ作成の仕事をしてますがどのような職種でもデータ分析の知識は今後必要となってくるのですか。 よろしくお願いいたします。

  • SPSS集計データをSPSSで再集計するには

    質問です。 SPSSのピボットテーブルで集計したデータをさらにSPSSで集計したい のですが、その場合、一度ExcelやAccessに落としてから再度SPSSに とりこむという手順を踏まないとできないのでしょうか。 <例> 年月   ID  金額 200706  1  4760 200707  1  8670 200708  1  3200 200706  2  5427 200707  2  4287 200708  2  3675 … 200806  1  2539 200807  1  3765 200808  1  8767 200806  2  1254 200807  2  2142 200808  2  5621 … これをSPSSのピボットテーブルで 年   ID  金額合計 2007  1   16630 2007  2   13389 … 2008  1   15071 2008  2   9017 … と集計し、さらに2007年と2008年をクロス集計したいのです。 わかりにくかったらすみません。 ご回答をお願いいたします。

  • Excelでの集計・複数行にまたがるデータの集計・分析

    excelで複数にまたがった行を集計、色々な形で分析したい(できればピボットなどを使って。)と考えています。色々インターネットを探してみたのやり方を探してみたのですが、運用にあうものが見つかりませんでしたので、アドバイスをお願いします。 添付したサンプルを元に言うと、「買ったもの1」「買ったもの2」、「買ったもの1(個数)」、「買ったもの2(個数)」などをマージしてフィルタにかけれればよいのになぁと思っています。 ※分析の簡単な例としては、「鉛筆はどのような業種のお客さんが多く買っているのか」などが簡単に確認したいと思っています。 補足:もののリストは100以上あり頻繁に追加されるため、ひとつひとつのものに対し、式を書くというのはメンテナンス上避けたいと思っています。 ※もしもとのデータソースを「こう変えればうまくいく」というアドバイスがあればそれも教えていただけると幸甚です。 (ただ、注文番号1つに付き、ひとつの行になるという部分だけは運用上変えることができません。)

  • Excel2000のピポットテーブルでクロス集計のデータを扱えますか

    Excel2000のピポットテーブルについて質問ですが、 ピポットテーブルで分析したいデータがExcelにあるの ですが、横並びのデータではなくて、クロス集計された データになります。(例:縦軸が組織と科目で横軸が年月等で中の値が利益など) 元データ例(Excel) ----------1月 2月 3月 A店-費用---10--20---30 ----利益---10--20---30 (---は列を揃えるために記入しましたのでないもの と考えて下さい) この場合、ピポットテーブルで分析するにはどのように 設定すれば良いのでしょうか。 全て横並びのデータでないと扱えないのでしょうか。 例えば A店 費用 1月 10 --------2月 20 --------3月 30 (---は列をそろえる為に記入したのでないもと 考えて下さい。) 上記のようなデータでないと扱えないのでしょうか。 上手く質問がまとまっていなくてすみません。 分かりましたら教えて下さい。

  • 単純集計とクロス集計を教えてください。

    集計には、単純集計とかクロス集計などがありますが、 どのような集計方法なのでしょうか。 ご回答お願いいたします。

  • アクセスでデータの集計方法について教えてください。

    基本的なことになるのかもしれませんが、よろしくお願いいたします。 健診関係の仕事をしており、個人コードごとに単独の検査データが大量に有ります。検査の種類は200ほどあります。これを個人ごとに紐づけして集計しなおしたいのです。今まではクロス集計でやっていたのですが、数が限界を超えてしまいクロス集計がエラーになってしまいました(T_T)。具体的に単純化して書きますと、 個人コード 検査コード 検査名 数値 A1111  00001  ○○○ 10 A2222  00001  ○○○ 12 A2222  00002  ●●● 55 A1111  00002  ●●● 50 A3333  00001  ○○○ 15 個人コード 数値1 数値1(検査数値を個人別・検査別に集計)  A1111  10   50   A2222  12   55     A3333  15 データはそれぞれ以下のようなイメージでテーブル管理しており、リレーションでつなげています。 個人コード→個人テーブル 検査数値 →検査テーブル 検査コード→検査コードテーブル ひとつの検査を個人ごとにクエリで抜き出すことは出来るのですが、個人ごとに検査を横に並べていくことがうまくいきません。 ベースになるデータは人数×検査数で20万件ほどあり最終的には400万件ぐらいになりそうなのでクロス集計ではお手上げ状態のようです。そもそもはじめのデータを作る時に個人ごとに紐付けして作れと突っ込まれそうですが、そこは事情があって無理なんです。 どなたかよろしくお願いいたします。