• 締切済み

データに条件付をつけてまんべんなくばらばらにグループ分けする方法

こんばんは いつもお世話になります 沢山の項目があるデータを内容にかたよりがなくばらばらになるように数枝にグループ分けする方法を教えてください。 まんべんなくランダムに、と言ったらいいでしょうか・・・。 例えば、日本全国からの個人データ(氏名・都道府県名・年齢・性別・職業・・・)があったとし これを「都道府県名・年齢・性別・職業・・・」がまんべんなくランダムに 3組に、 そして、それぞれ5から6人くらいのグループに分ける それぞれの組・グループの「都道府県名・年齢・性別・職業・・・」がまんべんなくばらばらになるように分けたいのです。 ランド関数だと、どうしてもかたよってしまい あるクラスは男女の比が6:4なのに、あるクラスは3:7とか・・・ 手直しすると、逆に他の項目でかたよりが・・・ときりがありません エクセルは中級・アクセスは初級程度ですが 多少原始的な方法があってもとりあえずいいので (時間がないので) なにかアドバイスよろしくお願いします。

みんなの回答

  • KenKen_SP
  • ベストアンサー率62% (785/1258)
回答No.2

例えば、 都道府県×10000 + 性別×1000 + 年齢×100 + 職業×10・・・ とでも属性を数値化するスコアの付けルールを設けます。重要な 項目ほど係数を多くとります。 都道府県などは東京なら 1、大阪なら 2 のようなテーブルを別途 用意しておき、VLOOKUP 関数などで参照した結果に係数を乗じれば 良いでしょう。職業など他要素についても同じです。 また、係数自体もどこかのセルを参照する数式にしておけば、重視 する要素の順も後から容易に変更できそうですね。 このようなルールを設けることで、職業や住所などの各個人の属性 が数値化できそうです。 こうして付けられたスコアが近い人同士は、「属性が近い」と言え ると思うのです。 あとは、スコアの上位から順に各グループに振っていくとか、さらに 別の方法も組み合わせてシャッフルしてから各グループに振るか。。 具体的な方法までは言及しませんが、属性スコアの近い人を別グループ になるよう何らかの方法で割り振っていけば良いかと。 数学的な根拠は私には思いつきません。気のせいかもしれませんが、 単純に乱数を使う方法よりはご希望に近いかもしれません。 少しは参考になるでしょうか?

noname#109108
質問者

お礼

先日は回答ありがとうございました お礼が遅くなり失礼しました 結局、何度か条件を入れて並べ替えをし、 そして、グループの数が5グループなら1から5の数を順にふりグループ分けしました。 偏ってしまったところは結局手作業で直しをいれるやり方になりました ランダムという言葉を使ったのは間違いでした わかりにくくてすみませんでした また、よろしくお願いします。

noname#109108
質問者

補足

回答ありがとうございます 「テーブル」とありますが、アクセスで作る形になるのでしょうか 私にはちょっと難しいのですが、参考にして踏ん張ってみます

全文を見る
すると、全ての回答が全文表示されます。
  • Cupper
  • ベストアンサー率32% (2123/6444)
回答No.1

>ランド関数だと、どうしてもかたよってしまい >あるクラスは男女の比が6:4なのに、あるクラスは3:7とか・・・ ランダムにするのであれば、これで正解なのではありませんか。 男女比を5:5にしたいのであれば、男女別にシャッフルしましょう。

noname#109108
質問者

お礼

先日は回答ありがとうございました お礼が遅くなり失礼しました 結局、何度か条件を入れて並べ替えをし、 そして、グループの数が5グループなら1から5の数を順にふりグループ分けしました。 偏ってしまったところは結局手作業で直しをいれるやり方になりました ランダムという言葉を使ったのは間違いでした わかりにくくてすみませんでした また、よろしくお願いします。

noname#109108
質問者

補足

回答ありがとうございます 男女別だけなら2通りしかないのでできるのですが 都道府県(49通り?)、年齢(子どもからお年寄りまで)・・・いろいろあるので困っています それぞれまんべんなく3クラス分×6人のグループ に分けたいのです。 説明がへたくそでわかりにくくてすみません

全文を見る
すると、全ての回答が全文表示されます。

関連するQ&A

  • エクセル・データをランダムにグループ分けする

    エクセルで用意された氏名・所属・年齢・性別データが約2000件あります。各データは氏名のあいうえおごとに作成したシートに入っています。各シートには0から最大で100件のデータがあります。これらのデータを、あいうえお順ではないランダムな10のグループに分け直したいのですが、どうしたらよろしいでしょうか。

  • エクセルのデータ分けの方法を教えて下さい

    ある小学校で、学年・クラス・氏名・性別があいうえお順で30~40人ぐらい入っているエクセルデータが、23個あります。1学年は約90~130人、クラス数は学年により違い3~5クラス。総勢で約700人。 (したい事) 学年縦割りで6~7人程度ランダムに振り分けて、100くらいの小グループをつくりたいのです。 (条件) 小6または小5が必ず1人以上、小グループに属すること。小4以下はいない学年があっても構わない(ある小グループには小3がいないなど)。 上記のようなことを簡単にできる方法ってあるでしょうか?エクセルに詳しい方、教えて下さい。

  • 質的データと量的データからなるサンプルをグループ分けするにはどの分析を使えばよいでしょうか。

    統計の選び方についておうかがいします。 アンケートの結果から回答者をグループ分けをしてグループ毎の特徴を挙げたいと思っています。 アンケート項目は『a.身長・体重など数値のデータ』・『b.好き嫌いの度合い等の5段階のデータ』・『c.性別・住んでいる地域など順序の全くないデータ』 に分かれています。 統計に関して全く理解できず、本やwebの資料を参考にした結果 以下のような分析をしようかと思っています。 1)cのデータだけで数量化3類の計算をして点数で示す。 2)a.b.cの点数、のデータでクラスター分析をしてグループ分け 数量化で得た結果をクラスター分析にかけてよいのかという点と、 bの段階で表したデータを数的データとして扱っていいかという点 の2点について疑問があります。 また、全く的外れな分析をしようとしているのではないかという不安が有ります。 以上の2点と、正しくはどの分析を用いればよいのかについて、アドバイスいただけたらと思います。 よろしくおねがいいたします。

  • 【Excel2007】カラムとデータの不揃い解消

    エクセルが得意な方、是非助けてください! 現在、エクセル上に、いわゆるデータベースのような カラム→データという表があります。 通常であれば、年齢のカラムには20とか24とか入るかと思いますが、 現在あるデータは年齢に性別の男性とか女性が入っていたり、 職業に年齢が入っていたりなど、カラムとデータがちぐはぐに なっている状態です。 これをカラム=データになるようにするにはどのような方法が ございますでしょうか。 <カラム> 年齢 性別 職業 <データ> 20歳 男性 会社員 主婦 30歳 女性 女性 医者 40歳 上記表のイメージが数千件あるため、 なかなか手作業では厳しい状態です。 ちなみに、データはある程度規則性があるので、 多くても職業のカラムで20種類程度で収まります。 性別は2種類、年齢は5歳刻みのデータとして 保持しています。

  • 条件に合った行を抜き出す関数を教えて下さい。

    エクセルの関数についての質問です。 色々検索してよく似た内容のやり取りを調べましたが、 どうしてもうまくいかず断念。 どうかよろしくお願いします。 A1に性別、A2は男・A3は女...とランダムにA100まで続く。 B1に職業、B2以下ランダムで"会社員"などのワードがB100まで続く。 C1に時間、0:00:12や0:11:50というタイム形式(h:mm:ss)でC100まで続く。 D1に0:05:00とC1と同じタイム形式の入力がある。 で、ここからなんですが、 C1:C100のデータとD1を比較し、 D1よりタイムオーバーしている行のみを、そのまま、 E1(性別)・F1(職業)・G1(時間)へ抜き出したいのです。 複数ある場合は、 E2・F2・G2...と上から順に続く。 極端に言えば、すべてタイムオーバーしていれば、 E100・F100・G100まで同じデータが並ぶことになります。 説明が足らなければ補足しますので、 なんとかよろしくお願いします。 エクセルのバージョンは2013です。 作業用列を追加するのも可能です。

  • ピボットテーブルグラフ

    お世話になります。 ピボットテーブルのグラフを作成しています。 年齢ごとの人数を棒グラフで表すのですが、 x軸の項目に、『21歳 データの個数/性別』、『22歳 データの個数/性別』という様に それぞれ長い項目名が表示されてしまいます。 “データの個数/性別”の字を入れずに、年齢だけの表示に変えるにはどうしたらよいか教えて下さい。 よろしくお願いします。

  • エクセルのセル内文字置き換え?

    誰がご存知の方教えてください。 仕事でデータ集計をしているのですが、 エクセル各セルを一つのセルの中にalt改行された状態で 統合する方法はありますか?  A    B  C   D ━━列 氏名  年齢  性別  職業 上記のようなデータを一つのセルの中に 収める方法はあるのでしょうか      ↓ ----------------    氏名    年齢    性別    職業 ----------------

  • 会員データをスムーズに入力 また 検索したい

    会員データをスムーズに入力 また 検索したい  現状エクセルを使用していますが 外、フリーソフト 他 いいものが ございましたら おねがいします。 入力項目は 少ないのですが 検索をした時にすぐ探せるように また 入力も 簡単にしたいのですが 現状は エクセルで 何もせず 検索機能のみを使用しております。 ■入力項目的なもの 会員番号 名前 性別 年齢 郵便番号 住所 電話番号 携帯番号 メールアドレス グループ名 特徴 注意事項 このくらいです、エクセルでの使用でしたら いろいろとマクロとか コマンドボタンをつけて 作業しやくしたほうがいいのかもしれませんが どれを改善したらいいでしょうか? また すでにでているフリーソフトなどで 代替できる いいものが あればと 思っております。 こうしたほうがいいよ これいいよ とか ございましたら ぜひ お願いします。

  • データをグループ分けしたい

    次のようなデータがありますが、これをグループ分けしたいと思います。IF関数で可能でしょうか?? 項目 氏名/希望1/希望2/希望3/OS 希望1~3にはいずれかに○が入っている OS には、98、2000、XPのいずれかがはいっている 新しく「グループ」という項目を作り、 以下の組み合わせでグループ分けをしたいと考えています。 Aa)希望1=○ OS=98 Ab) 希望1=○ OS=2000  Ac)希望1=○ OS=XP Ba)希望2=○ OS=98 Bb) 希望2=○ OS=2000  Bc)希望2=○ OS=XP Ca)希望3=○ OS=98 Cb) 希望3=○ OS=2000  Cc)希望3=○ OS=XP データは500件ほどあり、オートフィルタが使えないレイアウトになっています。手作業でやるのが一版早いでしょうか?? これって関数でできますか?

  • 消費者金融業を選ぶ基準

    就職活動である消費者金融企業から課されたレポート作成のためにご協力お願いします。もし自分が消費者金融業者から借入をしなければならなくなった場合、まずどこから借り入れますか?(武富士とかアコムとかプロミスとか)その理由も添えてご回答いただけると助かります。あと、居住地(都道府県名だけで結構です)と年齢も差し支えなければ。たとえば、CMの印象が強いから武富士、とか、こだわりはないから近所にある店舗、とか。幅広い年齢層の方の意見が必要なのですが、私の周りは20代前半しか居ないのでデータに偏りがあります。よろしくお願いします。

専門家に質問してみよう