ベストアンサー

※ ChatGPTを利用し、要約された質問です（原文：数値を複数の群に分ける最適な組み合わせを求める方法）

数値を複数の群に分ける最適な組み合わせを求める方法

2018/06/06 22:36

このQ&Aのポイント

数値を複数の群に分ける方法について説明します。与えられた数値列で隣り合う数値しか同じ群に含めることはできず、各群の合計値が最も均等になる組み合わせを求めることが目標です。
例えば、数値列{5,2,7,12,6,15,4}を3つの群に分ける場合、{5,2,7},{12},{6,15,4}という組み合わせが最も均等です。
実際の問題では、組み合わせの数が増えると計算時間に影響するため、全ての組み合わせを試さずに最適な組み合わせを求める方法を提示してください。

katorea21
お礼率64% (302/468)

C・C++・C#
回答数92
ありがとう数28

みんなの回答 （92）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

amanojaku1
ベストアンサー率54% (265/488)

2018/06/15 04:02 回答No.27

>回答No.23　amanojaku1 「2018/06/15 03:48:47」の時点で修正しました。それ以前にコピーしている場合は注意して下さい。数値を複数の群に分ける最適な組み合わせを求める方法 http://ashtarte.pa.land.to/utf8/smt.cgi?r+sara/&bid+000000DC&tsn+000000DC&bts+2018/06/15%2002%3A04%3A46&

質問者

お礼 2018/06/17 01:04

コメント追加して頂きありがとうございます。今頑張って理解しているところですが、何となく分かってきました。それにしても２進数の数学的特徴をうまくこの問題に当てはめるという発想が凄いですね。問題の本質は順列のパターンを網羅することですが、私は再帰を使うイメージしかなかったです。

全文を見る

ログインすると、全ての回答が全文表示されます。

その他の回答 (91)

amanojaku1
ベストアンサー率54% (265/488)

2018/06/27 01:08 回答No.52

>回答No.51　amanojaku1 分岐予測が外れたら(CPUの)パイプラインのStall(ストール：停止状態)が発生します。「min、max」ライブラリ関数が内部的にどうなってるか分かりませんが、もし内部的に分岐が使われてないとすれば(インライン化すれば)パフォーマンスが良い可能性があります(あくまで可能性ですが)。なのでどうなるか試してみて下さい。

質問者

お礼 2018/06/27 22:32

min_element,max_elementはSTLのライブラリ関数なのでinline化は出来ません。他の環境なら可能かも知れませんが、VisualC++では出来ないと思います。自分がやったのは、関数呼び出しではなく最大値最小値を求めるロジックを直接whileループ中に書きました。つまり普通にinlineになっています。

全文を見る

ログインすると、全ての回答が全文表示されます。

amanojaku1
ベストアンサー率54% (265/488)

2018/06/27 00:32 回答No.51

>ライブラリ関数は使わず (インライン化したライブラリ関数がパフォーマンスが良い可能性もあるかもしれないので)一応「min、max」ライブラリ関数をインライン化してどうなるか試してみて下さい。

全文を見る

ログインすると、全ての回答が全文表示されます。

amanojaku1
ベストアンサー率54% (265/488)

2018/06/26 17:13 回答No.50

>gmmin = *min_element(gmt, gmt+gp);　←内部でループしてると思われる >gmmax = *max_element(gmt, gmt+gp);　←内部でループしてると思われる下記はJavaScriptです。インライン化は良く分からないので、「#pragma forceinline」で良いのか良く分かりません。上記はループが2つ、下記はループが1つ、なのでパフォーマスが改善する"可能性"があります(あくまで"可能性"ですが…)。 gmmin = gmt[0]; gmmax = gmt[0]; for(let m = 1; m<gmt.length; m++){ // 1からスタートしていることに注意して下さい。 gmmin = Math.min(gmmin,gmt[m]); // ←「min」関数を「#pragma forceinline」でインライン化を定義しておく gmmax = Math.max(gmmax,gmt[m]); // ←「max」関数を「#pragma forceinline」でインライン化を定義しておく }

質問者

お礼 2018/06/26 23:50

やってみたら1.8秒→1.5秒に改善しました。ライブラリ関数は使わず自前で全部書いてみました。なかなか奥が深いですね。たったこれだけで２割も早くなります。単純な処理と思っていたものが、ループの中だとかなりのインパクトになるのですね。こうした純粋なアルゴリズムでは、ブラックボックスなライブラリやクラスは一切使用しない方が良さそうです。

全文を見る

ログインすると、全ての回答が全文表示されます。

amanojaku1
ベストアンサー率54% (265/488)

2018/06/26 00:53 回答No.49

まあ、細かい事を言っていても、恐らく大してパフォーマスには影響ないでしょう。 >gmmin = *min_element(gmt, gmt+gp); >gmmax = *max_element(gmt, gmt+gp); ↑ここがパフォーマスの肝になると分かったのですから、手動で最適化してみて試してみるのも良いかもしれません。

全文を見る

ログインすると、全ての回答が全文表示されます。

amanojaku1
ベストアンサー率54% (265/488)

2018/06/26 00:25 回答No.48

>回答No.46　amanojaku1 >if ((qc < gp) && (i == (gmq_st + gmq[qc]))) { >gmq_st += gmq[qc]; >qc++;gmc++; >} 実際のパフォーマス的にどうでしょうか？もし、パフォーマス的に変わらないならスマートな記述をオススメします。

全文を見る

ログインすると、全ての回答が全文表示されます。

amanojaku1
ベストアンサー率54% (265/488)

2018/06/25 23:56 回答No.47

>回答No.46　amanojaku1 変数を減らすならpcを減らすほうがスマートです(パフォーマス的にどうかは分かりませんが)。 >if(pc<gmp.length){ >if(gmp[pc]==i){ >pc++; >gmc++; >} >} if((gmc+1)<gmp.length){ if(gmp[(gmc+1)]==i){ gmc++; } }

全文を見る

ログインすると、全ての回答が全文表示されます。

amanojaku1
ベストアンサー率54% (265/488)

2018/06/25 23:30 回答No.46

>配列のソートに時間がかかっていたようです。そこが問題でしたか。 >最大値、最小値の算出にソートは必要ないですね。そう言われると、そうですね(^_^;)。 >この結果、2000万パターンで約1.8秒まで改善しました。ちなみに要素数28、グループ数14で約2000万パターンとなります。これで充分に実用的ですね。 >gmpは使用しない。 >if ((qc < gp) && (i == (gmq_st + gmq[qc]))) { >gmq_st += gmq[qc]; >qc++;gmc++; >} かえって処理が複雑になってますが、変数を減らした方が良いと言う判断ですか。 gmq_stが増えているので、どちらが良いとも一概には言えないかもしれません。まあ、全体の処理からすれば些細な事でしょうが。 if(gmp[pc]==i){ pc++; gmc++; }

全文を見る

ログインすると、全ての回答が全文表示されます。

amanojaku1
ベストアンサー率54% (265/488)

2018/06/24 00:36 回答No.45

>C言語はサッパリというのは？ >そもそもここはC/C++/C#のスレッドですが。 C言語(C++も)とか、サッパリ分からないのでJavaScriptで組んだ訳です、JavaScript→C++への変換もそれほど難しくないだろうと思ったので…。 >それだけの知識がありながらプリプロセッサ指令に関してはパスカル系で同様なコンパイラ・スイッチ？みたいなモノが有ったので、当然 C++にも同様なモノが有るだろうとググっただけです。 386(32bit)ではコンパイラーによる最適化の恩恵はあまり受けらないと言う批判を受けて、Intelはx64ではレジスタを倍増したと言うのは割りと有名な話です。今回、たまたまググっていてC言語？(C++？)でx64でもintは32bitだと言う記事をどこかで読みました(マジか？と本当にビックリしました)。今回、たまたまググっていてC言語で386(32bit)で「16bit、8bit」演算ではマスク処理が入り遅くなると言う記事を見つけたので、x64でも「32bit、16bit、8bit」演算ではマスク処理が入り遅くなるだろうと推測される訳です。

質問者

お礼 2018/06/25 21:45

アルゴリズムの改善を少し頑張ってみました。具体的にはwhileループの中の次のような見直しをしました。・std::vectorをやめて普通の配列にする。・gmpは使用しない。gmqだけで記述可能なので。・gmqの最大値、最小値の算出時にソートをしない。また全ての数値を64bit型に変更しました。 whileループは最終的に約50行となりました。１番最初のパターンのみ特殊扱いになってしまうのが気になりますが。この結果、2000万パターンで約1.8秒まで改善しました。ちなみに要素数28、グループ数14で約2000万パターンとなります。(27_C_13=20058300) 既に現実の応用範囲を超えており、プログラムの勉強みたいな感じになっていますが。配列のソートに時間がかかっていたようです。最大値、最小値の算出にソートは必要ないですね。 #include <algorithm> using namespace std; typedef unsigned long long ULLONG; void CalcOptimalGrouping(const ULLONG* gpa, const ULLONG gpa_size, const ULLONG gp) { ULLONG* gmq = new ULLONG[gp]; fill(gmq, gmq + gp, 1); ULLONG* gmp = new ULLONG[gp]; fill(gmp, gmp + gp, 0); ULLONG* gmt = new ULLONG[gp]; ULLONG* gtmp = new ULLONG[gp]; ULLONG gmmin = -1, gmmax = -1, gmmdif = -1; ULLONG gtmin = -1, gtmax = -1, gtmdif = -1; ULLONG gppc = 0; while (0 < gmq[gp - 1]) { gppc++; fill(gmt, gmt+gp, 0); if (gppc == 1) { gmq[gp - 1] = gpa_size; for (size_t i = 0; i < (gp - 1); i++) { gmq[gp - 1] -= gmq[i]; } } ULLONG gmc = 0; size_t qc = 0; ULLONG gmq_st = 0; for (size_t i = 0; i < gpa_size; i++) { if ((qc < gp) && (i == (gmq_st + gmq[qc]))) { gmq_st += gmq[qc]; qc++; gmc++; } gmt[gmc] += gpa[i]; } gmmin = *min_element(gmt, gmt+gp); gmmax = *max_element(gmt, gmt+gp); gmmdif = gmmax - gmmin; if ((gtmdif < 0) || (gtmdif > gmmdif)) { gtmdif = gmmdif; gtmin = gmmin; gtmax = gmmax; copy(gmq, gmq+(ULLONG)gp, gtmp); } for (size_t k = 0; k < (gp - 1); k++) { gmq[k]++; for (size_t i = 0; i < k; i++) { gmq[i] = 1; } gmq[gp - 1] = (ULLONG)gpa_size; for (size_t i = 0; i < (gp - 1); i++) { gmq[gp - 1] -= gmq[i]; } if (0 < gmq[gp - 1]) break; } } //<<Answer>> delete[] gmq; delete[] gmp; delete[] gmt; delete[] gtmp; }

全文を見る

ログインすると、全ての回答が全文表示されます。

amanojaku1
ベストアンサー率54% (265/488)

2018/06/23 13:19 回答No.44

>説明不足でした。計測時はデバッグ出力は全て無効化しています。最適化は最大の/O2としています。この状態で2000万パターンが５～６秒程度でした。コードもかなり最適化したつもりですが、まだ計算量を減らせる部分があるでしょうか。 C言語(C++も)とか、サッパリ分かりませんが、「回答No.17　amanojaku1」で言及したようにx64で下記のように「int」では遅くなるのではないかと思われます(ちなみに386(32bit)では最適化の恩恵はあまり受けられません)。「int_fast64_t」の定義がない場合、「64bit」幅の変数を定義してみて下さい。 >vector<int> gmq(gp, 1); >const size_t gmq_size = gmq.size(); >vector<int> gmp(gp, 0); >const size_t gmp_size = gmp.size(); >vector<int> gmt(gp); >const size_t gmt_size = gmt.size(); > >vector<int> gtmp; >int gmmin = -1; >int gmmax = -1; >int gmmdif = -1; >int gtmin = -1; >int gtmax = -1; >int gtmdif = -1;

質問者

お礼 2018/06/23 14:47

amanojaku1さんは何者ですか？それだけの知識がありながらC言語はサッパリというのは？そもそもここはC/C++/C#のスレッドですが。

全文を見る

ログインすると、全ての回答が全文表示されます。

amanojaku1
ベストアンサー率54% (265/488)

2018/06/23 02:06 回答No.43

訂正です >define hoge 0 #define hoge 0 下記では「#define」になってますね。もう一度基礎からC言語第14回ヘッダファイルとプリプロセッサ指令 > 主なプリプロセッサ指令 https://www.grapecity.com/tools/support/powernews/column/clang/014/page02.htm #if、#elif、#else、および #endif ディレクティブ (C/C++) https://msdn.microsoft.com/ja-jp/library/ew2hz0yd.aspx

全文を見る

ログインすると、全ての回答が全文表示されます。

数値を複数の群に分ける最適な組み合わせを求める方法

数値を複数の群に分ける最適な組み合わせを求める方法

質問者が選んだベストアンサー

お礼 2018/06/17 01:04

その他の回答 (91)

お礼 2018/06/27 22:32

お礼 2018/06/26 23:50

お礼 2018/06/25 21:45

お礼 2018/06/23 14:47

関連するQ&A

注目のQ&A

カテゴリ
一覧

専門家に質問してみよう
専門家登録

あなたにピッタリな商品が見つかる！ OKWAVEセレクト

数値を複数の群に分ける最適な組み合わせを求める方法

数値を複数の群に分ける最適な組み合わせを求める方法

質問者が選んだベストアンサー

お礼 2018/06/17 01:04

その他の回答 (91)

お礼 2018/06/27 22:32

お礼 2018/06/26 23:50

お礼 2018/06/25 21:45

お礼 2018/06/23 14:47

関連するQ&A

注目のQ&A

カテゴリ 一覧

専門家に質問してみよう 専門家登録

あなたにピッタリな商品が見つかる！ OKWAVEセレクト

カテゴリ
一覧

専門家に質問してみよう
専門家登録