混合ガウスモデルの成分数の決定方法

このQ&Aのポイント
  • 混合ガウスモデルの成分数の決定方法について詳しく教えてください。
  • matlabにおいて混合ガウスモデルの成分数を決定する方法についてお尋ねしたいです。
  • 混合ガウスモデルを作成する際に最適な成分数の決定方法が知りたいです。
回答を見る
  • ベストアンサー

混合ガウスモデルの成分数について

私の質問をご覧いただきありがとうございます。 matlabにて13次元のデータを用いて混合ガウスモデルを作成したいのですが、ガウス混合モデルを作成する際の最適な成分数の決定方法がわからない為、モデルの作成を行うことができないというのが現状です。 matlab公式(http://www.mathworks.co.jp/jp/help/stats/gaussian-mixture-models.html#bra9fvn)には「実際に実数データを使用する場合は、成分数を変えてモデルを比較することによって、成分数を決定する必要があります。」とあるのですが、どの様にモデルを比較・評価すれば良いのかがわかりません。 これを踏まえて、みなさんにお伺いしたい点が二つあります。 1、成分数を変えてモデルを各成分数毎に複数作成したとして、どの様に比較・評価を行えば良いのか 2、1の様な手段ではなく、より簡単な(toolboxやmatlab内のfunctionを用いて)手法で成分数を決定する手法 以上となりますが、どうぞ宜しくお願い致します

質問者が選んだベストアンサー

  • ベストアンサー
  • rabbit_cat
  • ベストアンサー率40% (829/2062)
回答No.1

最適な成分数を決めるのは、それ自体、難しい問題です。 過学習(過剰適合)すると、汎化能力が下がってしまうわけで。 >1、成分数を変えてモデルを各成分数毎に複数作成したとして、どの様に比較・評価を行えば良いのか たとえば、成分数を変えながら、半分のデータを使って学習して、別の半分のデータがどれだけ学習結果に当てはまるかを調べるなど。 >2、1の様な手段ではなく、より簡単な(toolboxやmatlab内のfunctionを用いて)手法で成分数を決定する手法 matlabのtoolboxでというのは難しいですが、成分数も(人手を介さずに)機械的に求めたいということであれば、赤池情報量規準(AIC)とか、最小記述長(MDL)とかを考えるのが、よいです。 あるいは、成分数自体をパラメータ(ハイパーパラメータ)としてモデルに組み込んで、それも一緒に推定するか。

vansbear
質問者

お礼

お礼が遅くなってしまい申し訳ありません! 上記の手法で作成したGMMの評価を行ってみたいと思います! ありがとうございました!

関連するQ&A

  • 独立成分分析について

    独立成分分析について FastICAを用いて2人の話し声が混ざった音源からそれぞれの声に分離したいと考えてます。 現在、MATLABで混合音源をloadし、FastICAに取り込んだのですが実行結果を見る限り成功していません。 白色化を実行したあとでICAを実行しても2つの信号を取り出すことができずに、1つの波形しか表示されません。 取り込む音源はただ単純に2人の話し声を混合しただけです。 分離ができないのは取り込む音源に原因があると考えてます。 Fast ICAを用いてこの実験を行うためにはどういった形式の音源を入力信号としたらいいのでしょうか、教えてください。 ちなみに、取り込んだ信号のNumber of Signal(信号数) は1、Number of Sample(サンプル数)は18000となっています。

  • 2つの成分を混合する

    この問題がわからず、困っています。 成分AのSr濃度が85ppm、成分BのSr濃度が458ppmのとき、成分Aと成分Bの混合物のSr濃度は320ppmであった。混合物中の成分Aの割合(パーセント)を求めなさい。 簡単な問題でしょうが、私はわかりません・・・(><) 解き方を教えてください。

  • 新法で実施された環境アセスメントについて事例を具体的に知りたいです。

    環境アセスメントについての本を読んでみても、一つの事例について深く記述したものがないので、一つの事例について細かく知りたいです。例えば(1)スクリーニングがどのように行われ実施の過程でどのような対応を関係者は行ったか、(2)スコーピングの段階で自然環境部門の調査対象項目、調査手法、評価、予測手法の決定はどのようになされたか、又特に問題になったことはないか、公聴会等でどのような意見が出たか、又意見の数はどのくらいでて、これらに対してどのような対応を取ったか、(3)調査結果、評価予測結果、対策、ミチゲーション、モニタリング等の概略、特に問題とされたこと、それに対しての適切な対策が取れたか について具体的に知りたいです。何卒よろしくお願いいたします。

  • FIDガスクロマトグラフィーを用いての定量分析

    二成分(トルエンとエチルベンゼン)に対してそれぞれ縦軸に面積、横軸に各物質の体積をとったグラフ(検量線)を描く。 次に未知試料を注入し、得られたトルエンとエチルベンゼンのピーク面積から検量線を用いて混合比を決定する絶対検量法と、 内部標準物質(トルエン)と試料中の定量しようとする成分の純粋物質(エチルベンゼン)との混合物を種々の比で調製したものを注入する。試料のピーク面積(A)と内部標準のピーク面積(As)との比(A /As)を縦軸にとり、横軸に混合比(エチルベンゼン/トルエン)をとって検量線を作成する。 次に未知試料を注入し、得られたトルエンとエチルベンゼンのピーク面積の比から検量線を用いて未知試料のトルエンとエチルベンゼンの混合比を決定する内部標準法の実験を行ったんですが、 両方のやり方で未知試料の混合比が違っていました。 その考えられる理由として何か教えてください。 長々とすいません。。

  • 電気温水器の2ヒータモデルの沸き増し効果

    エコキュートではない昔ながらのヒータ式電気温水器の買換えあたり 1ヒータモデルにするか2ヒータモデルにするか悩んでおります。 例えば三菱電機系での沸き増し機能は ・1ヒータモデル:タンク下部ヒータによる満タン沸き増し機能 ・2ヒータモデル:タンク下部ヒータによる満タン沸き増し機能と          上部ヒータによる上部沸き増し機能 になっているようです。 昼間時間帯にわき増しすると1ヒータモデルではタンク下部のヒータで沸かす ので沸き上がるのに時間がかかるが2ヒータモデルではタンク上部ヒータで 150L程度を短時間で沸かすことがメリットとなっているようです。 熱いシャワーを浴びたいが微妙に湯温が低いような場合に短時間で沸かせる 2ヒータモデルの上部沸き増し機能が良さそうに感じております。 計算を簡単にするために仮に300L容量の1ヒータモデルと2ヒータモデル があったとして同時に10℃沸き増ししたとします。 1ヒータモデルではタンク全体(300L)を沸かすのに2時間かかったとすると 2ヒータモデルではタンク内の上側150Lのみを上部ヒータで沸かすので 1時間で沸くことになり1ヒータモデルより1時間短縮できると思います。 ただし1ヒータモデルで1時間だけ沸き増しした場合でもタンク全体の湯温が 均一に5℃上昇する訳ではなくタンク上部の方が対流により5℃より高くなって いるような気がします。 なので実際はタンク上部の150Lに限定して言えば1時間の沸き増しにより ・1ヒータモデルでは7~8℃? ・2ヒータモデルでは10℃ なのであればそれほど2ヒータモデルに拘る必要がないのかな…と疑問に感じ てます。 またタンク内を上下に2分する混合層の影響が良く分かりません。 上部ヒータの沸き増し効果を弱めているのか強めているのか… 2ヒータモデルをお使いの方、上部ヒータによる沸き増し効果の程はいかがで しょうか? もし可能であれば下部ヒータによる満タン沸き増しと上部ヒータによる上部 沸き増しとの比較していただけると助かります… また2ヒータモデルにするとこんなメリットやデメリットがあるよ…等の アドバイスあればよろしくお願いします。 ※部品数が多くなるので故障率UPのデメリット?

  • お勧めできる音楽作成ソフトについて

    お勧めできる音楽作成ソフトについて 今まではcherryというMIDI作成ソフトでよく音楽を作ってきました。 時が経つにつれ「もっと壮大な曲を作ってみたいなぁ」と思うようになってきました。(本格的な音素材、オーケストラのような壮大な) そこで調べてみました。 最初に当たったのが「MIXTURE」というソフトです。商品説明は良さそうだと感じましたが、アマゾンでのカスタマーレビューをみてみると然程よい評価ではありませんでした。 次に「Music Maker 3」 これも本格的に作成できそうです。MIDIからの打ち込みも可能ということで、MIDIをやっている自分からするとより扱いやすいかと感じています。 今のところ、このMusic Maker 3への興味が強い状態なのですが、他の商品、或いはこの候補の中(といっても二つだけですが)の商品を比較して、どれが目的に合っていそうかどうか意見をお聞かせください。 自分のことなので自分の意見を尊重して思い切ってMusic Maker 3を買ってみるのもいいかもしれませんが、参考にしたいと思いますのでどうかよろしくお願いします。

  • MT4バックテストのモデリング品質がn/a

    Tickstoryで取得したeurjpy(1h)をmt4にexportして、バックテストを行いました。 このtickstoryのモデリング品質は99.9%と謳われていますが、 結果のモデリング品質はn/aと評価外です。 テストバー数は27543、モデルティック数は674201,不整合チャートエラーは0, でバーチャートは大部分が緑色で、先頭のごく一部だけ橙色です。 このn/aの原因を調べたいと思います。 ログファイルをエディタでざっと見ましたが、それらしい字句は見当たりませんでした。 この段階が通ると、必要があれば、モデル品質の評価基準と対比させるために、 実際のデモ口座のトレードのあった足と、hstファイルを読み全数比較するプログラムを作成し、 バックテストの精度を確認する用意はあるのですが、その前段階として、モデル品質の定義を押さえておきたいのです。

  • 3成分の気体混合

    25℃で75 gの窒素、23 gの酸素、2 gのアルゴンから100 gの合成空気を作るとすれば、自由エネルギーの変化がどれほどか?という問題が解けません。どうぞ、宜しくお願い致します。

  • オールモデルのオール単板などについて [アコギ]

    私はまだギター初心者レベルの者なのですが、材木の違いで音色にも独特の違いが出ると言われているので、腕前が上達した暁に、他のギターと弾き比べてその違いを実感したいと思い、オールローズウッド、オール単板モデルを探し出して購入したのですが、色々と疑問に思う事が出たので、ご質問させて下さい。 アコースティックギターでオール単板と言う言葉を良く使いますが、全て同じ材木(以下:オールモデル)のオール単板ギターは珍しいレア物なのでしょうか? ネットを探しても、中々見つかりません。 例えば、オールローズウッドやオールマホガニーです。 オールローズウッドモデルでも、Headway HD-ARのネックはマホガニーでしたが、「オール」っと言うのは、一般的にボディ部に限った事を指すのでしょうか? また、オールモデル、オール単板でメーカーから個人向けに販売されるのは、マホガニーぐらいで(Martin D-15など)、あとはローズウッドが稀に少量限定生産されるぐらいで、それ以外の木材だと特注しかないのでしょうか? 一般的なギターは、オール単板でもトップとサイドなどで材木が異なりますが、なぜそういうモデルが一般的になったんでしょうか? 研究の末に行き着いた答えなのか、又はコストの都合からでしょうか? 材木の違いで音色も異なるなら、全て同じ材木で作った方が純粋な音色で鳴るでしょうから、個人的にはオールモデルで作った方が良いんじゃないかと思うのですが。(高価な木材は除いて) ネットで調べると、材木の違いによる音色の特徴を書いてくれているサイトなどがありますが、そもそも何を基準にそう言われているのかが謎なのですが、どうやって材木ごとの音色の違いを判断されたのでしょうか? 材木ごとのオールモデルギターを作って弾き比べたとか、はたまた原材板状のを木琴の様に弾き比べて周波数を測定など、過去のギターの歴史で色々とされたのでしょうか? 科学的な比較でなければ、各々の感覚で評価が分かれるので、意味を成さないと思うのですが。 以上の事が気になって仕方ありません。 明確な答えでなくても、皆様のご意見でも宜しいので、ご回答頂ければ幸いです。

  • 混合(二重)ガウス近似について

    「ピークが2つある分布を2つのガウス分布の線形結合で近似する事」が定義なのですが、実際にどうやって分布を出すのか、全くわかりません…。。結合方法もわかりません…。 どなたか教えていただけないでしょうか?