機械学習C4.5の調査結果と決定木アルゴリズムについて

このQ&Aのポイント
  • 機械学習C4.5の調査結果をまとめました。機械学習C4.5はID3と異なるアルゴリズムですが、情報が限られており、情報の取得が難しいです。
  • C4.5の決定木アルゴリズムを理解するために、プログラムを組んで実際に試してみたいと考えています。アルゴリズムの詳しい教授をお願いできますでしょうか?
  • 離散値に関してはC4.5での計算方法は理解できますが、連続値に関してはまだ理解ができていません。具体的な計算方法について教えていただけますか?
回答を見る
  • ベストアンサー

機械学習C4.5について調べているのですが

機械学習C4.5について調べているのですが 調べ方が悪いせいか、Webに公開されいるもののほとんどが ID3に関するものばかりで 調べたいC4.5については見つけることができませんでした。 C4.5の決定木アルゴリズムを理解して 実際にプログラムを組んでみたいと思っているので どなたかアルゴリズムを教授いただけないでしょうか? ID3の説明ページを読む限りでは (http://ja.wikipedia.org/wiki/ID3) 離散値については計算できそうなのですが 連続値に関して理解ができていません。 仮に以下のようなデータがあった場合に どのように計算するのでしょうか? ---------------------------------------------- 生徒 国語 数学 英語 進学校 A 50 50 60 S B 30 40 50 T C 90 80 90 U D 80 70 70 U E 60 40 70 S ---------------------------------------------- 以上よろしくお願いいたします。

質問者が選んだベストアンサー

  • ベストアンサー
回答No.2

あいかわらずソースも読まず回答してみますが、御容赦くださいませ。 (解読していると永遠に回答できそうにないので) ですのでC4.5というより2分木の一般論ですが、 どこで分けるのか?と言う事に関しては、 たとえば国語だったら C>D>E>A>B の順なので、4つの不等号のどこかで分けることになります。 数学や英語も含めて一番きれいに分かれるところをとればよい、 ということになろうかと思います。 たとえばCとDの間でわけるとして、具体的なしきい値をどこにするか? は本質的にはどこでもよいと思います。 うろ覚えですが実際には、 「意味のある値」ということで与えられたデータにある値を使っている ケースが多かったと印象があります。 (具体的にC4.5がどうだったか覚えていませんが) C4.5がどうなっているかは、公開されているコードを解読されるのが おすすめです。

kobomac
質問者

お礼

たびたびのごかいとうありがとうございます。 あれからさらに調べてみたのですがなんとも言えずという状態のため 本を購入してアルゴリズムをしっかりと勉強使用と思いました。 やはりコードを読んでしまうと作る意味をあまり感じなくなってしまうので あくまでもプログラムの先入観をなしで挑戦したいと思います。

その他の回答 (1)

回答No.1

C4.5は使ったことがあるだけなので、正確なところが解説できず申し訳ありませんが、 C4.5はQuinlan自身がソースを公開してますから、 それを試してみる&解読するのが最も正確だと思います。 大昔はソースコード付きの解説本があったそうですが絶版だと思います。 (少なくとも日本語版は。再販とかしてなければ) 勉強のために自力でコーディングしたいと言うことであればこの回答は忘れてください。 C4.5が正確にどうなっているか分かりませんが、連続値なら好きなところしきい値をきめて 2分してしまえばあとは2カテゴリの離散のケースと一緒ではないでしょうか。

参考URL:
http://www.rulequest.com/Personal/
kobomac
質問者

お礼

回答ありがとうございます。 自力でコーディングしてみたいと思っています・・・。 >連続値なら好きなところしきい値をきめて >2分してしまえばあとは2カテゴリの離散のケースと一緒ではないでしょうか。 C4.5の説明が記載されているページを読んで ソートを行ってから分ける場所を決めるということは理解できたのですが 閾値はどうやって決めるのでしょうか? (やっぱり単純に計算をするのだと思うのですが…)

関連するQ&A

  • 『機械学習』に関する質問です。

    『教師有り学習』の際に『戻り値』を指定してしまいますと、 どうして其の学習が『教師無し学習( http://ja.wikipedia.org/wiki/%E6%95%99%E5%B8%AB%E3%81%AA%E3%81%97%E5%AD%A6%E7%BF%92 )』になるのでしょうか?

  • ID3の書き方を教えてください

    c言語で http://ja.wikipedia.org/wiki/ID3 のプログラムを作りたいのですが、アルゴリズムは書いてあるものの、 どの様にcで表現して良いか悩んでいます。 独立変数の中身は全て0か1の乱数でで良いので流れを是非ご教授お願いします。

  • ノルウェー、スウェーデン、デンマーク語のそれぞれの

    ノルウェー、スウェーデン、デンマーク語のそれぞれのおススメの学習参考書、辞書、読み物とは? 皆さんにとってノルウェー語、スウェーデン語、デンマーク語とは? 言語カテゴリー皆さんの ご回答のほど、 お待ちしております。 https://ja.m.wikipedia.org/wiki/デンマーク語 https://ja.m.wikipedia.org/wiki/スウェーデン語 https://ja.m.wikipedia.org/wiki/ノルウェー語 https://en.wikipedia.org/wiki/Danish_language https://en.wikipedia.org/wiki/Swedish_language https://en.wikipedia.org/wiki/Norwegian_language

  • アイスランド語、グリーンランド語のそれぞれのおスス

    アイスランド語、グリーンランド語のそれぞれのおススメの学習参考書、辞書、読み物とは? 皆さんにとってアイスランド語、グリーンランド語とは? 言語カテゴリー皆さんの ご回答のほど、 お待ちしております。 https://ja.m.wikipedia.org/wiki/アイスランド語 https://en.wikipedia.org/wiki/Icelandic_language https://ja.m.wikipedia.org/wiki/グリーンランド語 https://en.wikipedia.org/wiki/Greenlandic_language

  • 0.9999…=1がわからない

    0.999... - Wikipedia http://ja.wikipedia.org/wiki/0.999... を見たのですが理解できません。 イコールは同一って記号って習ったので 0.9999...と続いても最後に0.0000000…1を足さないと1にならないと思うんです。 わかりやすい説明があればよろしくお願いします。

  • なぜ、ロシア文学とは重い、難しい、ストーリーが長く

    なぜ、ロシア文学とは重い、難しい、ストーリーが長く 敷居が高い、愛称が分からない、正教、 貨幣の価値が分からない、 お酒の匂いがしそう、 著者の主義主張ばかり、の印象を多くの 日本人は思うのだろうか? ロシア文学とは? サミズダッド、亡命作家、亡命文学とは? ロシア現代文学とは? ロシア文学の 利点、欠点、限界、盲点とは? 【長い、重い、難しい?】 文学からみるロシア 沼野充義×松下隆志×池澤春菜 #ロシア #プーチン #ニコドキュ #nicohou nico.ms/lv277245414?re… https://ja.wikipedia.org/wiki/沼野充義 松下隆志(まつした・たかし)ロシア文学 http://www.l.u-tokyo.ac.jp/teacher/database/104.html https://ja.m.wikipedia.org/wiki/池澤春菜 http://www.l.u-tokyo.ac.jp/assets/files/teacher/2010-2011/NUMANO%20Mitsuyoshi.pdf https://ja.m.wikipedia.org/wiki/ロシア文学 https://ja.m.wikipedia.org/wiki/サミズダート https://en.wikipedia.org/wiki/Samizdat https://ru.wikipedia.org/wiki/Самиздат https://kotobank.jp/word/亡命文学-132464 https://ja.m.wikipedia.org/wiki/Category:亡命文学 https://en.wikipedia.org/wiki/Category:Exilliteratur http://www.l.u-tokyo.ac.jp/~slav/ https://en.wikipedia.org/wiki/Russian_literature https://ru.wikipedia.org/wiki/Русская_литература http://synodos.jp/authorcategory/matsushitatakashi 現代ロシア文学 http://src-h.slav.hokudai.ac.jp/literature/literature-list.html

  • 大数の法則について

    大数の法則について、例えば、wikipedia http://ja.wikipedia.org/wiki/%E5%A4%A7%E6%95%B0%E3%81%AE%E6%B3%95%E5%89%87 なんかでは難しく書いてあってあまりよく分からないのですが、 データ数nが無限に大きくなったときに、その確率変数Xの離散的 な平均が連続的な平均に収束するということでしょうか? このような理解であっているか不安なので、ご指摘お願いします。

  • ウランの電子分極率

    こんにちは、 こんにちは、 U235やU238の電子分極率は、幾つでしょうか? http://ja.wikipedia.org/wiki/%E5%88%86%E6%A5%B5%E7%8E%87

  • 今帰仁方言ではなく日本語(標準語)俗語?のわーび(

    今帰仁方言ではなく日本語(標準語)俗語?のわーび(ワービ)の 意味、語源、使用例、語感とは? 私の友人の日本人 (60歳以上都内在住で、 沖縄今帰仁には住まわれた事はない方)が なぜが意図的に文末で使われるのだがどう意味があるのだろうか? 60歳以上でないと何か分からない俗語、流行語の類いなのだろうか? 関東地区の方言にわーび、ワービ もしくは それに近い言葉はあるのだろうか? 今帰仁方言のわーびとは具体的にどの様に使う言葉なのだろうか? 東京方言の上部、上の方との語感的な違いとは? 国頭郡(今帰仁)方言と那覇方言の違いとは? 関東、首都圏方言と標準日本語の違いとは? 日本語カテゴリー皆さんの ご回答のほど、 お待ちしております。 参照。 http://ryukyu-lang.lib.u-ryukyu.ac.jp/nkjn/details.php?ID=NK61118 今帰仁(なきじん)方言音声データベース ワービ /waabi/ (名詞) 意味: 〈1〉うわべ。表面。 〈2〉上の方。 なッぴ わービカてィ あギレーもっと上の方に上げよ。 関連標準語: うえ〔上〕〔上の方〕,うわべ〔上辺〕,ひょうめん〔表面〕 https://ja.m.wikipedia.org/wiki/今帰仁村 https://en.wikipedia.org/wiki/Nakijin,_Okinawa https://zh.wikipedia.org/wiki/今歸仁村 https://ko.wikipedia.org/wiki/나키진_촌 https://ru.wikipedia.org/wiki/Накидзин https://ja.wikipedia.org/wiki/国頭郡 https://en.wikipedia.org/wiki/Kunigami_District,_Okinawa https://ja.wikipedia.org/wiki/ウチナーヤマトグチ https://en.wikipedia.org/wiki/Okinawan_Japanese https://ja.m.wikipedia.org/wiki/関東方言 https://en.wikipedia.org/wiki/Kantō_dialect https://ja.wikipedia.org/wiki/首都圏方言

  • Iphoneパソコンをしている現代人を原始古代中世

    Iphoneパソコンをしている現代人を原始古代中世近代人が 見たらば何と言うのだろうか? (シャーマン、魔術師、悪魔使い、アンティクコレクター、 未来から来た人間、 独り言を言う頭が可笑しい人間、 光り輝き言葉を喋り、模様が変わる珍しい石(iphoneパソコン)と会話し遊ぶ人間. 予言者モーゼの十戒見たいなものを持つ人間等々、) Iphone パソコンが発明されてなければ、 我々人類はどのようになっていたのだろうか? Iphone パソコンの利点、欠点、限界、盲点とは? 歴史カテゴリー皆さんの ご回答のほど、 お待ちしております。 https://ja.m.wikipedia.org/wiki/IPhone_(初代) https://en.wikipedia.org/wiki/IPhone_(1st_generation) https://ru.wikipedia.org/wiki/IPhone_(первого_поколения) https://ja.m.wikipedia.org/wiki/パーソナルコンピュータ史 https://en.wikipedia.org/wiki/History_of_personal_computers https://ru.wikipedia.org/wiki/История_персональных_компьютеров https://ja.wikipedia.org/wiki/コンピュータ https://en.wikipedia.org/wiki/Computer https://ru.wikipedia.org/wiki/Компьютер https://ja.m.wikipedia.org/wiki/古代 https://en.wikipedia.org/wiki/Ancient_history https://ru.wikipedia.org/wiki/Древний_мир https://ja.wikipedia.org/wiki/世界の歴史 https://es.wikipedia.org/wiki/Historia_universal