(一),決策樹(shù)概念
1,決策樹(shù)算法(ID3,C4.5 ,CART)之間的比較:
1,ID3算法在選擇根節(jié)點(diǎn)和各內(nèi)部節(jié)點(diǎn)中的分支屬性時(shí),采用信息增益作為評(píng)價(jià)標(biāo)準(zhǔn)。信息增益的缺點(diǎn)是傾向于選擇取值較多的屬性,在有些情況下這類屬性可能不會(huì)提供太多有價(jià)值的信息。
2 ID3算法只能對(duì)描述屬性為離散型屬性的數(shù)據(jù)集構(gòu)造決策樹(shù),其余兩種算法對(duì)離散和連續(xù)都可以處理
2,C4.5算法實(shí)例介紹(參考網(wǎng)址:http://m.blog.csdn.net/article/details?id=44726921)