(一),決策樹概念
1,決策樹算法(ID3,C4.5 ,CART)之間的比較:
1,ID3算法在選擇根節(jié)點和各內(nèi)部節(jié)點中的分支屬性時,采用信息增益作為評價標(biāo)準(zhǔn)。信息增益的缺點是傾向于選擇取值較多的屬性,在有些情況下這類屬性可能不會提供太多有價值的信息。
2 ID3算法只能對描述屬性為離散型屬性的數(shù)據(jù)集構(gòu)造決策樹,其余兩種算法對離散和連續(xù)都可以處理
2,C4.5算法實例介紹(參考網(wǎng)址:http://m.blog.csdn.net/article/details?id=44726921)