分類(lèi)導(dǎo)航

以Random Forests和AdaBoost為例介紹下bagging和boosting方法我

發(fā)布時(shí)間：2017年07月24日作者： IT網(wǎng)絡(luò)文摘 (該文來(lái)自筆記，點(diǎn)擊查看原文)

我們學(xué)過(guò)決策樹(shù)、樸素貝葉斯、SVM、K近鄰等分類(lèi)器算法，他們各有優(yōu)缺點(diǎn)；自然的，我們可以將這些分類(lèi)器組合起來(lái)成為一個(gè)性能更好的分類(lèi)器，這種組合結(jié)果被稱(chēng)為 集成方法 (ensemble method)或者 元算法 (meta-method)。使用集成算法時(shí)有多種形式：

不同算法的集成
同一種算法在不同設(shè)置下的集成
數(shù)據(jù)集不同部分分配給不同分類(lèi)器之后的集成

1、bagging 和boosting綜述

bagging 和boosting中使用的分類(lèi)器類(lèi)型都是一樣的,即上述第二種形式。

bagging，也稱(chēng)為自舉匯聚法（boostrap aggegating) 是在原始數(shù)據(jù)集中有放回的選擇S次后得到S個(gè)新數(shù)據(jù)集的一種技術(shù)。新數(shù)據(jù)集和原數(shù)據(jù)集大小相等，但是有可能某一條數(shù)據(jù)被選擇了好幾次，而原數(shù)據(jù)集中某些數(shù)據(jù)在新數(shù)據(jù)集中可能不出現(xiàn)。在S個(gè)數(shù)據(jù)集建好之后，將某個(gè)算法分別作用于每個(gè)數(shù)據(jù)集就得到S個(gè)分類(lèi)器。對(duì)新數(shù)據(jù)集進(jìn)行分類(lèi)時(shí)，就用這S個(gè)分類(lèi)器進(jìn)行分類(lèi)，與此同時(shí)，選擇分類(lèi)器投票結(jié)果中最多的的類(lèi)別作為最終分類(lèi)結(jié)果，如圖1所示。Random Forests是一種更先進(jìn)的bagging算法，下文詳細(xì)介紹。

boosting 與bagging很類(lèi)似，不同的是Boosting是通過(guò)串行訓(xùn)練而獲得的，而每個(gè)新分類(lèi)器都是根據(jù)已經(jīng)訓(xùn)練好的分類(lèi)器的性能來(lái)進(jìn)行訓(xùn)練的。AdaBoost是這一種常用的boosting方法。

分類(lèi)導(dǎo)航

以Random Forests和AdaBoost為例介紹下bagging和boosting方法我

1、bagging 和boosting綜述

延伸閱讀

我想了解如何學(xué)習(xí)

分類(lèi)導(dǎo)航

以Random Forests和AdaBoost為例介紹下bagging和boosting方法 我

1、bagging 和boosting綜述

延伸閱讀

我想了解如何學(xué)習(xí)

以Random Forests和AdaBoost為例介紹下bagging和boosting方法我