聲明:本文是站在回歸分析角度講的,分類(lèi)的理解可能跟這有點(diǎn)不一樣。

1.前言

        隨機(jī)森林也是集成方法的一種,是對(duì)Bagging算法的改進(jìn)。

        隨機(jī)森林主要有兩步組成:

        1)有放回的隨機(jī)抽取樣本數(shù)據(jù),形成新的樣本集。這部分和Bagging算法一樣,但是有兩點(diǎn)需要注意:

             a)新的樣本集的大小和原始樣本集的大小是一樣的。假如原始樣本有1000個(gè)數(shù)據(jù),那么新樣本集也要包括1000個(gè)數(shù)據(jù),只是新樣本集里面會(huì)含有部分重復(fù)的數(shù)據(jù),這樣可以避免過(guò)度擬合的問(wèn)題。

             b)每生成一個(gè)決策樹(shù),都需要重新對(duì)原始數(shù)據(jù)進(jìn)行取樣。假如進(jìn)行k次訓(xùn)練(即生成k課樹(shù)),那么就需要重復(fù)k次這個(gè)動(dòng)作

        2)無(wú)放回的隨機(jī)抽取屬性列。假如有12個(gè)屬性(即12列),從這12個(gè)屬性列中隨機(jī)抽取無(wú)重復(fù)的n列(一般建議是總屬性的1/3)進(jìn)行運(yùn)算。每次訓(xùn)練都需要重新抽取

延伸閱讀

學(xué)習(xí)是年輕人改變自己的最好方式-Java培訓(xùn),做最負(fù)責(zé)任的教育,學(xué)習(xí)改變命運(yùn),軟件學(xué)習(xí),再就業(yè),大學(xué)生如何就業(yè),幫大學(xué)生找到好工作,lphotoshop培訓(xùn),電腦培訓(xùn),電腦維修培訓(xùn),移動(dòng)軟件開(kāi)發(fā)培訓(xùn),網(wǎng)站設(shè)計(jì)培訓(xùn),網(wǎng)站建設(shè)培訓(xùn)學(xué)習(xí)是年輕人改變自己的最好方式