聲明:本文是站在回歸分析角度講的,分類(lèi)的理解可能跟這有點(diǎn)不一樣。
1.前言
隨機(jī)森林也是集成方法的一種,是對(duì)Bagging算法的改進(jìn)。
隨機(jī)森林主要有兩步組成:
1)有放回的隨機(jī)抽取樣本數(shù)據(jù),形成新的樣本集。這部分和Bagging算法一樣,但是有兩點(diǎn)需要注意:
a)新的樣本集的大小和原始樣本集的大小是一樣的。假如原始樣本有1000個(gè)數(shù)據(jù),那么新樣本集也要包括1000個(gè)數(shù)據(jù),只是新樣本集里面會(huì)含有部分重復(fù)的數(shù)據(jù),這樣可以避免過(guò)度擬合的問(wèn)題。
b)每生成一個(gè)決策樹(shù),都需要重新對(duì)原始數(shù)據(jù)進(jìn)行取樣。假如進(jìn)行k次訓(xùn)練(即生成k課樹(shù)),那么就需要重復(fù)k次這個(gè)動(dòng)作
2)無(wú)放回的隨機(jī)抽取屬性列。假如有12個(gè)屬性(即12列),從這12個(gè)屬性列中隨機(jī)抽取無(wú)重復(fù)的n列(一般建議是總屬性的1/3)進(jìn)行運(yùn)算。每次訓(xùn)練都需要重新抽取
延伸閱讀
- ssh框架 2016-09-30
- 阿里移動(dòng)安全 [無(wú)線安全]玩轉(zhuǎn)無(wú)線電——不安全的藍(lán)牙鎖 2017-07-26
- 消息隊(duì)列NetMQ 原理分析4-Socket、Session、Option和Pipe 2024-03-26
- Selective Search for Object Recognition 論文筆記【圖片目標(biāo)分割】 2017-07-26
- 詞向量-LRWE模型-更好地識(shí)別反義詞同義詞 2017-07-26
- 從棧不平衡問(wèn)題 理解 calling convention 2017-07-26
- php imagemagick 處理 圖片剪切、壓縮、合并、插入文本、背景色透明 2017-07-26
- Swift實(shí)現(xiàn)JSON轉(zhuǎn)Model - HandyJSON使用講解 2017-07-26
- 阿里移動(dòng)安全 Android端惡意鎖屏勒索應(yīng)用分析 2017-07-26
- 集合結(jié)合數(shù)據(jù)結(jié)構(gòu)來(lái)看看(二) 2017-07-26