分類(lèi)導(dǎo)航

機(jī)器學(xué)習(xí)：以二元決策樹(shù)為基學(xué)習(xí)器實(shí)現(xiàn)梯度提升算法的回歸分析

發(fā)布時(shí)間：2017年04月27日作者： IT網(wǎng)絡(luò)文摘 (該文來(lái)自筆記，點(diǎn)擊查看原文)

1.前言

前面提到的算法都是通過(guò)一個(gè)函數(shù)來(lái)擬合數(shù)據(jù)解決問(wèn)題，也就是單個(gè)機(jī)器學(xué)習(xí)算法，與其相對(duì)的還有多個(gè)機(jī)器學(xué)習(xí)算法，即：集成方法。

集成方法來(lái)源：如果模型之間近似相互獨(dú)立，則多個(gè)模型聯(lián)合的性能要優(yōu)于單個(gè)模型。大致上可以分成兩類(lèi)：（一）把幾種不同的機(jī)器學(xué)習(xí)算法集合到一起（二）把一種算法的不同參數(shù)組合起來(lái)。

集成方法由兩層算法組成。底層的算法叫基學(xué)習(xí)器或者弱學(xué)習(xí)器，是單個(gè)機(jī)器學(xué)習(xí)算法，然后這些算法被集成到高層的一個(gè)方法中。

梯度提升算法(Gradient Boosting)屬于把一種算法的不同參數(shù)組合起來(lái)的方式。

2.關(guān)于梯度提升算法

梯度提升算法是由Bagging算法改進(jìn)而來(lái)。

Bagging算法的基本原理：從數(shù)據(jù)集中有放回的隨機(jī)取樣，每次抽取一定比例的數(shù)據(jù)作為訓(xùn)練樣本，剩下的數(shù)據(jù)作為測(cè)試樣本。重復(fù)以上動(dòng)作n次，然后對(duì)每次動(dòng)作訓(xùn)練一個(gè)基學(xué)習(xí)器，然后把這些學(xué)習(xí)器組合到一起，成為集合算法。由于n的不確定性，所以并不是所有的基學(xué)習(xí)器都會(huì)參與到最后的集合算法中去，后面會(huì)介紹如何進(jìn)行篩選。

我想了解如何學(xué)習(xí)

<fieldset id="6zfen"><optgroup id="6zfen"><big id="6zfen"></big></optgroup></fieldset><big id="6zfen"></big>

分類(lèi)導(dǎo)航

機(jī)器學(xué)習(xí)：以二元決策樹(shù)為基學(xué)習(xí)器實(shí)現(xiàn)梯度提升算法的回歸分析

延伸閱讀

我想了解如何學(xué)習(xí)