在DBSCAN密度聚類算法中,我們對DBSCAN聚類算法的原理做了總結(jié),本文就對如何用scikit-learn來學(xué)習(xí)DBSCAN聚類做一個總結(jié),重點講述參數(shù)的意義和需要調(diào)參的參數(shù)。
1. scikit-learn中的DBSCAN類
在scikit-learn中,DBSCAN算法類為sklearn.cluster.DBSCAN。要熟練的掌握用DBSCAN類來聚類,除了對DBSCAN本身的原理有較深的理解以外,還要對最近鄰的思想有一定的理解。集合這兩者,就可以玩轉(zhuǎn)DBSCAN了。
2. DBSCAN類重要參數(shù)
DBSCAN類的重要參數(shù)也分為兩類,一類是DBSCAN算法本身的參數(shù),一類是最近鄰度量的參數(shù),下面我們對這些參數(shù)做一個總結(jié)。
1)eps: DBSCAN算法參數(shù),即我們的