一、聚類的基礎(chǔ)知識(shí)介紹
1.聚類的定義
聚類就是對(duì)大量未知標(biāo)注的數(shù)據(jù)集,按數(shù)據(jù)的內(nèi)在相似性將數(shù)據(jù)集劃分為多個(gè)類別,使類別內(nèi)的數(shù)據(jù)相似度較大而類別間的數(shù)據(jù)相似度較小,他是無監(jiān)督的。
2.相似度/距離計(jì)算方法總結(jié)
閔可夫斯基距離Minkowski/歐式距離:
杰卡德相似系數(shù)(Jaccard):
余弦相似度(cosine similarity):