版權聲明:本文為博主原創(chuàng)文章,轉載請指明轉載地址
www.cnblogs.com/fydeblog/p/7140974.html
前言
這篇notebook是關于機器學習中監(jiān)督學習的k近鄰算法,將介紹2個實例,分別是使用k-近鄰算法改進約會網站的效果和手寫識別系統(tǒng).
操作系統(tǒng):ubuntu14.04 運行環(huán)境:anaconda-python2.7-notebook 參考書籍:機器學習實戰(zhàn) notebook writer ----方陽
k-近鄰算法(kNN)的工作原理:存在一個樣本數據集合,也稱作訓練樣本集,并且樣本集中的每個數據都存在標簽,即我們知道樣本集中每一組數據與所屬分類的對應關系,輸入沒有標簽的新數據后,將新數據的每個特征與樣本集中數據對應的特征進行比較,然后算法提取樣本集中特征最相似的分類標簽。