scikit-learn官網(wǎng):http://scikit-learn.org/stable/
通常情況下,一個學習問題會包含一組學習樣本數(shù)據(jù),計算機通過對樣本數(shù)據(jù)的學習,嘗試對未知數(shù)據(jù)進行預測。
學習問題一般可以分為:
監(jiān)督學習(supervised learning)
分類(classification)
回歸(regression)
非監(jiān)督學習(unsupervised learning)
聚類(clustering)
監(jiān)督學習和非監(jiān)督學習的區(qū)別就是,監(jiān)督學習中,樣本數(shù)據(jù)會包含要預測的標簽(label),例如給定一組貓和狗的圖片并對不同的照片給定對應的標簽(貓或狗),而非監(jiān)督學習只會給定一組圖片,并不會給出標簽。
分類和回歸的區(qū)別是,分類的樣本數(shù)據(jù)中的標簽有大于等于2種,對于預測數(shù)據(jù)只需要判斷屬于其中哪個類即可,而回歸則是期望輸出由一個或多個連續(xù)的變量組成,例如根據(jù)魚的年齡和重量推斷魚的長度。