scikit-learn官網(wǎng):http://scikit-learn.org/stable/

通常情況下,一個學習問題會包含一組學習樣本數(shù)據(jù),計算機通過對樣本數(shù)據(jù)的學習,嘗試對未知數(shù)據(jù)進行預測。

學習問題一般可以分為:

  • 監(jiān)督學習(supervised learning)

    • 分類(classification)

    • 回歸(regression)

  • 非監(jiān)督學習(unsupervised learning)

    • 聚類(clustering)

監(jiān)督學習和非監(jiān)督學習的區(qū)別就是,監(jiān)督學習中,樣本數(shù)據(jù)會包含要預測的標簽(label),例如給定一組貓和狗的圖片并對不同的照片給定對應的標簽(貓或狗),而非監(jiān)督學習只會給定一組圖片,并不會給出標簽。

分類和回歸的區(qū)別是,分類的樣本數(shù)據(jù)中的標簽有大于等于2種,對于預測數(shù)據(jù)只需要判斷屬于其中哪個類即可,而回歸則是期望輸出由一個或多個連續(xù)的變量組成,例如根據(jù)魚的年齡和重量推斷魚的長度。

網(wǎng)友評論