1 什么是機(jī)器學(xué)習(xí)
什么是機(jī)器學(xué)習(xí)?
這個(gè)問題不同的人員會有不同的理解。我個(gè)人覺得,用大白話來描述機(jī)器學(xué)習(xí),就是讓計(jì)算機(jī)能夠通過一定方式的學(xué)習(xí)和訓(xùn)練,選擇合適的模型,在遇到新輸入的數(shù)據(jù)時(shí),可以找出有用的信息,并預(yù)測潛在的需求。最終反映的結(jié)果就是,好像計(jì)算機(jī)或者其他設(shè)備跟人類一樣具有智能化的特征,能夠快速識別和選擇有用的信息。
機(jī)器學(xué)習(xí)通??梢苑譃槿齻€(gè)大的步驟,即 輸入、整合、輸出,可以用下圖來表示大致的意思:
2 機(jī)器學(xué)習(xí)示例(scikit-learn)
在python語言中,scikit-learn是一個(gè)開源的機(jī)器學(xué)習(xí)庫。下面以sklearn為例,來簡單描述機(jī)器學(xué)習(xí)的過程。
2.1 加載數(shù)據(jù)
通常第一步是獲取相關(guān)數(shù)據(jù),并進(jìn)行相應(yīng)的處理,使之可以在后續(xù)過程中使用。
from sklearn import datasets
加載iris數(shù)據(jù)集并查看相關(guān)信息
# 加載數(shù)據(jù)集iris = datasets.load_iris()# print(iris)print(type(iris)) print(iris.keys())# 查看部分?jǐn)?shù)據(jù)print(iris.data[ :5, :])# print(iris.data)
<class 'sklearn.datasets.base.Bunch'> dict_keys(['DESCR', 'data', 'feature_names', 'target', 'target_names']) [[ 5.1 3.5 1.4 &nb