1 什么是機(jī)器學(xué)習(xí)

什么是機(jī)器學(xué)習(xí)?

這個(gè)問題不同的人員會有不同的理解。我個(gè)人覺得,用大白話來描述機(jī)器學(xué)習(xí),就是讓計(jì)算機(jī)能夠通過一定方式的學(xué)習(xí)和訓(xùn)練,選擇合適的模型,在遇到新輸入的數(shù)據(jù)時(shí),可以找出有用的信息,并預(yù)測潛在的需求。最終反映的結(jié)果就是,好像計(jì)算機(jī)或者其他設(shè)備跟人類一樣具有智能化的特征,能夠快速識別和選擇有用的信息。

機(jī)器學(xué)習(xí)通??梢苑譃槿齻€(gè)大的步驟,即 輸入、整合、輸出,可以用下圖來表示大致的意思:

大數(shù)據(jù)培訓(xùn),云培訓(xùn),數(shù)據(jù)挖掘培訓(xùn),云計(jì)算培訓(xùn),高端軟件開發(fā)培訓(xùn),項(xiàng)目經(jīng)理培訓(xùn)

2 機(jī)器學(xué)習(xí)示例(scikit-learn)

在python語言中,scikit-learn是一個(gè)開源的機(jī)器學(xué)習(xí)庫。下面以sklearn為例,來簡單描述機(jī)器學(xué)習(xí)的過程。

2.1 加載數(shù)據(jù)

通常第一步是獲取相關(guān)數(shù)據(jù),并進(jìn)行相應(yīng)的處理,使之可以在后續(xù)過程中使用。

from sklearn import datasets
  • 加載iris數(shù)據(jù)集并查看相關(guān)信息

# 加載數(shù)據(jù)集iris = datasets.load_iris()# print(iris)print(type(iris))
print(iris.keys())# 查看部分?jǐn)?shù)據(jù)print(iris.data[ :5, :])# print(iris.data)
<class 'sklearn.datasets.base.Bunch'>
dict_keys(['DESCR', 'data', 'feature_names', 'target', 'target_names'])
[[ 5.1  3.5  1.4 &nb