MNIST 被喻為深度學(xué)習(xí)中的Hello World示例,由Yann LeCun等大神組織收集的一個(gè)手寫數(shù)字的數(shù)據(jù)集,有60000個(gè)訓(xùn)練集和10000個(gè)驗(yàn)證集,是個(gè)非常適合初學(xué)者入門的訓(xùn)練集。這個(gè)網(wǎng)站也提供了業(yè)界對這個(gè)數(shù)據(jù)集的各種算法的嘗試結(jié)果,也能看出機(jī)器學(xué)習(xí)的算法的演進(jìn)史,從早期的線性邏輯回歸到K-means,再到兩層神經(jīng)網(wǎng)絡(luò),到多層神經(jīng)網(wǎng)絡(luò),再到最近的卷積神經(jīng)網(wǎng)絡(luò),隨著的算法模型的改善,錯(cuò)誤率也不斷下降,所以目前這個(gè)數(shù)據(jù)集的錯(cuò)誤率已經(jīng)可以控制在0.2%左右,基本和人類識(shí)別的能力相當(dāng)了。

 

這篇文章的例子我們會(huì)用一個(gè)更加有趣點(diǎn)的數(shù)據(jù)集 notMNIST,和MNIST不同的是它是一個(gè)各種形態(tài)的字母的數(shù)據(jù)集合,總共有a~j 10個(gè)字母組成,字母a相對應(yīng)的一些圖片如下:

seo優(yōu)化培訓(xùn),網(wǎng)絡(luò)推廣培訓(xùn),網(wǎng)絡(luò)營銷培訓(xùn),SEM培訓(xùn),網(wǎng)絡(luò)優(yōu)化,在線營銷培訓(xùn)

在這個(gè)例子中,我們會(huì)使用TensorFlow和sklearn等庫,對數(shù)據(jù)集進(jìn)行一系列處理,最終使用邏輯回歸模型來進(jìn)行機(jī)器學(xué)習(xí)并且預(yù)測。

 

1. 準(zhǔn)備環(huán)境

網(wǎng)友評(píng)論