MNIST 被喻為深度學(xué)習(xí)中的Hello World示例,由Yann LeCun等大神組織收集的一個手寫數(shù)字的數(shù)據(jù)集,有60000個訓(xùn)練集和10000個驗證集,是個非常適合初學(xué)者入門的訓(xùn)練集。這個網(wǎng)站也提供了業(yè)界對這個數(shù)據(jù)集的各種算法的嘗試結(jié)果,也能看出機(jī)器學(xué)習(xí)的算法的演進(jìn)史,從早期的線性邏輯回歸到K-means,再到兩層神經(jīng)網(wǎng)絡(luò),到多層神經(jīng)網(wǎng)絡(luò),再到最近的卷積神經(jīng)網(wǎng)絡(luò),隨著的算法模型的改善,錯誤率也不斷下降,所以目前這個數(shù)據(jù)集的錯誤率已經(jīng)可以控制在0.2%左右,基本和人類識別的能力相當(dāng)了。
這篇文章的例子我們會用一個更加有趣點的數(shù)據(jù)集 notMNIST,和MNIST不同的是它是一個各種形態(tài)的字母的數(shù)據(jù)集合,總共有a~j 10個字母組成,字母a相對應(yīng)的一些圖片如下:
在這個例子中,我們會使用TensorFlow和sklearn等庫,對數(shù)據(jù)集進(jìn)行一系列處理,最終使用邏輯回歸模型來進(jìn)行機(jī)器學(xué)習(xí)并且預(yù)測。
1. 準(zhǔn)備環(huán)境
延伸閱讀
- ssh框架 2016-09-30
- 阿里移動安全 [無線安全]玩轉(zhuǎn)無線電——不安全的藍(lán)牙鎖 2017-07-26
- 消息隊列NetMQ 原理分析4-Socket、Session、Option和Pipe 2024-03-26
- Selective Search for Object Recognition 論文筆記【圖片目標(biāo)分割】 2017-07-26
- 詞向量-LRWE模型-更好地識別反義詞同義詞 2017-07-26
- 從棧不平衡問題 理解 calling convention 2017-07-26
- php imagemagick 處理 圖片剪切、壓縮、合并、插入文本、背景色透明 2017-07-26
- Swift實現(xiàn)JSON轉(zhuǎn)Model - HandyJSON使用講解 2017-07-26
- 阿里移動安全 Android端惡意鎖屏勒索應(yīng)用分析 2017-07-26
- 集合結(jié)合數(shù)據(jù)結(jié)構(gòu)來看看(二) 2017-07-26