以下內(nèi)容來源于一次部門內(nèi)部的分享,主要針對AI初學(xué)者,介紹包括CNN、Deep Q Network以及TensorFlow平臺等內(nèi)容。由于筆者并非深度學(xué)習(xí)算法研究者,因此以下更多從應(yīng)用的角度對整個(gè)系統(tǒng)進(jìn)行介紹,而不會進(jìn)行詳細(xì)的公式推導(dǎo)。
** 關(guān)于Flappy Bird **
Flappy Bird(非官方譯名:笨鳥先飛)是一款2013年鳥飛類游戲,由越南河內(nèi)獨(dú)立游戲開發(fā)者阮哈東(Dong Nguyen)開發(fā),另一個(gè)獨(dú)立游戲開發(fā)商GEARS Studios發(fā)布?!?以上內(nèi)來自《維基百科》
Flappy Bird操作簡單,通過點(diǎn)擊手機(jī)屏幕使Bird上升,穿過柱狀障礙物之后得分,碰到則游戲結(jié)束。由于障礙物高低不等,控制Bird上升和下降需要反應(yīng)快并且靈活,要得到較高的分?jǐn)?shù)并不容易,筆者目前最多得過10分。
本文主要介紹如何通過AI(人工智能)的方式玩Flappy Bird游戲,分為以下四個(gè)部分內(nèi)容:
Flappy Bird 游戲展示
模型:卷積神經(jīng)網(wǎng)絡(luò)
算法:Deep Q Network
代碼:TensorFlow實(shí)現(xiàn)
一、Flappy Bird 游戲展示
在介紹模型、算法前先來直接看下效果,上圖是剛開始訓(xùn)練的時(shí)候,畫面中的小鳥就像無頭蒼蠅一樣亂飛,下圖展示的是在本機(jī)(后面會給出配置)訓(xùn)練超過10小時(shí)后(訓(xùn)練步數(shù)超過2000000)的情況,其最好成績已經(jīng)超過200分,人類玩家已基本不可能超越。
延伸閱讀
- ssh框架 2016-09-30
- 阿里移動安全 [無線安全]玩轉(zhuǎn)無線電——不安全的藍(lán)牙鎖 2017-07-26
- 消息隊(duì)列NetMQ 原理分析4-Socket、Session、Option和Pipe 2024-03-26
- Selective Search for Object Recognition 論文筆記【圖片目標(biāo)分割】 2017-07-26
- 詞向量-LRWE模型-更好地識別反義詞同義詞 2017-07-26
- 從棧不平衡問題 理解 calling convention 2017-07-26
- php imagemagick 處理 圖片剪切、壓縮、合并、插入文本、背景色透明 2017-07-26
- Swift實(shí)現(xiàn)JSON轉(zhuǎn)Model - HandyJSON使用講解 2017-07-26
- 阿里移動安全 Android端惡意鎖屏勒索應(yīng)用分析 2017-07-26
- 集合結(jié)合數(shù)據(jù)結(jié)構(gòu)來看看(二) 2017-07-26