分類導(dǎo)航

機(jī)器學(xué)習(xí)－感知機(jī)實現(xiàn)（1）

發(fā)布時間：2017年03月10日作者：文章轉(zhuǎn)自網(wǎng)絡(luò)，版權(quán)歸原作者所有，反饋可立刻刪除 (該文來自筆記，點擊查看原文)

這系列文章不是為了去研究那些數(shù)學(xué)公式怎么推導(dǎo)，而是為了能將機(jī)器學(xué)習(xí)的思想快速用代碼實現(xiàn)。最主要是梳理一下自己的想法。

感知機(jī)

感知機(jī)，就是接受每個感知元（神經(jīng)元）傳輸過來的數(shù)據(jù)，當(dāng)數(shù)據(jù)到達(dá)某個閥值的時候就會產(chǎn)生對應(yīng)的行為
如下圖，對應(yīng)每個感知元有一個對應(yīng)的權(quán)重，當(dāng)數(shù)據(jù)到達(dá)閥值u的時候就會執(zhí)行對應(yīng)的行為。

u = w₀ + w₁x₁ + w₂x₂ +......w_nx_n

對應(yīng)到垃圾郵件處理上，當(dāng)u > 0時就是正常郵件。相反則為垃圾郵件
對于這樣的模型就可以稱之為簡單的感知機(jī)。也就是一個神經(jīng)網(wǎng)絡(luò)的基本單位。

權(quán)重向量的更新
上面所提到的w₁,w₂等就是就是對應(yīng)每個是否是垃圾郵件的衡量標(biāo)準(zhǔn)，而x₁,x₂...就是郵件中被監(jiān)測的詞組的數(shù)目
比如x₁和x₂相同的時候，w₁和w₂的絕對值較大的一方對結(jié)果，也就是u的影響更大。所以，我們也把w₁,w₂....稱之為x₁,x₂..的權(quán)重值
向量大學(xué)生就業(yè)培訓(xùn),高中生培訓(xùn),在職人員轉(zhuǎn)行培訓(xùn),企業(yè)團(tuán)訓(xùn) 即為權(quán)重向量

根據(jù)訓(xùn)練數(shù)據(jù)中的期待結(jié)果和預(yù)測結(jié)果不斷的修改權(quán)重即可。那么具體到項目中應(yīng)該怎么修改w呢

1. 隨機(jī)為w₁,w₂,...w_n設(shè)置一個值
2. 不斷重復(fù)以下步驟
　　* 輸入訓(xùn)練數(shù)據(jù)，如果結(jié)果不正確就進(jìn)行修改
　　* 當(dāng)所有的訓(xùn)練數(shù)據(jù)的結(jié)果都正確時就結(jié)束運(yùn)算
思想很簡單，那么［不正確就修改］這一句話，在簡單的感知機(jī)中能夠很簡單的修改，那么在深度神經(jīng)網(wǎng)絡(luò)中的時候該怎么計算呢

梯度下降法
首先介紹一個定義[誤差函數(shù)（即損失函數(shù)）]E，即輸出結(jié)果和期待結(jié)果的差值
為了方便以后的計算這個定義又可以改為變化根據(jù)向量w的變化誤差函數(shù)是否在朝著最小變化的方向遞進(jìn)
w和誤差函數(shù)的關(guān)系如下圖所示
大學(xué)生就業(yè)培訓(xùn),高中生培訓(xùn),在職人員轉(zhuǎn)行培訓(xùn),企業(yè)團(tuán)訓(xùn)
曲線最下方的w的值即為一次計算所期望的值,如果仔細(xì)分析我們可以知道這種計算就是微分計算
而這種變化趨勢就是微分計算的值
大學(xué)生就業(yè)培訓(xùn),高中生培訓(xùn),在職人員轉(zhuǎn)行培訓(xùn),企業(yè)團(tuán)訓(xùn)
那么w_i的變化過程即為

簡單的理解就是當(dāng)變化趨勢為負(fù)時w_i朝正直方向移動，反之亦然.但是當(dāng)變化趨勢很大的時候w_i的變化就會很大，
而變化趨勢很小的時候w_i的變化就又會很小。這樣的計算會讓整個過程很難收斂，因此我們會設(shè)置一個比較小的正數(shù)參數(shù)
來參與計算。
大學(xué)生就業(yè)培訓(xùn),高中生培訓(xùn),在職人員轉(zhuǎn)行培訓(xùn),企業(yè)團(tuán)訓(xùn)

分類導(dǎo)航

機(jī)器學(xué)習(xí)－感知機(jī)實現(xiàn)（1）

延伸閱讀

我想了解如何學(xué)習(xí)