條件隨機(jī)場CRF(一)從隨機(jī)場到線性鏈條件隨機(jī)場

    條件隨機(jī)場CRF(二) 前向后向算法評估標(biāo)記序列概率(TODO)

    條件隨機(jī)場CRF(三) 模型學(xué)習(xí)與維特比算法解碼(TODO)

    條件隨機(jī)場(Conditional Random Fields, 以下簡稱CRF)是給定一組輸入序列條件下另一組輸出序列的條件概率分布模型,在自然語言處理中得到了廣泛應(yīng)用。本系列主要關(guān)注于CRF的特殊形式:線性鏈(Linear chain) CRF。本文關(guān)注與CRF的模型基礎(chǔ)。

1.什么樣的問題需要CRF模型

    和HMM類似,在討論CRF之前,我們來看看什么樣的問題需要CRF模型。這里舉一個簡單的例子:

    假設(shè)我們有Bob一天從早到晚的一系列照片,Bob想考考我們,要我們猜這一系列的每張照片對應(yīng)的活動,比如: 工作的照片,吃飯的照片,唱歌的照片等等。一個比較直觀的辦法就是,我們找到Bob之前的日常生活的一系列照片,然后找Bob問清楚這些照片代表的活動標(biāo)記,這樣我們就可以用監(jiān)督學(xué)習(xí)的方法來訓(xùn)練一個分類模型,比如邏輯回歸,接著用模型去預(yù)測這一天的每張照片最可能的活動標(biāo)記。

    這種辦法雖然是可行的,但是卻忽略了一個重要的問題,就是這些照片之間的順序其實(shí)是有很大的時(shí)間順序關(guān)系的,而用上面的方法則會忽略這種關(guān)系。比如我們現(xiàn)在看到了一張Bob閉著嘴的照片,那么這張照片我們怎么標(biāo)記Bob的活動呢?比較難去打標(biāo)記。但是如果我們有Bob在這一張照片前一點(diǎn)點(diǎn)時(shí)間的照片的話,那么這張照片就好標(biāo)記了。如果在時(shí)間序列上前一張的照片里Bob在吃飯,那么這張閉嘴的照片很有可能是在吃飯咀嚼。而如果在時(shí)間序列上前一張的照片里Bob在唱歌,那么這張閉嘴的照片很有可能是在唱歌。

    為了讓我們的分類器表現(xiàn)的更好,可以在標(biāo)記數(shù)據(jù)的時(shí)候,可以考慮相鄰數(shù)據(jù)的標(biāo)記信息。這一點(diǎn),是普通的分類器難以做到的。而這一塊,也是CRF比較擅長的地方。

延伸閱讀

學(xué)習(xí)是年輕人改變自己的最好方式-Java培訓(xùn),做最負(fù)責(zé)任的教育,學(xué)習(xí)改變命運(yùn),軟件學(xué)習(xí),再就業(yè),大學(xué)生如何就業(yè),幫大學(xué)生找到好工作,lphotoshop培訓(xùn),電腦培訓(xùn),電腦維修培訓(xùn),移動軟件開發(fā)培訓(xùn),網(wǎng)站設(shè)計(jì)培訓(xùn),網(wǎng)站建設(shè)培訓(xùn)學(xué)習(xí)是年輕人改變自己的最好方式