條件隨機(jī)場CRF(一)從隨機(jī)場到線性鏈條件隨機(jī)場
條件隨機(jī)場CRF(二) 前向后向算法評估標(biāo)記序列概率(TODO)
條件隨機(jī)場CRF(三) 模型學(xué)習(xí)與維特比算法解碼(TODO)
條件隨機(jī)場(Conditional Random Fields, 以下簡稱CRF)是給定一組輸入序列條件下另一組輸出序列的條件概率分布模型,在自然語言處理中得到了廣泛應(yīng)用。本系列主要關(guān)注于CRF的特殊形式:線性鏈(Linear chain) CRF。本文關(guān)注與CRF的模型基礎(chǔ)。
1.什么樣的問題需要CRF模型
和HMM類似,在討論CRF之前,我們來看看什么樣的問題需要CRF模型。這里舉一個簡單的例子:
假設(shè)我們有Bob一天從早到晚的一系列照片,Bob想考考我們,要我們猜這一系列的每張照片對應(yīng)的活動,比如: 工作的照片,吃飯的照片,唱歌的照片等等。一個比較直觀的辦法就是,我們找到Bob之前的日常生活的一系列照片,然后找Bob問清楚這些照片代表的活動標(biāo)記,這樣我們就可以用監(jiān)督學(xué)習(xí)的方法來訓(xùn)練一個分類模型,比如邏輯回歸,接著用模型去預(yù)測這一天的每張照片最可能的活動標(biāo)記。
這種辦法雖然是可行的,但是卻忽略了一個重要的問題,就是這些照片之間的順序其實(shí)是有很大的時(shí)間順序關(guān)系的,而用上面的方法則會忽略這種關(guān)系。比如我們現(xiàn)在看到了一張Bob閉著嘴的照片,那么這張照片我們怎么標(biāo)記Bob的活動呢?比較難去打標(biāo)記。但是如果我們有Bob在這一張照片前一點(diǎn)點(diǎn)時(shí)間的照片的話,那么這張照片就好標(biāo)記了。如果在時(shí)間序列上前一張的照片里Bob在吃飯,那么這張閉嘴的照片很有可能是在吃飯咀嚼。而如果在時(shí)間序列上前一張的照片里Bob在唱歌,那么這張閉嘴的照片很有可能是在唱歌。
為了讓我們的分類器表現(xiàn)的更好,可以在標(biāo)記數(shù)據(jù)的時(shí)候,可以考慮相鄰數(shù)據(jù)的標(biāo)記信息。這一點(diǎn),是普通的分類器難以做到的。而這一塊,也是CRF比較擅長的地方。
延伸閱讀
- ssh框架 2016-09-30
- 阿里移動安全 [無線安全]玩轉(zhuǎn)無線電——不安全的藍(lán)牙鎖 2017-07-26
- 消息隊(duì)列NetMQ 原理分析4-Socket、Session、Option和Pipe 2024-03-26
- Selective Search for Object Recognition 論文筆記【圖片目標(biāo)分割】 2017-07-26
- 詞向量-LRWE模型-更好地識別反義詞同義詞 2017-07-26
- 從棧不平衡問題 理解 calling convention 2017-07-26
- php imagemagick 處理 圖片剪切、壓縮、合并、插入文本、背景色透明 2017-07-26
- Swift實(shí)現(xiàn)JSON轉(zhuǎn)Model - HandyJSON使用講解 2017-07-26
- 阿里移動安全 Android端惡意鎖屏勒索應(yīng)用分析 2017-07-26
- 集合結(jié)合數(shù)據(jù)結(jié)構(gòu)來看看(二) 2017-07-26