條件隨機場CRF(一)從隨機場到線性鏈條件隨機場
條件隨機場CRF(二) 前向后向算法評估標記序列概率(TODO)
條件隨機場CRF(三) 模型學習與維特比算法解碼(TODO)
條件隨機場(Conditional Random Fields, 以下簡稱CRF)是給定一組輸入序列條件下另一組輸出序列的條件概率分布模型,在自然語言處理中得到了廣泛應用。本系列主要關(guān)注于CRF的特殊形式:線性鏈(Linear chain) CRF。本文關(guān)注與CRF的模型基礎。
1.什么樣的問題需要CRF模型
和HMM類似,在討論CRF之前,我們來看看什么樣的問題需要CRF模型。這里舉一個簡單的例子:
假設我們有Bob一天從早到晚的一系列照片,Bob想考考我們,要我們猜這一系列的每張照片對應的活動,比如: 工作的照片,吃飯的照片,唱歌的照片等等。一個比較直觀的辦法就是,我們找到Bob之前的日常生活的一系列照片,然后找Bob問清楚這些照片代表的活動標記,這樣我們就可以用監(jiān)督學習的方法來訓練一個分類模型,比如邏輯回歸,接著用模型去預測這一天的每張照片最可能的活動標記。
這種辦法雖然是可行的,但是卻忽略了一個重要的問題,就是這些照片之間的順序其實是有很大的時間順序關(guān)系的,而用上面的方法則會忽略這種關(guān)系。比如我們現(xiàn)在看到了一張Bob閉著嘴的照片,那么這張照片我們怎么標記Bob的活動呢?比較難去打標記。但是如果我們有Bob在這一張照片前一點點時間的照片的話,那么這張照片就好標記了。如果在時間序列上前一張的照片里Bob在吃飯,那么這張閉嘴的照片很有可能是在吃飯咀嚼。而如果在時間序列上前一張的照片里Bob在唱歌,那么這張閉嘴的照片很有可能是在唱歌。
為了讓我們的分類器表現(xiàn)的更好,可以在標記數(shù)據(jù)的時候,可以考慮相鄰數(shù)據(jù)的標記信息。這一點,是普通的分類器難以做到的。而這一塊,也是CRF比較擅長的地方。
延伸閱讀
- ssh框架 2016-09-30
- 阿里移動安全 [無線安全]玩轉(zhuǎn)無線電——不安全的藍牙鎖 2017-07-26
- 消息隊列NetMQ 原理分析4-Socket、Session、Option和Pipe 2024-03-26
- Selective Search for Object Recognition 論文筆記【圖片目標分割】 2017-07-26
- 詞向量-LRWE模型-更好地識別反義詞同義詞 2017-07-26
- 從棧不平衡問題 理解 calling convention 2017-07-26
- php imagemagick 處理 圖片剪切、壓縮、合并、插入文本、背景色透明 2017-07-26
- Swift實現(xiàn)JSON轉(zhuǎn)Model - HandyJSON使用講解 2017-07-26
- 阿里移動安全 Android端惡意鎖屏勒索應用分析 2017-07-26
- 集合結(jié)合數(shù)據(jù)結(jié)構(gòu)來看看(二) 2017-07-26
