筆者:整理2016-2017年ACL、EMNLP、SIGIR、KDD、CIKM、WWW等國際知名會議中實體關(guān)系推理與知識圖譜補全的相關(guān)論文,供自然語言處理研究人員,尤其知識圖譜領(lǐng)域的學(xué)者參考,如有錯誤理解之處請指出,不勝感激!(如需轉(zhuǎn)載,請聯(lián)系本人:jtianwen2014,并注明出處)
ACL 2016
Unsupervised Person Slot Filling based on Graph Mining
作者:Dian Yu, Heng Ji
機構(gòu):Computer Science Department, Rensselaer Polytechnic Institute
本文的任務(wù)為槽填充(Slot Filling),即從大規(guī)模的語料庫中抽取給定實體(query)的被明確定義的屬性(slot types)的值(slot fillers)。對于此任務(wù),本文敘述目前主流的方法可以分為兩類:有監(jiān)督的分類方法,設(shè)計分類器識別給定的實體與值所屬的關(guān)系類型,分類器的訓(xùn)練往往使用如活動學(xué)習(xí)、利用距離監(jiān)督的噪聲標注等方法;模式匹配方法,從文本中自動或半自動地抽取和生成詞法或句法的模式,以用于關(guān)系的抽取,但因為關(guān)系所表述的方式千差萬別,這種模式匹配方法無法擁有較好的召回率。
本文認為,以上兩類方法都無法很好的應(yīng)對新的語言或是出現(xiàn)新的關(guān)系類型的情況,即移植性不強;而且,兩種方法都只是專注于實體和候選值之前的平坦表示,并沒有考慮到它們之間的全局結(jié)構(gòu)關(guān)系,以及語句中其他的關(guān)系事實的影響。本文重要的算法思想基于以下兩個觀察: