筆者:整理2016-2017年ACL、EMNLP、SIGIR、KDD、CIKM、WWW等國(guó)際知名會(huì)議中實(shí)體關(guān)系推理與知識(shí)圖譜補(bǔ)全的相關(guān)論文,供自然語(yǔ)言處理研究人員,尤其知識(shí)圖譜領(lǐng)域的學(xué)者參考,如有錯(cuò)誤理解之處請(qǐng)指出,不勝感激?。ㄈ缧柁D(zhuǎn)載,請(qǐng)聯(lián)系本人:jtianwen2014,并注明出處)
ACL 2016
Unsupervised Person Slot Filling based on Graph Mining
作者:Dian Yu, Heng Ji
機(jī)構(gòu):Computer Science Department, Rensselaer Polytechnic Institute
本文的任務(wù)為槽填充(Slot Filling),即從大規(guī)模的語(yǔ)料庫(kù)中抽取給定實(shí)體(query)的被明確定義的屬性(slot types)的值(slot fillers)。對(duì)于此任務(wù),本文敘述目前主流的方法可以分為兩類(lèi):有監(jiān)督的分類(lèi)方法,設(shè)計(jì)分類(lèi)器識(shí)別給定的實(shí)體與值所屬的關(guān)系類(lèi)型,分類(lèi)器的訓(xùn)練往往使用如活動(dòng)學(xué)習(xí)、利用距離監(jiān)督的噪聲標(biāo)注等方法;模式匹配方法,從文本中自動(dòng)或半自動(dòng)地抽取和生成詞法或句法的模式,以用于關(guān)系的抽取,但因?yàn)殛P(guān)系所表述的方式千差萬(wàn)別,這種模式匹配方法無(wú)法擁有較好的召回率。
本文認(rèn)為,以上兩類(lèi)方法都無(wú)法很好的應(yīng)對(duì)新的語(yǔ)言或是出現(xiàn)新的關(guān)系類(lèi)型的情況,即移植性不強(qiáng);而且,兩種方法都只是專(zhuān)注于實(shí)體和候選值之前的平坦表示,并沒(méi)有考慮到它們之間的全局結(jié)構(gòu)關(guān)系,以及語(yǔ)句中其他的關(guān)系事實(shí)的影響。本文重要的算法思想基于以下兩個(gè)觀察: