關(guān)鍵詞:知識(shí)圖譜 知識(shí)三元組抽取 對(duì)抗訓(xùn)練 端到端網(wǎng)絡(luò) 標(biāo)注策略
摘要:知識(shí)圖譜作為一種有效表示現(xiàn)實(shí)世界的系統(tǒng)受到學(xué)術(shù)界和工業(yè)界廣泛關(guān)注,并由于其精準(zhǔn)表示知識(shí)的能力被廣泛應(yīng)用于信息服務(wù)、智慧搜索、自動(dòng)問(wèn)答等上層應(yīng)用.知識(shí)圖譜的核心為三元組形式的實(shí)體和關(guān)系.現(xiàn)有知識(shí)圖譜遠(yuǎn)不足以描述現(xiàn)實(shí)世界,因此,如何通過(guò)實(shí)體關(guān)系抽取方法來(lái)補(bǔ)全或者構(gòu)建新的知識(shí)圖譜顯得至關(guān)重要.傳統(tǒng)流水線式的實(shí)體關(guān)系抽取方法會(huì)導(dǎo)致誤差傳遞,而已有的聯(lián)合抽取沒(méi)有充分考慮命名實(shí)體識(shí)別與關(guān)系抽取之間的聯(lián)系,從而降低抽取效果.針對(duì)上述問(wèn)題,對(duì)知識(shí)三元組抽取方法進(jìn)行了深入研究,提出了一種融合對(duì)抗訓(xùn)練的端到端知識(shí)三元組聯(lián)合抽取方法.首先,采用了一種實(shí)體關(guān)系聯(lián)合標(biāo)注策略,通過(guò)端到端的神經(jīng)網(wǎng)絡(luò)抽取文本語(yǔ)義特征,并對(duì)文本進(jìn)行自動(dòng)標(biāo)注;其次,模型在神經(jīng)網(wǎng)絡(luò)中加入自注意力機(jī)制增強(qiáng)對(duì)文本信息的編碼能力,并通過(guò)引入帶偏置項(xiàng)的目標(biāo)函數(shù)提高對(duì)相關(guān)聯(lián)實(shí)體的辨識(shí)能力;最后,模型融合了對(duì)抗訓(xùn)練以提高魯棒性,改進(jìn)抽取效果.在實(shí)驗(yàn)部分,采用4種分析方法和3種評(píng)價(jià)指標(biāo)對(duì)模型性能進(jìn)行評(píng)價(jià)分析,實(shí)驗(yàn)結(jié)果證明了模型在知識(shí)抽取上的性能明顯優(yōu)于現(xiàn)有方法.
計(jì)算機(jī)研究與發(fā)展雜志要求:
{1}摘要200字左右,應(yīng)具有獨(dú)立性和自明性,闡明撰寫(xiě)該文的目的、方法、結(jié)論并體現(xiàn)出原創(chuàng)性,不加引注。
{2}來(lái)稿請(qǐng)恪守學(xué)術(shù)道德,嚴(yán)禁抄襲。
{3}來(lái)稿經(jīng)審查后,編輯部有權(quán)對(duì)來(lái)稿作適當(dāng)文字修改.來(lái)稿不退,請(qǐng)作者自留底稿。
{4}間接引文通常以“參見(jiàn)”或“詳見(jiàn)”等引領(lǐng)詞引導(dǎo),反映出與正文行文的呼應(yīng),標(biāo)注時(shí)應(yīng)注出具體參考引證的起止頁(yè)碼或章節(jié)。標(biāo)注項(xiàng)目、順序與格式同直接引文。
{5}本期刊的文獻(xiàn)引證方式均采用頁(yè)下注(腳注),采用小五號(hào)宋體,每頁(yè)單獨(dú)編號(hào),注釋中卷次、出版時(shí)間、刊期、頁(yè)碼一律用阿拉伯?dāng)?shù)字表示。
注:因版權(quán)方要求,不能公開(kāi)全文,如需全文,請(qǐng)咨詢雜志社