關(guān)鍵詞:中文分詞 法律文書(shū) 聯(lián)合學(xué)習(xí)
摘要:中文分詞任務(wù)是自然語(yǔ)言處理的一項(xiàng)基本任務(wù)。但基于統(tǒng)計(jì)的中文分詞方法需要大規(guī)模的訓(xùn)練樣本,且擁有較差的領(lǐng)域適應(yīng)性。然而,法律文書(shū)涉及眾多領(lǐng)域,對(duì)大量的語(yǔ)料進(jìn)行標(biāo)注需要耗費(fèi)大量的人力、物力。針對(duì)該問(wèn)題,該文提出了一種基于聯(lián)合學(xué)習(xí)的跨領(lǐng)域中文分詞方法,該方法通過(guò)聯(lián)合學(xué)習(xí)將大量的源領(lǐng)域樣本輔助目標(biāo)領(lǐng)域的分詞,從而提升分詞性能。實(shí)驗(yàn)結(jié)果表明,在目標(biāo)領(lǐng)域標(biāo)注樣本較少的條件下,該文方法的中文分詞性能明顯優(yōu)于傳統(tǒng)方法。
中文信息學(xué)報(bào)雜志要求:
{1}本刊對(duì)刊發(fā)的文章?lián)碛邪鏅?quán),不得擅自轉(zhuǎn)載、改編。凡轉(zhuǎn)載、改編務(wù)經(jīng)我刊同意,違者必究。
{2}作者簡(jiǎn)介包括:姓名、性別、出生年月、畢業(yè)學(xué)校及所學(xué)專(zhuān)業(yè)、工作單位、職務(wù)職稱(chēng)、現(xiàn)從事的研究工作情況。
{3}來(lái)稿若屬?lài)?guó)家自然科學(xué)基金項(xiàng)目或省部基金項(xiàng)目,請(qǐng)?jiān)谖母逯袠?biāo)明其基金來(lái)源和編號(hào),我刊可以優(yōu)先審核發(fā)表。
{4}正文內(nèi)連續(xù)敘述中的序號(hào)采用①……;②……;③……。分級(jí)超過(guò)3級(jí)后用網(wǎng)括號(hào)如:“①”,“②”表示,并采用連排。
{5}附注請(qǐng)一律使用當(dāng)頁(yè)腳注的形式,以帶圈①……⑩的方式編號(hào),使用每頁(yè)重新編號(hào)的方式。
注:因版權(quán)方要求,不能公開(kāi)全文,如需全文,請(qǐng)咨詢雜志社