關(guān)鍵詞:方面提取 詞向量 半監(jiān)督 自訓(xùn)練 未標(biāo)簽數(shù)據(jù)
摘要:方面提取是觀點(diǎn)挖掘和情感分析任務(wù)中的關(guān)鍵一步,隨著社交網(wǎng)絡(luò)的發(fā)展,用戶越來越傾向于根據(jù)評(píng)論信息來幫助進(jìn)行決策,并且用戶也更加關(guān)注評(píng)論的細(xì)粒度的信息,因此,從海量的網(wǎng)絡(luò)評(píng)論數(shù)據(jù)中快速挖掘方面信息對(duì)于用戶快速?zèng)Q策具有重要意義。大部分基于主題模型和聚類的方法在方面提取的一致性上效果并不好,傳統(tǒng)的監(jiān)督學(xué)習(xí)的方法效果雖然表現(xiàn)很好,但是需要大量的標(biāo)注文本作為訓(xùn)練數(shù)據(jù),標(biāo)注文本需要消耗大量的人力成本?;谝陨蠁栴},本文提出一種基于半監(jiān)督自訓(xùn)練的方面提取方法,充分利用現(xiàn)存的大量未標(biāo)簽的數(shù)據(jù)價(jià)值,在未標(biāo)簽數(shù)據(jù)集上通過詞向量模型尋找方面種子詞的相似詞,對(duì)每個(gè)方面建立與數(shù)據(jù)集最相關(guān)的方面表示詞集合,本文方法避免了大量的文本標(biāo)注,充分利用未標(biāo)簽數(shù)據(jù)的價(jià)值,并且本文方法在中文和英文數(shù)據(jù)集上都表現(xiàn)出了理想的效果。
智能系統(tǒng)學(xué)報(bào)雜志要求:
{1}作者簡(jiǎn)介請(qǐng)標(biāo)明工作單位、職務(wù)、職稱、聯(lián)系電話、電子信箱、所在城市和郵編。
{2}文章須言之有物,理論聯(lián)系實(shí)際,研究目的明確,研究方法得當(dāng),有自己的學(xué)術(shù)見解,對(duì)理論或?qū)嵺`具有參考、借鑒或指導(dǎo)作用。
{3}文題應(yīng)簡(jiǎn)明確切地反映文章的特定內(nèi)容,以不超過20字為宜。
{4}參考文獻(xiàn):應(yīng)為正式出版物上發(fā)表的、作者親自閱讀、與文稿主要內(nèi)容密切相關(guān)的近年文獻(xiàn),要求精選。
{5}文前附400字以內(nèi)的中文、英文內(nèi)容提要,關(guān)鍵詞2-5個(gè)。
注:因版權(quán)方要求,不能公開全文,如需全文,請(qǐng)咨詢雜志社