關(guān)鍵詞:立場(chǎng)檢測(cè) 主題短語(yǔ) 關(guān)系矩陣 句向量
摘要:微博立場(chǎng)檢測(cè)是判斷一段微博文本針對(duì)某一目標(biāo)話題所表達(dá)的觀點(diǎn)態(tài)度是支持、中立或反對(duì).隨著社交媒體的發(fā)展,從海量的微博數(shù)據(jù)中挖掘其蘊(yùn)含的立場(chǎng)信息成為一項(xiàng)重要的研究課題.但是現(xiàn)有的方法往往將其視作情感分類任務(wù),沒有對(duì)目標(biāo)話題和微博文本之間的關(guān)系特征進(jìn)行分析,在基于深度學(xué)習(xí)的分類框架上,擴(kuò)展并提出了基于Bert-Condition-CNN的立場(chǎng)檢測(cè)模型,首先為提高話題在文本中的覆蓋率,對(duì)微博文本進(jìn)行了主題短語(yǔ)的提取構(gòu)成話題集;然后使用Bert預(yù)訓(xùn)練模型獲取文本的句向量,并通過構(gòu)建話題集和微博文本句向量之間的關(guān)系矩陣Condition層來體現(xiàn)兩個(gè)文本序列的關(guān)系特征;最后使用CNN對(duì)Condition層進(jìn)行特征提取,分析不同話題對(duì)立場(chǎng)信息的影響并實(shí)現(xiàn)對(duì)立場(chǎng)標(biāo)簽的預(yù)測(cè).該模型在自然語(yǔ)言處理與中文計(jì)算會(huì)議(NLPCC2016)的數(shù)據(jù)集中取得了較好的效果,通過主題短語(yǔ)擴(kuò)展后的Condition層有效地提升了立場(chǎng)檢測(cè)的準(zhǔn)確度.
計(jì)算機(jī)系統(tǒng)應(yīng)用雜志要求:
{1}參考文獻(xiàn)按GB/T 7714-2005《文后參考文獻(xiàn)著錄規(guī)則》采用順序編碼制著錄,依照其在文中出現(xiàn)的先后順序用阿拉伯?dāng)?shù)字加方括號(hào)標(biāo)出。
{2}文責(zé)自負(fù)。概不接受抄襲稿件。本刊概不退稿,請(qǐng)作者自留底稿。
{3}請(qǐng)勿一稿多投,三個(gè)月內(nèi)未接到本刊錄用通知可另行處理。
{4}文題:力求簡(jiǎn)明、醒目,反映出文章的主題。中文文題一般以20個(gè)漢字以內(nèi)為宜。
{5}正文應(yīng)層次清楚,方便閱讀,行文符合規(guī)范。正文中的各級(jí)標(biāo)題分別為:“1”、“1.1”、“1.1.1”等。
注:因版權(quán)方要求,不能公開全文,如需全文,請(qǐng)咨詢雜志社