關鍵詞:人文社科 專題數(shù)據(jù)庫 主題選擇 lda
摘要:[目的/意義]探索一種融入數(shù)據(jù)驅動思維的人文社科專題數(shù)據(jù)庫建設主題選擇方法,為相關主體在建庫主題的遴選、比較和確定等工作提供決策參考。[方法/過程]從政策、用戶兩個維度出發(fā),提出基于政策文本與檢索數(shù)據(jù)的人文社科專題數(shù)據(jù)庫主題篩選框架。以Fulink平臺為例,基于政策文本LDA主題分類建模和檢索數(shù)據(jù)的詞頻統(tǒng)計歸類,確定專題數(shù)據(jù)庫建設備選主題,最后通過比對篩選將主題進行分類。[結果/結論]本文構建的主題選擇框架,能夠有效提升相關主題選擇工作的全面性、準確性、科學性,為人文社科專題數(shù)據(jù)庫建設的項目規(guī)劃等提供了良好的思路。
現(xiàn)代情報雜志要求:
{1}獲得科研基金資助的文章須注明基金項目名稱及項目編號。
{2}本刊歡迎專稿專投,反對一稿多發(fā)。
{3}標題層次:本刊采用1,1.1,1.2,2,2.1,2.2,3,3.1,3.2,3.3等表示標題層次,書寫時一律左頂格。
{4}參考文獻:特別注意引用近期在國內外高水平期刊雜志中發(fā)表的前沿研究論文,不遺漏重要的相關文獻。
{5}中英文摘要,摘要通常簡明扼要地描述研究目的、研究設計/方法/路徑、研究發(fā)現(xiàn)和結論等,通常中文200-300字為宜。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社