關(guān)鍵詞:數(shù)據(jù)分類算法 貝葉斯算法 海量數(shù)據(jù)處理
摘要:針對(duì)目前機(jī)器學(xué)習(xí)研究領(lǐng)域中的數(shù)據(jù)分類問(wèn)題,選擇樸素貝葉斯算法作為研究對(duì)象。首先,通過(guò)對(duì)樣本數(shù)據(jù)特征屬性的權(quán)重進(jìn)行加權(quán)調(diào)整,提高算法處理的準(zhǔn)確率;然后,改進(jìn)樸素貝葉斯算法分類器模型,使其能夠利用Map/Reduce并行編程模型,采用多計(jì)算資源節(jié)點(diǎn)并行處理,進(jìn)一步提高處理速度。最后,對(duì)UCI dataset數(shù)據(jù)庫(kù)進(jìn)行實(shí)驗(yàn)驗(yàn)證,結(jié)果表明:改進(jìn)后的算法在海量數(shù)據(jù)分類處理中具有更好的性能表現(xiàn)。
注:因版權(quán)方要求,不能公開(kāi)全文,如需全文,請(qǐng)咨詢雜志社