半監(jiān)督自訓(xùn)練的方面提取

曲昭偉; 吳春葉; 王曉茹 北京郵電大學(xué)網(wǎng)絡(luò)技術(shù)研究院; 北京100876; 北京郵電大學(xué)計(jì)算機(jī)學(xué)院; 北京100876

關(guān)鍵詞:方面提取 詞向量 半監(jiān)督 自訓(xùn)練 未標(biāo)簽數(shù)據(jù) 

摘要:方面提取是觀點(diǎn)挖掘和情感分析任務(wù)中的關(guān)鍵一步,隨著社交網(wǎng)絡(luò)的發(fā)展,用戶(hù)越來(lái)越傾向于根據(jù)評(píng)論信息來(lái)幫助進(jìn)行決策,并且用戶(hù)也更加關(guān)注評(píng)論的細(xì)粒度的信息,因此,從海量的網(wǎng)絡(luò)評(píng)論數(shù)據(jù)中快速挖掘方面信息對(duì)于用戶(hù)快速?zèng)Q策具有重要意義。大部分基于主題模型和聚類(lèi)的方法在方面提取的一致性上效果并不好,傳統(tǒng)的監(jiān)督學(xué)習(xí)的方法效果雖然表現(xiàn)很好,但是需要大量的標(biāo)注文本作為訓(xùn)練數(shù)據(jù),標(biāo)注文本需要消耗大量的人力成本。基于以上問(wèn)題,本文提出一種基于半監(jiān)督自訓(xùn)練的方面提取方法,充分利用現(xiàn)存的大量未標(biāo)簽的數(shù)據(jù)價(jià)值,在未標(biāo)簽數(shù)據(jù)集上通過(guò)詞向量模型尋找方面種子詞的相似詞,對(duì)每個(gè)方面建立與數(shù)據(jù)集最相關(guān)的方面表示詞集合,本文方法避免了大量的文本標(biāo)注,充分利用未標(biāo)簽數(shù)據(jù)的價(jià)值,并且本文方法在中文和英文數(shù)據(jù)集上都表現(xiàn)出了理想的效果。

智能系統(tǒng)學(xué)報(bào)雜志要求:

{1}作者簡(jiǎn)介請(qǐng)標(biāo)明工作單位、職務(wù)、職稱(chēng)、聯(lián)系電話(huà)、電子信箱、所在城市和郵編。

{2}文章須言之有物,理論聯(lián)系實(shí)際,研究目的明確,研究方法得當(dāng),有自己的學(xué)術(shù)見(jiàn)解,對(duì)理論或?qū)嵺`具有參考、借鑒或指導(dǎo)作用。

{3}文題應(yīng)簡(jiǎn)明確切地反映文章的特定內(nèi)容,以不超過(guò)20字為宜。

{4}參考文獻(xiàn):應(yīng)為正式出版物上發(fā)表的、作者親自閱讀、與文稿主要內(nèi)容密切相關(guān)的近年文獻(xiàn),要求精選。

{5}文前附400字以?xún)?nèi)的中文、英文內(nèi)容提要,關(guān)鍵詞2-5個(gè)。

注:因版權(quán)方要求,不能公開(kāi)全文,如需全文,請(qǐng)咨詢(xún)雜志社

智能系統(tǒng)學(xué)報(bào)

北大期刊
1-3個(gè)月下單

關(guān)注 9人評(píng)論|1人關(guān)注
服務(wù)與支付
国产精品视频线观看26uuu,免费av网站在线观看,免费一级a四片久久精品网,国产成人无码精品久久久露脸
亚洲天堂一区二区三区 | 色婷婷综合久久久中文字幕 | 日本一区二区在线视频观看 | 中文字字幕乱码无线精品精品 | 日本欧美亚洲高清在线看 | 日本性视频高清天天摸天 |