面向電商評論細粒度觀點挖掘的拓展主題模型研究.pdf_第1頁
已閱讀1頁,還剩61頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、隨著互聯(lián)網(wǎng)和電子商務技術的發(fā)展,網(wǎng)絡購物成為一種熱潮,人們可以實現(xiàn)足不出戶購買到自己心儀的商品。但是,與傳統(tǒng)線下購物相比,網(wǎng)絡購物有著商品種類繁多、用戶無法直接感受商品的質量、體驗商品功能等特征,這使得電商網(wǎng)站上的商品評論信息成為消費者選擇和購買決策的重要參考。同時,評論信息作為反饋機制也可以幫助商家改進產(chǎn)品、提升服務。但是,目前電商網(wǎng)站評論數(shù)據(jù)量巨大、內容龐雜,采用人工閱讀方式無法準確有效的得到有用的信息。而且人們更希望得到的是關于產(chǎn)

2、品或服務多個方面的細粒度評價信息,而非其整體情感傾向。因此,針對電商評論的細粒度觀點挖掘成為了熱門的研究課題,受到國內外研究學者的廣泛關注。
  細粒度觀點挖掘旨在從評論數(shù)據(jù)中抽取出被評價實體方面以及相對應的情感,生成評價摘要,為潛在消費者和商家提供決策支持。考慮到目前細粒度觀點挖掘方法如基于人工定義、基于頻率、基于有監(jiān)督學習方法的局限性,而LDA主題模型作為無監(jiān)督方法不僅不需要人工標注的訓練數(shù)據(jù),還可以克服上面所述方法中沒有將具

3、有相似語義的特征詞進行聚類的缺點,被研究者廣泛應用。但是LDA模型抽取的主題粒度較粗,無法識別被評價實體方面,而且三層模型無法實現(xiàn)細粒度觀點挖掘目標,需要進行改進和拓展。
  針對上面提到的問題,本文根據(jù)細粒度觀點挖掘的目標,對LDA模型進行設計和拓展,提出了細粒度的主題情感混合模型(Fine-grained Topic Sentiment Unification Model, FG-TSU模型)。首先針對標準的LDA模型識別出的

4、主題粒度較粗,本文將主題分為局部主題和全局主題,利用滑動窗口的方法將詞共現(xiàn)信息從文檔級降到句子級,實現(xiàn)細粒度局部主題的抽取;然后,本文根據(jù)詞分類和在模型中引入指示變量用以區(qū)分方面詞和觀點詞;最后,本文在LDA模型的三層模型基礎上加入了情感層,對主題和情感進行同時建模,實現(xiàn)情感傾向分析,不僅可以獲得整篇評論的情感極性,還可以獲得被評價實體方面層的情感極性,最終完成細粒度觀點挖掘的目標,生成評價摘要。
  為了驗證本模型具有跨領域性,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論