版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、學校代碼:10663學號:4201310000747貴州師范大學碩士學位論文基于電商平臺的產(chǎn)品評論大數(shù)據(jù)獲取及應用BigDataAcquisitionApplicationofProductReviewsBasedonElectronicBusinessPlatfm專業(yè)名稱:計算機科學與技術專業(yè)代碼:081200研究方向:數(shù)據(jù)挖掘、云計算與大數(shù)據(jù)申請人姓名:譚文斌導師姓名(職稱):張?zhí)A(教授)二〇一六年四月七日摘要I摘要隨著電子商務的
2、迅速發(fā)展,網(wǎng)上購物變得越來越頻繁,各電商平臺每天都會產(chǎn)生大量的交易數(shù)據(jù)和用戶評論數(shù)據(jù),對于用戶評論數(shù)據(jù),其中蘊藏著許多有價值的信息,如產(chǎn)品的缺陷信息、用戶的需求信息等。對此,本文針對電商平臺中產(chǎn)品評論大數(shù)據(jù)獲取及應用進行了深入研究,通過提取產(chǎn)品評論大數(shù)據(jù)中各屬性詞的評價觀點和意見,將提取的觀點經(jīng)過整合后生成評價摘要,以簡潔、易讀的形成呈現(xiàn)給用戶,為顧客購物提供更好的參考和指引,使商家更好地了解顧客需求,提升服務質量,使產(chǎn)品設計人員能夠及
3、時了解用戶的使用體驗,改進產(chǎn)品設計的不足,提升產(chǎn)品質量。對此,本文圍繞產(chǎn)品評論大數(shù)據(jù)的獲取、聚類、產(chǎn)品屬性詞識別、以及評價觀點的提取和整合等方面進行了深入研究,將Nutch網(wǎng)絡爬蟲與Hadoop相結合實現(xiàn)了評論數(shù)據(jù)的分布式爬取,提高了評論數(shù)據(jù)的爬取效率;將爬取的評論數(shù)據(jù)經(jīng)過預處理后得到評論數(shù)據(jù)集,采用TFIDF方法來計算特征詞的權重,采用基于向量空間模型的方法來計算評論語句的相似度,并將Canopy聚類算法與Kmeans聚類算法結合起來
4、使用,采用MapReduce框架來實現(xiàn)這兩種算法對評論數(shù)據(jù)的聚類分析,提高了評論數(shù)據(jù)的聚類效率和聚類精度。將爬取的海量評論數(shù)據(jù)經(jīng)過聚類分析后,得到以產(chǎn)品屬性詞為主要聚類中心的各個聚類族,采用基于產(chǎn)品屬性的評價觀點提取方法,將各個聚類族中關于產(chǎn)品屬性的評價觀點提取出來,經(jīng)過觀點整合后形成評價摘要,以評價摘要的形式呈現(xiàn)給用戶,提高了屬性詞評價觀點的可閱讀性。為了規(guī)范評論語句中屬性詞觀點的提取,本文構建了評論數(shù)據(jù)的質量評估體系,以確保提取的屬
5、性詞觀點的質量,為觀點提取算法的優(yōu)化提供了參考依據(jù)。最后,以XX凈水器的評論數(shù)據(jù)為例,經(jīng)過聚類分析、屬性詞觀點提取和整合分析,生成了XX凈水器的評價摘要,得到了XX凈水器擁有的優(yōu)點和存在的不足,并對提取的屬性詞評價觀點的應用作了簡要分析。通過應用測試表明,本文所采取的評論數(shù)據(jù)的獲取和分析方法是正確的和有效的,所提取的各屬性詞評價觀點對設計人員和用戶具有重要意義,為電商平臺中評論大數(shù)據(jù)的獲取、分析和應用提供了新的思路和方法。關鍵詞:產(chǎn)品評
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于電商網(wǎng)站商品評論數(shù)據(jù)的用戶情感分析.pdf
- 電商商品評論情感分析方法及優(yōu)化研究
- 基于產(chǎn)品評論的垃圾評論者檢測方法.pdf
- 基于CRFs的產(chǎn)品評論情感分類.pdf
- 電商商品評論情感分析方法及優(yōu)化研究_2880(1)
- 電商商品評論情感分析方法及優(yōu)化研究_2880.pdf
- 基于產(chǎn)品評論的意見抽取方法研究.pdf
- 基于情感詞的產(chǎn)品評論挖掘研究.pdf
- 電商如何擁抱大數(shù)據(jù)
- 基于屬性集合的產(chǎn)品評論挖掘研究.pdf
- 產(chǎn)品評論信息的意見抽取研究與應用.pdf
- 基于大數(shù)據(jù)的電商物流運作策略分析
- 基于客戶評論的電商產(chǎn)品特征提取的研究.pdf
- 在線產(chǎn)品評論研究綜述
- 基于運營商游客大數(shù)據(jù)輔助平臺
- 基于特征強化的中文產(chǎn)品評論挖掘研究.pdf
- 基于詞性與句法的產(chǎn)品評論特征及情感詞挖掘.pdf
- 基于特征強化的中文產(chǎn)品評論挖掘研究
- 文本挖掘在產(chǎn)品評論中的研究與應用
- 基于語義分析的產(chǎn)品評論挖掘技術研究.pdf
評論
0/150
提交評論