2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩56頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、隨著網(wǎng)絡(luò)貿(mào)易的迅猛發(fā)展,為了增強顧客滿意度,分享顧客的購物經(jīng)歷,網(wǎng)上商家讓顧客對已購商品表達意見或建議已成為一件很普遍的事情了。因此,購物網(wǎng)站用戶評論區(qū)域的評論數(shù)量迅速增加,一些暢銷產(chǎn)品在一些大的購物站點能達到數(shù)百之多的用戶評論。然而,大量的顧客評論讓產(chǎn)品制造商或潛在購買者很難跟蹤已購產(chǎn)品用戶對產(chǎn)品的意見和建議,這就給他們的決策造成了額外的困難。一個新的研究領(lǐng)域――以產(chǎn)品特征詞為基礎(chǔ)的顧客評論信息抽取研究就在這種背景下產(chǎn)生了。目前,越來

2、越多的研究者投身其中,M.Hu與B.Liu在2004年發(fā)表的顧客評論信息抽取是最早且最完整的文獻之一。本文首先介紹了以產(chǎn)品特征詞為基礎(chǔ)的顧客評論信息抽取的研究背景及國內(nèi)外研究現(xiàn)狀,詳細闡述了研究目的及意義,對目前網(wǎng)絡(luò)貿(mào)易平臺功能模塊進行了詳細介紹,指出它的不足,提出將用戶評論信息抽取模塊應(yīng)用到網(wǎng)絡(luò)貿(mào)易平臺中。并對本文用到的相關(guān)知識進行了研究。然后研究了M.Hu,B.Liu的用戶評論抽取算法,對基于支持度算法的產(chǎn)品特征詞抽取技術(shù)和利用Wo

3、rdNet識別輿論詞語義取向技術(shù)進行了詳細研究,分析了Hu,Liu的用戶評論抽取算法的局限性。在對已有算法的局限性進行分析之后,提出基于貝努利模型的算法對產(chǎn)品特征詞進行抽取,詳細闡述了利用概率統(tǒng)計知識對用戶評論涉及到的產(chǎn)品特征詞進行抽取的過程。并與基于支持度算法對產(chǎn)品特征詞抽取進行比較,實驗證明,該算法能夠讓終端用戶在搜尋產(chǎn)品時,感到簡短有效的特征詞列表對尋找產(chǎn)品真正起到了導航作用。此外,本文還提出使用松弛標記法對用戶評論的產(chǎn)品特征詞的

4、輿論短語進行語義標識,利用對潛在的輿論詞的標記進行識別輿論短語。在實驗中,使用召回率和精確率兩種評價指標對本文算法與利用WordNet識別輿論詞語義取向技術(shù)進行了評價,且進行了實驗結(jié)果分析。在輿論短語語義標識實驗中,由于本文的算法能夠處理敏感內(nèi)容輿論詞,本文算法的精確度比利用WordNet識別輿論詞語義取向的算法高了0.03。但是由于本文算法不能識別WordNet上沒有出現(xiàn)的單詞,或?qū)ordNet沒有足夠的單詞分類信息,本文算法的召回

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論