版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、隨著網(wǎng)絡(luò)信息技術(shù)的日益發(fā)展和人們利益訴求的日趨多元化,使得互聯(lián)網(wǎng)已經(jīng)成為各基層利益表達(dá)、情感宣泄、思想碰撞的重要輿論渠道。因此,對互聯(lián)網(wǎng)輿情挖掘進(jìn)行深入研究具有重要意義。具體來講,輿情監(jiān)測是指整合互聯(lián)網(wǎng)信息采集技術(shù)及信息智能處理技術(shù),通過對互聯(lián)網(wǎng)海量信息自動抓取、自動分類聚類、主題監(jiān)測、專題聚焦,實現(xiàn)用戶的網(wǎng)絡(luò)輿情監(jiān)測和追蹤等信息需求。隨著近些年的發(fā)展,輿情系統(tǒng)不僅在信息監(jiān)測上較好的滿足了用戶的需求,同時增加了許多服務(wù)功能為客戶全面掌握
2、信息動態(tài),做出正確輿論引導(dǎo),提供了依據(jù)。
在總結(jié)和分析了當(dāng)今輿情系統(tǒng)整體發(fā)展趨勢和時下互聯(lián)網(wǎng)領(lǐng)域興起的推薦應(yīng)用后,本文從輿情系統(tǒng)自身的特點出發(fā),打破傳統(tǒng)的用戶根據(jù)自己所想去配置監(jiān)測關(guān)鍵詞的方式,根據(jù)用戶的興趣所在主動為用戶提供關(guān)鍵詞推薦的服務(wù)。
提出在傳統(tǒng)輿情監(jiān)測系統(tǒng)中加入用戶對已有輿情信息的評分功能,并稱獲得了評分的那些文檔為高價值文檔。然后使用隱馬爾可夫模型和維特比算法對高價值文檔進(jìn)行分詞處理,以達(dá)到較好的分詞效
3、果;然后使用TextRank算法提取文檔關(guān)鍵詞;有了關(guān)鍵詞表示的文檔后,對其進(jìn)行k-means++聚類;獲得分類的高價值文檔后,重新計算每類中文檔的關(guān)鍵詞權(quán)重,最后從每類中選取權(quán)重較高的關(guān)鍵詞作為該組的推薦詞,每組的推薦詞數(shù)用戶可根據(jù)需要自行指定。通過這一方式推薦出來的關(guān)鍵詞不是對原有關(guān)鍵詞的簡單包含或組合,而是從用戶認(rèn)為對自己比較有用的文章中獲得的重要的關(guān)鍵詞信息。最后經(jīng)過實驗驗證,我們可以得出,該方法對于用戶監(jiān)測到比較準(zhǔn)確的網(wǎng)絡(luò)輿情
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于關(guān)鍵詞智能衍生的網(wǎng)絡(luò)輿情監(jiān)測系統(tǒng)研究.pdf
- 基于關(guān)鍵詞聚類的本體層次關(guān)系構(gòu)建研究.pdf
- 基于關(guān)鍵詞聚類與神經(jīng)網(wǎng)絡(luò)的網(wǎng)頁排序?qū)W習(xí)算法研究.pdf
- 基于復(fù)雜網(wǎng)絡(luò)理論的文本聚類和關(guān)鍵詞提取方法研究.pdf
- 基于論文關(guān)鍵詞聚類的用戶興趣模型細(xì)化方法研究.pdf
- 基于關(guān)鍵詞與混合特征的新聞協(xié)同推薦研究.pdf
- TextRank關(guān)鍵詞提取算法與SOM文本聚類模型的優(yōu)化研究.pdf
- 論壇熱點事件關(guān)鍵詞識別與傳播趨勢研究.pdf
- 基于文本聚類的微博輿情熱點檢測技術(shù)研究.pdf
- 中文文本關(guān)鍵詞提取和文本聚類中聚類中心點選取算法研究.pdf
- 關(guān)鍵詞 長尾關(guān)鍵詞 拓展技巧
- 關(guān)系數(shù)據(jù)庫關(guān)鍵詞檢索的結(jié)果排序與聚類研究.pdf
- 基于對等網(wǎng)絡(luò)的多關(guān)鍵詞搜索技術(shù).pdf
- 面向網(wǎng)絡(luò)輿情的哈薩克文熱點詞提取方法研究.pdf
- 基于神經(jīng)網(wǎng)絡(luò)的特定人關(guān)鍵詞檢索.pdf
- 基于詞跨度的網(wǎng)頁關(guān)鍵詞提取方法研究.pdf
- 校園安全類熱點事件網(wǎng)絡(luò)輿情應(yīng)對研究.pdf
- 基于關(guān)鍵詞的語義搜索.pdf
- 基于網(wǎng)絡(luò)搜索關(guān)鍵詞的住宅價格指數(shù)預(yù)測研究.pdf
- 基于詞共現(xiàn)的關(guān)鍵詞抽取算法研究.pdf
評論
0/150
提交評論