面向主題的新浪微博意見領(lǐng)袖研究.pdf_第1頁
已閱讀1頁,還剩85頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、新浪微博因其注冊門檻低和實時分享信息的特點,自公測以來便吸引了越來越多的用戶。微博不僅隨時傳播著各種新聞,還可以讓用戶隨時隨地發(fā)表自己的看法,這加快了信息傳播速度,也為用戶提供了自由討論的平臺,但基于網(wǎng)絡(luò)的虛擬性,用戶在使用微博時易忽略法律和道德的約束,更有甚者發(fā)表不實言論,造成了惡劣影響。目前為止,微博輿情控制手段還停留在比較原始的層面,為此,本文從數(shù)據(jù)分析挖掘的角度出發(fā),針對新浪微博的輿情控制,主要進行了三方面的研究。
  (

2、1)確定輿情的發(fā)展方向,即微博的熱度隨著時間的變化情況,為輿情控制部門提供需重點關(guān)注的話題發(fā)展方向。在微博中,一個話題往往對應(yīng)著某一事件,而用戶發(fā)表的該話題相關(guān)微博則通常是對特定事件的討論。為了把握該事件的輿情走向,首先需要了解用戶對該事件討論過程中呈現(xiàn)出的各種主題以及各個主題隨著時間變化的演化情況。
  (2)確定當(dāng)前影響力大的用戶,為輿情控制部門提供需重點控制的人群。對所有參與話題討論的用戶進行數(shù)據(jù)整理,構(gòu)建用戶影響力衡量模型

3、,并基于信息熵的方法對模型中的各個指標權(quán)重進行科學(xué)地計算,得出所有用戶的初始影響力。結(jié)合主題分析結(jié)果構(gòu)建主題-用戶關(guān)系表,以主題相關(guān)性為依據(jù)劃分用戶群體,并根據(jù)不同群體間用戶的轉(zhuǎn)發(fā)關(guān)系建立圖模型,迭代計算出不同主題下用戶的最終影響力,按主題不同對最終影響力進行排名,選排名靠前的用戶為面向主題的意見領(lǐng)袖。
  (3)確定可能在話題討論中具有較大影響力的用戶,為輿情控制部門提供需重點關(guān)注的人群。在用戶影響力衡量模型各指標的基礎(chǔ)上,結(jié)合

4、用戶參與話題討論的特點,從用戶網(wǎng)絡(luò)結(jié)構(gòu)、用戶歷史活躍度、微博歷史傳播力度、用戶自身特征和用戶話題參與度五個方面提取出14個特征向量,用于構(gòu)建隨機森林預(yù)測模型,在訓(xùn)練模型過程中優(yōu)化參數(shù)特征向量個數(shù)和決策樹棵數(shù),使模型預(yù)測效果更好。
  本文對上述三方面的研究中所需要用到的理論知識和算法集中進行了整理。
  最后,基于“樂視12億資產(chǎn)被凍結(jié)”這一實際輿情發(fā)展情況,設(shè)計實驗對本文研究的三方面內(nèi)容進行驗證。運用Python工具實現(xiàn)微

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論