版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、現在的互聯網上社交媒體隨處可見,這給信息檢索和傳播分析工作帶來了機遇與挑戰(zhàn)。本文主要圍繞在社交媒體中如何找到重要的信息以及信息是如何傳播的展開。我們將Twitter作為研究對象,因為它是目前最著名的社交媒體之一,并且數據是公開的。這樣從隱私的角度考慮,獲取研究數據變得容易且能很好的為研究任務服務。信息檢索的主要任務是在文檔集合中,找到與給定話題相關的客觀文本或主觀文本。Twitter是一個豐富的包含各種話題及其評論信息的資源庫,本文將探
2、討如何在Twitter中找到相關的信息。但是tweet的短小化和非正式的文本特點,使得Twitter中的檢索不同于以往的檢索任務。本文通過研究tweet文本特點和特有的Twitter社交媒體屬性幫助Twitter檢索。另外,Twitter中信息的傳播是一種普遍現象且與消息的質量相關。因此,我們從tweet本身和用戶的角度,研究哪些因素影響了tweet的轉發(fā)和人的轉發(fā)行為。本研究主要內容包括:
?、爬媒Y構化信息的Twitter檢
3、索:Twitter檢索是在Twitter中找到與給定話題相關的的任務。絕大部分的Twitter檢索系統(tǒng)在構造檢索模型時一般都認為tweet是一個平面文本,但用戶在編輯tweet時的一些習慣使得tweet文本呈現結構化的特點。這種結構化是通過一些不同的文本積木塊組合而成,積木類型具體包括平面文本、核心詞、鏈接、提及等。每一種積木都有自已獨特的本質,一系列積木的排序組合又反映了一定的話語轉換。以往的研究發(fā)現,通過開發(fā)文本的結構信息能夠幫助結
4、構化文本的檢索(例如,網頁檢索)。本工作通過積木結構開發(fā)tweet的結構化信息,以此幫助Twitter檢索。我們利用積木及其排列組合開發(fā)了一系列特征,并將其應用到排序學習的框架中。我們發(fā)現利用結構化tweet的方法進行檢索能夠達到目前最好的Twitter檢索方法效果,將結構化tweet的方法和其他社交媒體特征一起使用能夠進一步提高Twitter的檢索效果。
?、芓witter觀點檢索:觀點檢索是在數據中找到對指定話題表達正面或反
5、面觀點的加如的任務。人們幾乎在Twitter中表達了任何話題的觀點,使其成為一個豐富的觀點資源庫。但是Twitter中也存在大量的垃圾信息和各種不同類型的文本,使得Twitter中的觀點檢索充滿挑戰(zhàn)。我們提出了如何利用tweet的社交媒體信息和文本結構化信息的方法幫助Twitter的觀點檢索。特別的,基于排序學習,我們發(fā)現tweet的用戶信息(如用戶包含朋友的數目)、tweet文本本身的結構信息和觀點化程度影響著tweet的排序結果。實
6、驗結果表明社交媒體信息能夠幫助Twitter的觀點檢索?;跓o監(jiān)督學習評價tweet觀點化程度,并以此開發(fā)特征形成的檢索方法能夠到達手工標注tweet的有監(jiān)督方法的檢索效果,且這種方法能夠幫助觀點檢索中話題依賴問題的解決。最后,我們在重新標注的TREC Tweets2011數據集上進一步驗證了我們Twitter觀點檢索方法的有效性。
?、荰witter中傳播觀點的發(fā)現:Twitter已經變成人們收集觀點做出決策的重要資源,但是數
7、量眾多且差異巨大的觀點嚴重影響了人們使用這些資源的效果。本文我們考慮了如何在Twitter中找到傳播觀點的任務一tweet不僅表達了對某些話題的觀點,且這個tweet在未來會被轉發(fā)。利用排序學習模型,我們開發(fā)了一系列特征,具體包括tweet的傳播度特征、觀點化特征和文本質量特征。實驗結果證明了我們開發(fā)的特征對于Twitter中傳播觀點的發(fā)現是有效的,并且將所有特征整合的方法在發(fā)現效果上能夠顯著優(yōu)于BM25方法和Twitter觀點檢索方法
8、。最后,我們發(fā)現我們的方法在預測觀點傳播上可以達到人預測的水平。
⑷Twitter中信息傳播者的發(fā)現:Twitter和其它社交網絡中一個重要的交流機制就是消息傳播一人們分享其他人創(chuàng)建的消息。雖然目前有許多工作研究了Twitter中的tweet是如何傳播的(轉發(fā)),但是一個未解決的問題是到底誰會轉發(fā)給定的tweet。這里我們考慮了在Twitter中給定一條_如,發(fā)現作者的粉絲中誰會轉發(fā)。利用排序學習模型的框架,我們設計了一些特征
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 社交媒體中的信息檢索與傳播分析
- 社交媒體時代信息的碎片化傳播
- 社交媒體中觀點信息分析與應用.pdf
- 智能多媒體信息分析與檢索的研究.pdf
- 社交媒體信息異化的案例分析.pdf
- 社交媒體信息異化的案例分析
- 社交媒體環(huán)境下謠言的傳播與治理.pdf
- 社交媒體中個人隱私的傳播隱患研究
- 社交網絡中的信息傳播算法研究.pdf
- 社交網絡的信息傳播模型與仿真.pdf
- 基于RSSBus的社交媒體信息收集分析系統(tǒng).pdf
- 微博媒體的信息傳播分析.pdf
- 基于社交媒體的企業(yè)招聘信息傳播效果實證研究
- 基于社交媒體的企業(yè)招聘信息傳播效果實證研究
- 1677.社交媒體的傳播研究
- 基于社交媒體的品牌傳播問題與對策研究
- 社交媒體環(huán)境下的檔案信息服務分析
- 社交媒體環(huán)境下的檔案信息服務分析.pdf
- 社交網絡中基于用戶信息與行為的精準傳播研究
評論
0/150
提交評論