版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、隨著互聯(lián)網(wǎng)技術(shù)的迅速發(fā)展以及計(jì)算機(jī)用戶的急劇增加,互聯(lián)網(wǎng)已經(jīng)成為人們獲取信息的一項(xiàng)主要途徑。然而互聯(lián)網(wǎng)上很多重要的信息一般都被其它信息掩蓋,人們很難從如此眾多的網(wǎng)絡(luò)信息資源中獲取到有用的信息。尤其是在當(dāng)今社會(huì),突發(fā)事件已經(jīng)成為困擾世界各國(guó)的重大問(wèn)題,人們對(duì)突發(fā)事件的發(fā)生以及影響比較關(guān)注,相關(guān)人員需要第一時(shí)間掌握相關(guān)動(dòng)態(tài)。本文的研究對(duì)象——新事件檢測(cè)(NED)的目標(biāo)就是檢測(cè)出報(bào)道一個(gè)新聞話題種子事件的第一篇新聞。
本文主要針對(duì)時(shí)
2、間與地點(diǎn)在新聞報(bào)道中的作用進(jìn)行研究,把時(shí)間與地點(diǎn)作為新聞報(bào)道間計(jì)算相似度的重要測(cè)度。并針對(duì)新事件檢測(cè)過(guò)程中新聞簇的漂移現(xiàn)象進(jìn)行了一定的分析研究,設(shè)計(jì)相關(guān)的新聞簇模板更新算法來(lái)減少漂移給新事件檢測(cè)帶來(lái)的影響。本文的主要工作為以下幾點(diǎn):
1.本文采用特征加權(quán)的方式對(duì)傳統(tǒng)的tf-idf模型進(jìn)行改進(jìn)。設(shè)置了一個(gè)參數(shù)ω,用參數(shù)ω來(lái)調(diào)整特征項(xiàng)權(quán)值的大小,這樣就對(duì)一些詞頻低,但是比較重要的特征詞的權(quán)重做了適當(dāng)?shù)姆糯?,從而提高新事件檢測(cè)的準(zhǔn)確
3、率。
2.設(shè)計(jì)了一個(gè)基于主題要素的突發(fā)事件新聞新事件檢測(cè)算法,利用時(shí)空信息提高新事件檢測(cè)效率。對(duì)時(shí)間信息與地點(diǎn)信息進(jìn)行規(guī)范化,分別計(jì)算出新聞報(bào)道與新聞簇的時(shí)間相似度與地點(diǎn)相似度;并將時(shí)間相似度、地點(diǎn)相似度與內(nèi)容相似度三者結(jié)合起來(lái)表示新聞文檔間的相似度。
3.引入了特定的新聞簇模板自動(dòng)更新算法,讓新聞簇模板的表示隨著新聞報(bào)道的不斷加入而發(fā)生變化。
4.設(shè)計(jì)了一個(gè)實(shí)驗(yàn)系統(tǒng),分為五組實(shí)驗(yàn),并從失報(bào)率、錯(cuò)報(bào)率、標(biāo)準(zhǔn)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于SVM的新聞報(bào)道特征新事件檢測(cè)研究.pdf
- 基于事件樹(shù)的地理要素時(shí)空回溯方法研究.pdf
- 時(shí)空要素驅(qū)動(dòng)的事件網(wǎng)頁(yè)信息檢索方法研究.pdf
- 基于人體姿態(tài)時(shí)空變化的摔倒事件檢測(cè)研究.pdf
- 基于事件要素網(wǎng)絡(luò)的多主題文本自動(dòng)文摘方法研究.pdf
- 基于突發(fā)事件新聞標(biāo)題的過(guò)濾方法研究.pdf
- 基于SVM的突發(fā)事件新聞話題跟蹤方法研究.pdf
- 基于車輛檢測(cè)與跟蹤的交通事件檢測(cè)方法研究.pdf
- 基于語(yǔ)義的視頻事件檢測(cè)分析方法研究.pdf
- 24454.基于事件過(guò)程的時(shí)空數(shù)據(jù)模型構(gòu)建方法研究
- CPS時(shí)空建模及協(xié)作事件檢測(cè)的研究.pdf
- 基于HCRF的足球視頻精彩事件檢測(cè)方法研究.pdf
- 基于時(shí)空聯(lián)合的海天背景艦船目標(biāo)檢測(cè)方法研究.pdf
- OTDR事件檢測(cè)方法研究.pdf
- 基于統(tǒng)計(jì)方法的交通事件檢測(cè).pdf
- 基于預(yù)測(cè)技術(shù)的事件檢測(cè)方法的研究與設(shè)計(jì).pdf
- 基于時(shí)空馬爾可夫隨機(jī)場(chǎng)的城市交通事件檢測(cè)研究.pdf
- 事件及其事件要素的抽取研究.pdf
- 基于網(wǎng)絡(luò)新聞流的熱點(diǎn)事件檢測(cè)與跟蹤算法研究.pdf
- 基于微博的突發(fā)事件檢測(cè)方法研究.pdf
評(píng)論
0/150
提交評(píng)論