版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、隨著互聯(lián)網技術的高速發(fā)展,互聯(lián)網上的信息包括各種各樣的財經新聞正以爆炸式的速度迅猛增長。毫無疑問,財經新聞中蘊含著大量的財富,它對用戶做重要的經濟決策、對企業(yè)把握市場的發(fā)展規(guī)律、對國家促進金融市場發(fā)展和經濟結構轉型,都具有十分重要的作用和戰(zhàn)略意義。但是,深陷在信息的海洋漩渦之中,人們不得不面臨著嚴峻的信息過載問題。因此,如何快速有效地幫助用戶獲取有價值的財經新聞成為了一個至關重要的問題。為了緩解信息過載的壓力,搜索引擎和門戶網站得到了快
2、速的發(fā)展和應用。傳統(tǒng)的基于核心詞的搜索引擎如百度谷歌等,簡單易用,用戶只需要輸入目標核心詞,搜索引擎就會自動返回相關的結果。但是搜索引擎往往動輒返回數(shù)以萬計的結果,因此準確率通常比較低。另外,有些用戶只關心某些特定領域的新聞如房地產相關的新聞,雖然門戶網站的出現(xiàn)彌補了這一問題,但是門戶網站往往冗余龐大、而且只是簡單的羅列新聞,無法發(fā)現(xiàn)隱藏在新聞內部的關系。例如,房價的新聞往往和房價調控政策以及建筑建材業(yè)的新聞有深入的關系。
本
3、研究主要內容包括:⑴結合傳統(tǒng)搜索引擎和門戶網站的優(yōu)點,利用數(shù)據(jù)挖掘和自然語言處理領域的相關知識,提出了一種新的智能搜索平臺框架。平臺一共包含了六大模塊,它不僅可以提供基于核心詞的便捷搜索服務,而且還可以給用戶提供分門別類的財經資訊。同時,為了給用戶提供第一手的實時熱點,平臺集成了基于TDT的熱點新聞發(fā)現(xiàn)算法。此外,為了發(fā)現(xiàn)隱藏在新聞內部的關系,基于新聞的設計并構建了動態(tài)知識網絡,用于快速引導用戶找到更加多樣和有用的信息。⑵在智能搜平臺的
4、基礎上,針對基于SVM的自動分類算法和基于TDT技術的熱點新聞發(fā)現(xiàn)算法做了改進。在文本表示階段,重點考慮主題在財經新聞中的重要性,改進了特征詞的權重公式。更進一步,考慮到時間對于熱點事件至關重要。因此,通過融入時間因素改進了文檔與主題的相似度公式。⑶在真實的新聞數(shù)據(jù)集上的實驗結果表明,通過引入主題因素,在合適的權重系數(shù)情況下,可以提高分類算法的正確率。同時,通過融入時間因素,熱點新聞自動發(fā)現(xiàn)算法相比于傳統(tǒng)的方法,可以更好的區(qū)分內容相似但
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 財經新聞敘事研究.pdf
- 基于WebHarvest的中文財經新聞搜索引擎的設計與實現(xiàn).pdf
- SMG第一財經新聞共享平臺的研究及實現(xiàn).pdf
- 英語財經新聞漢譯.pdf
- 英語財經新聞的地道翻譯.pdf
- 財新網數(shù)據(jù)財經新聞研究.pdf
- 中國財經新聞的俄譯策略.pdf
- 財經新聞翻譯實踐報告.pdf
- 財經新聞報道中的信息圖表應用研究
- 增譯和省略的應用——財經新聞翻譯實踐報告.pdf
- 財經新聞中消息來源的特征研究.pdf
- 英語財經新聞中的隱喻及漢譯.pdf
- 財經新聞評論寫作變化初探.pdf
- 財經新聞英語語域分析.pdf
- 英語財經新聞翻譯實踐報告.pdf
- 財經新聞英語翻譯實踐報告——以摘自《經濟學人》的9篇財經新聞為例.pdf
- 財經新聞中“that”從句的漢譯實踐報告.pdf
- 英語財經新聞漢譯實踐報告.pdf
- 都市類報紙財經新聞的大眾化研究.pdf
- 《第一財經日報》與《華爾街日報》財經新聞對比分析.pdf
評論
0/150
提交評論