視頻點播系統(tǒng)用戶生命周期和視頻活躍期的研究.pdf_第1頁
已閱讀1頁,還剩72頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、目前,互聯(lián)網(wǎng)點播視頻產(chǎn)業(yè)發(fā)展突飛猛進,視頻服務提供商之間競爭的日益激烈。視頻服務提供商一方面需要改善用戶體驗,吸引更多用戶;另一方面需要優(yōu)化資源配置,最大限度利用系統(tǒng)資源。為此需要了解用戶生命期行為和視頻活躍度演進規(guī)律,但是目前針對視頻點播系統(tǒng)的此類研究還十分匱乏。因此本文基于PPTV視頻點播系統(tǒng)的大規(guī)模觀看數(shù)據(jù),利用機器學習和數(shù)據(jù)挖掘的方法,通過用戶早期行為,預測其生命周期,并通過視頻的早期點擊量和視頻固有屬性信息,預測視頻活躍期模式

2、。本文的具體貢獻主要有如下幾個方面。
  (1)本文基于PPTV大規(guī)模數(shù)據(jù)分析了用戶在其生命周期內(nèi)的觀看行為。發(fā)現(xiàn)用戶的行為特征量,例如訪問頻率、觀影數(shù)目和視頻觀看完成率在用戶生命周期內(nèi)都隨時間增長呈現(xiàn)“倒U型”軌跡。本文提出了一個新的興趣特征:流行話題偏好,表示用戶對流行視頻的偏好程度。發(fā)現(xiàn)用戶的流行話題偏好隨著時間的增長而減小,這說明用戶在系統(tǒng)中停留的時間越長,她觀看的流行視頻就越少。
  (2)本文基于機器學習的方法,

3、根據(jù)用戶第一周的行為和興趣特征量預測用戶的生命周期。實驗結(jié)果表明,加入本文提出的流行話題偏好特征后,模型的F1值可以提升8.8%,達到0.74;與用戶生命周期最相關的特征是用戶的訪問頻率,流行話題偏好比觀看完成率更重要。
  (3)本文發(fā)現(xiàn)大部分視頻都符合兩種活躍期模式:“尖峰型”和“非尖峰型”。“尖峰型”的視頻可能只會活躍短短幾周而“非尖峰型”視頻會活躍很長時間。為了準確地將視頻分為上述兩種模式,本文提出了一個有效的度量指標:活

4、躍期,也就是視頻的活躍時長。不同于視頻生命周期,本文結(jié)合波峰波谷的計算,提出了一種新的計算視頻活躍期的方法。
  (4)本文根據(jù)視頻前7天的點擊量、視頻評分分值、評分人數(shù)和視頻類型信息,預測視頻活躍期模式。實驗結(jié)果表明模型F1值高達0.85,相比只利用視頻前7天的點擊量提升了9%。作為視頻活躍期模式預測的一個應用,本文提出了基于視頻活躍期模式的緩存替換策略。實驗結(jié)果表明本文的緩存替換策略可以在提升命中率的前提下減少緩存替換次數(shù),最

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論