版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、所謂時(shí)序數(shù)據(jù)是指觀察對(duì)象的某一特征或行為按時(shí)間排序的集合。實(shí)際應(yīng)用中很大一部分時(shí)序數(shù)據(jù)是由系統(tǒng)產(chǎn)生用于記錄用戶的行為。分析這些數(shù)據(jù)背后的用戶行為模式,將會(huì)對(duì)用戶和系統(tǒng)模式的識(shí)別與未來狀態(tài)的預(yù)測(cè)帶來積極的影響。然而,這些刻畫用戶行為的時(shí)序數(shù)據(jù)卻體量龐大且表現(xiàn)形式復(fù)雜,給處理這些這些數(shù)據(jù)帶來了巨大困難。
本文遵循“數(shù)據(jù)中挖掘模式,模式預(yù)測(cè)未來”的思路,意在從用戶時(shí)序數(shù)據(jù)中挖掘出有用的行為模式,并以此為基礎(chǔ)分別預(yù)測(cè)出小規(guī)模群組和復(fù)雜
2、群體(系統(tǒng))的未來行為狀態(tài)。為此,文章針對(duì)如下關(guān)鍵問題提出了有效的解決方案:第一,是時(shí)間序列的表示問題。由于用戶行為的多樣性,使得用傳統(tǒng)方法表示用戶行為存在諸多問題,如維數(shù)災(zāi)難等。本文創(chuàng)造性地提出了一種用戶行為模式的內(nèi)容-結(jié)構(gòu)表示方法,它是利用聚類和貪婪算法,將原始用戶時(shí)序數(shù)據(jù)用一個(gè)極其簡單的序列表示。此表示方法既保留了原始序列的主要信息,又方便了后續(xù)的行為模式挖掘工作。其次,是時(shí)間序列模式相似度衡量問題。由于用戶行為序列數(shù)據(jù)所指向的對(duì)
3、象眾多,因此衡量其相似度必不可少。然而不同對(duì)象行為序列的多維和非等長特性卻給此項(xiàng)工作帶來了挑戰(zhàn)。本文基于內(nèi)容-結(jié)構(gòu)表示,分別從用戶行為偏好以及偏好分布特點(diǎn)兩方面去衡量不同用戶序列行為的相似度。實(shí)驗(yàn)表明,此相似度衡量方法表現(xiàn)良好。第三,是群體用戶行為的預(yù)測(cè)問題。本文分別從微觀和宏觀的角度預(yù)測(cè)了群體行為趨勢(shì)。微觀方面,利用基于內(nèi)容-結(jié)構(gòu)模式的表示和相似度衡量方法,預(yù)測(cè)了小規(guī)模群組的行為趨勢(shì)。宏觀方面,利用相空間重構(gòu)的方法將復(fù)雜群體(系統(tǒng))行
4、為序列數(shù)據(jù)映射到相空間,然后基于此空間構(gòu)建預(yù)測(cè)算法。其中在尋找相空間中相似點(diǎn)用于預(yù)測(cè)時(shí),創(chuàng)新性地提出了改進(jìn)的 K鄰近值算法,使得預(yù)測(cè)準(zhǔn)確性有了很大幅度地提升。
本文的主要貢獻(xiàn)在于三個(gè)方面,首先提出了一種新的用戶序列行為的“內(nèi)容-結(jié)構(gòu)”表示方法和相似度度量方式。其次,分別從微觀和宏觀的角度提出了預(yù)測(cè)小規(guī)模群組和復(fù)雜群體行為的有效方法,并利用改進(jìn)的 K鄰近值算法大大提升了復(fù)雜群體行為預(yù)測(cè)的準(zhǔn)確度。
實(shí)驗(yàn)結(jié)果表明,本文的方
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 序列挖掘在臨床行為模式發(fā)現(xiàn)中的應(yīng)用研究.pdf
- 海量數(shù)據(jù)庫中的小模式發(fā)現(xiàn).pdf
- 用戶訪問模式的發(fā)現(xiàn)及其應(yīng)用.pdf
- 序列模式挖掘在Web用戶訪問序列挖掘中的應(yīng)用研究.pdf
- 序列模式發(fā)現(xiàn)及其應(yīng)用研究.pdf
- 面向網(wǎng)絡(luò)用戶行為模式發(fā)現(xiàn)的數(shù)據(jù)挖掘技術(shù)探索.pdf
- 數(shù)據(jù)庫中序列模式發(fā)現(xiàn)的研究.pdf
- 序列模式發(fā)現(xiàn)中關(guān)鍵問題的研究.pdf
- 基于用戶行為模式特征的時(shí)間序列異常檢測(cè).pdf
- 互聯(lián)網(wǎng)中的海量用戶行為挖掘算法研究.pdf
- 序列模式發(fā)現(xiàn)模型的研究.pdf
- 基于海量用戶行為的推薦算法研究.pdf
- 時(shí)間序列數(shù)據(jù)的模式發(fā)現(xiàn)及預(yù)測(cè)方法研究.pdf
- 基于用戶行為的社區(qū)發(fā)現(xiàn)研究.pdf
- mba論文面向網(wǎng)絡(luò)用戶行為模式發(fā)現(xiàn)的數(shù)據(jù)挖掘技術(shù)探索pdf
- 序列模式發(fā)現(xiàn)中關(guān)鍵問題的研究與實(shí)現(xiàn).pdf
- 海量客運(yùn)數(shù)據(jù)中的頻繁旅行模式發(fā)現(xiàn)算法研究與實(shí)現(xiàn).pdf
- WEB用戶訪問序列模式挖掘.pdf
- 蛋白質(zhì)序列模式發(fā)現(xiàn)算法.pdf
- 生物地理學(xué)優(yōu)化算法及其在生物序列模式發(fā)現(xiàn)中的應(yīng)用.pdf
評(píng)論
0/150
提交評(píng)論