版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、近年來,人們面對(duì)海量數(shù)據(jù)很難有效地分辨出哪些是自己真正需要的信息。隨著信息量的不斷增大,信息的利用率反而降低,這就是信息過載現(xiàn)象。隨著大量網(wǎng)絡(luò)信息的數(shù)字化,搜索引擎或推薦系統(tǒng)對(duì)人們來說已經(jīng)成為至關(guān)重要的信息過濾工具。個(gè)性化推薦作為信息過濾技術(shù)可以根據(jù)用戶的歷史行為記錄來挖掘用戶的潛在興趣。推薦系統(tǒng)通常面臨大規(guī)模甚至超大規(guī)模數(shù)據(jù),因此其計(jì)算復(fù)雜度相對(duì)較高甚至難以在全量數(shù)據(jù)中進(jìn)行計(jì)算,而應(yīng)用系統(tǒng)通常需要進(jìn)行實(shí)時(shí)計(jì)算。因此,研究如何抽取信息推
2、薦網(wǎng)絡(luò)的骨架,在保持推薦精度的前提下壓縮數(shù)據(jù)規(guī)模,對(duì)于真實(shí)應(yīng)用的推薦系統(tǒng)具有重要意義。因此,本文從推薦網(wǎng)絡(luò)的結(jié)構(gòu)特征出發(fā),分別研究網(wǎng)絡(luò)中的節(jié)點(diǎn)和連邊與推薦性能的相關(guān)性,并嘗試抽取能夠保持推薦系統(tǒng)性能的網(wǎng)絡(luò)信息骨架。主要工作如下:
1、從識(shí)別重要節(jié)點(diǎn)和連邊的角度,總結(jié)了復(fù)雜網(wǎng)絡(luò)和推薦網(wǎng)絡(luò)的信息骨架抽取方法。闡述了推薦技術(shù)的基本理論、常見算法、評(píng)價(jià)指標(biāo)和推薦網(wǎng)絡(luò)結(jié)構(gòu)的拓?fù)涮卣?。從用戶?jié)點(diǎn)重要性的角度對(duì)比了幾種基于用戶節(jié)點(diǎn)的特征與推
3、薦的相關(guān)性。
2、提出了基于相似性子圖的推薦網(wǎng)絡(luò)信息骨架抽取算法。從推薦網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)出發(fā),研究了幾種網(wǎng)絡(luò)結(jié)構(gòu)特征與推薦的相關(guān)性。我們結(jié)合用戶相似性和商品相似性來定義推薦網(wǎng)絡(luò)中連邊的權(quán)重,并發(fā)現(xiàn)權(quán)重值大的連邊與推薦精度的相關(guān)性更強(qiáng)。三個(gè)真實(shí)數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果表明,通過該算法抽取的信息骨架能夠在top-L推薦過程中僅依賴原始網(wǎng)絡(luò)中20%的連邊就獲得超過90%的推薦準(zhǔn)確率,同時(shí)還能保持推薦的多樣性。算法中相似鄰居個(gè)數(shù)的選擇對(duì)推薦效果
4、也沒有明顯影響。此外,通過對(duì)信息骨架結(jié)構(gòu)的詳細(xì)分析,我們發(fā)現(xiàn)信息骨架能夠較好的保持原始網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)特征。該算法抽取的信息骨架能夠通過壓縮數(shù)據(jù)規(guī)模,有效地在保留推薦精度的同時(shí)提高推薦系統(tǒng)的性能。
3、提出了基于介數(shù)中心性和時(shí)間信息混合的推薦網(wǎng)絡(luò)信息骨架抽取算法。本文通過引入介數(shù)中心性這一復(fù)雜網(wǎng)絡(luò)的拓?fù)涮卣鳎芯苛嘶谟脩艄?jié)點(diǎn)、商品節(jié)點(diǎn)以及連邊的介數(shù)中心性與推薦的相關(guān)性,實(shí)驗(yàn)結(jié)果表明商品節(jié)點(diǎn)和連邊的介數(shù)中心性越高,其與推薦的相關(guān)
5、性越強(qiáng)。據(jù)此,我們進(jìn)一步提出了將時(shí)間信息與這兩種基于介數(shù)中心性的方法相結(jié)合的算法。在兩個(gè)真實(shí)數(shù)據(jù)集的結(jié)果表明,可以通過增加混合骨架抽取方法中介數(shù)中心性的權(quán)重來提高推薦系統(tǒng)的準(zhǔn)確率,或者通過增加混合骨架抽取方法中時(shí)間因素的權(quán)重來提高推薦系統(tǒng)的多樣性。因此在信息骨架抽取的過程中,我們可以對(duì)連邊的介數(shù)中心性和時(shí)間信息選取合適的權(quán)重,使推薦算法在獲得較高準(zhǔn)確率的同時(shí),也能擁有較高的推薦多樣性,提高系統(tǒng)的個(gè)性化程度,并且減少數(shù)據(jù)的存儲(chǔ)空間,降低系
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 面向網(wǎng)絡(luò)數(shù)據(jù)的信息抽取研究與應(yīng)用.pdf
- 社會(huì)網(wǎng)絡(luò)關(guān)系抽取及其協(xié)同推薦算法.pdf
- 面向眾創(chuàng)的網(wǎng)絡(luò)信息抽取研究與實(shí)現(xiàn).pdf
- 基于信息抽取技術(shù)的商業(yè)社會(huì)網(wǎng)絡(luò)創(chuàng)建研究.pdf
- WEB信息抽取的研究.pdf
- 網(wǎng)絡(luò)信息抽取系統(tǒng)關(guān)鍵技術(shù)研究.pdf
- 基于信息抽取的社會(huì)網(wǎng)絡(luò)構(gòu)建技術(shù)的研究與應(yīng)用.pdf
- 基于網(wǎng)絡(luò)信息檢索的網(wǎng)頁文本抽取和處理的研究.pdf
- 基于信息抽取的人物關(guān)系網(wǎng)絡(luò)構(gòu)建研究.pdf
- 數(shù)值信息的抽取方法研究.pdf
- 基于領(lǐng)域本體的網(wǎng)絡(luò)信息抽取方法的研究與實(shí)現(xiàn).pdf
- 基于網(wǎng)絡(luò)的多媒體節(jié)目編目信息抽取技術(shù)的研究.pdf
- 網(wǎng)絡(luò)信息自動(dòng)化高效抽取技術(shù)研究.pdf
- 基于神經(jīng)網(wǎng)絡(luò)的Web信息抽取系統(tǒng)的研究與實(shí)現(xiàn).pdf
- 基于深度置信網(wǎng)絡(luò)的中文信息抽取方法.pdf
- 基于Web信息抽取的網(wǎng)絡(luò)輿情統(tǒng)計(jì)與分析.pdf
- 基于網(wǎng)絡(luò)的農(nóng)業(yè)信息抽取與數(shù)據(jù)挖掘系統(tǒng).pdf
- 基于HMM和BP網(wǎng)絡(luò)混合模型的web文本信息抽取研究.pdf
- 基于網(wǎng)絡(luò)結(jié)構(gòu)的信息推薦算法的研究.pdf
- 基于本體的信息抽取研究.pdf
評(píng)論
0/150
提交評(píng)論