版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、隨著網(wǎng)絡(luò)技術(shù)、信息技術(shù)的發(fā)展,各個(gè)領(lǐng)域的信息量急劇增加,數(shù)據(jù)挖掘處理的數(shù)據(jù)規(guī)模越來(lái)越大,同時(shí)對(duì)數(shù)據(jù)實(shí)時(shí)處理需求不斷增加。特異性數(shù)據(jù)挖掘是數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)的重要組成部分,特異性數(shù)據(jù)中往往蘊(yùn)含著重要信息,包括噪音、故障、入侵等,隨著人們對(duì)欺詐檢測(cè)、網(wǎng)絡(luò)入侵、故障診斷等問(wèn)題的關(guān)注,實(shí)時(shí)異常檢測(cè)日益受到重視。
異常檢測(cè)技術(shù)有基于統(tǒng)計(jì)、聚類(lèi)、距離、密度等方法,在精度和速度要求都比較高的場(chǎng)合下,這些方法均有一定的局限性?;诖?,本文
2、使用采樣特異性因子(sample peculiarity factor,SPF)將基于距離和密度的方法融合起來(lái),并充分考慮數(shù)據(jù)分布的特點(diǎn),進(jìn)行異常檢測(cè)。實(shí)驗(yàn)結(jié)果表明基于采樣特異性因子SPF的異常檢測(cè)算法在精度影響不大的情況下,節(jié)約了計(jì)算時(shí)間,提高了計(jì)算速度,適合用于實(shí)時(shí)異常檢測(cè)。
論文的主要工作:
(1)從數(shù)理統(tǒng)計(jì)的角度,分析采樣方法的異常檢測(cè)算法,并為其提供精度保證。將采樣算法與傳統(tǒng)的基于距離K-NN算法相
3、結(jié)合,通過(guò)分析采樣算法返回的離群點(diǎn)的期望和方差進(jìn)行質(zhì)量度量,并構(gòu)造距離數(shù)據(jù)庫(kù)D’近似計(jì)算總體的情況,即用樣本方差估計(jì)總體方差,從而給基于采樣特異性因子的異常檢測(cè)提供了理論基礎(chǔ)。
(2)提出了學(xué)習(xí)最優(yōu)采樣頻率算法。論文通過(guò)選擇一定的采樣方法,在數(shù)據(jù)集中折半學(xué)習(xí)采樣頻率,在給定置信度的前提下得到采樣頻率的置信區(qū)間,即最優(yōu)采樣頻率范圍。這樣就可以根據(jù)采樣頻率,獲取采樣子集,進(jìn)行異常檢測(cè)。實(shí)驗(yàn)表明,當(dāng)采樣頻率在[1/32,1/16
4、]之間時(shí),將基于采樣特異性因子的異常檢測(cè)算法與基于特異性因子和局部特異性因子的異常檢測(cè)的算法進(jìn)行比較,在精度影響不大的情況下,前者明顯提高了計(jì)算速度。
(3)使用采樣特異性因子和采樣頻率進(jìn)行實(shí)時(shí)異常檢測(cè)。首先將原始數(shù)據(jù)集分成正常數(shù)據(jù)集(Normal Dataset)和異常數(shù)據(jù)集(Anomalous Dataset)兩類(lèi);然后在正常數(shù)據(jù)集中學(xué)習(xí)最優(yōu)采樣頻率,獲取采樣子集;在實(shí)時(shí)處理時(shí),僅需計(jì)算當(dāng)前數(shù)據(jù)的SPF值,使用排名對(duì)比
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于采樣特異性因子的實(shí)時(shí)異常檢測(cè).pdf
- 低氧對(duì)紅系特異性轉(zhuǎn)錄因子的影響.pdf
- 應(yīng)用引物特異性實(shí)時(shí)熒光PCR法檢測(cè)HBVYMDD自然變異的研究.pdf
- 食物特異性IgE及特異性IgG檢測(cè)在濕疹患兒中的應(yīng)用研究.pdf
- 非特異性免疫和特異性免疫復(fù)習(xí)
- 特異性腰痛與非特異性腰痛的對(duì)比研究.pdf
- 梅毒患者外周血特異性轉(zhuǎn)錄因子FOXP3的表達(dá)及檢測(cè).pdf
- 基于特異性重組受體的牛IFN-γ檢測(cè)的研究.pdf
- 遷延性慢性腹瀉患兒食物特異性IgG、牛奶特異性IgEsIL-2R檢測(cè)分析.pdf
- 芝麻、花生、豌豆物種特異性PCR和實(shí)時(shí)熒光定量PCR檢測(cè)方法研究.pdf
- 轉(zhuǎn)基因油菜轉(zhuǎn)化事件特異性檢測(cè)技術(shù).pdf
- 特異性抗體定量檢測(cè)葡聚糖方法的研究.pdf
- 抗原特異性的分子基礎(chǔ)
- 心律失常調(diào)控相關(guān)的心臟特異性轉(zhuǎn)錄因子探討.pdf
- 脂肪細(xì)胞GGPPS特異性缺失對(duì)脂肪因子分泌的影響.pdf
- 基于fMRI的針刺視覺(jué)穴位特異性研究.pdf
- 特異性免疫優(yōu)秀版
- 特異性皮炎兒童
- 分?jǐn)?shù)和小數(shù)數(shù)量表征的符號(hào)特異性和非特異性.pdf
- 非特異性免疫
評(píng)論
0/150
提交評(píng)論