基于匿名的隱私保護方法研究.pdf_第1頁
已閱讀1頁,還剩131頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、近幾年來,伴隨著信息技術(shù)和互聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展,社會各行業(yè)及領(lǐng)域需要收集和分析的數(shù)據(jù)也迅速增長,這些龐大數(shù)據(jù)背后所包含的知識是醫(yī)學(xué)探索、經(jīng)濟發(fā)展以及理論研究的寶貴資源,人們希望從這些海量并且不斷在高速增長的數(shù)據(jù)中找到潛在的規(guī)則及其商業(yè)模式,挖掘出數(shù)據(jù)真正的價值。然而,在實現(xiàn)這些需求的同時可能會牽涉到個人的隱私信息,由此引發(fā)了對數(shù)據(jù)發(fā)布中的隱私保護問題的研究。為了保護個體的隱私信息不泄露,需對數(shù)據(jù)發(fā)布中的技術(shù)和方法進行研究,使得發(fā)布的數(shù)據(jù)

2、既能保護其隱私性又能保持較高的數(shù)據(jù)可用性,以實現(xiàn)隱私保護與數(shù)據(jù)可用性間的折衷平衡。另外,由于不同類型的數(shù)據(jù)所面臨的隱私泄露問題不盡相同,因此,本文立足于隱私保護中所面臨的各種泄露問題,在保護數(shù)據(jù)可用性的前提下,對不同類型數(shù)據(jù)的隱私匿名方法進行了全面的研究。
  首先,針對分類型敏感屬性的隱私保護問題,在傳統(tǒng)t-closeness模型的基礎(chǔ)上,對其采用的EMD距離進行改進,由于EMD距離沒有考慮等價類與數(shù)據(jù)表間敏感屬性分布穩(wěn)定性的問

3、題,在分布間穩(wěn)定差異過大時,會大大提高隱私泄露的風(fēng)險,由此提出了一種EMD距離與KL散度結(jié)合的距離度量標(biāo)準(zhǔn)。同時根據(jù)分類型敏感屬性的層次樹結(jié)構(gòu),對數(shù)據(jù)表進行桶分組劃分,然后提出一種基于敏感屬性值劃分的t-closeness原則,采用自頂向下和自底向上的貪心思想獲取滿足該原則的最小等價類大小,運用k-近鄰的思想來選取準(zhǔn)標(biāo)識符屬性值相似的元組生成等價類。最后實驗結(jié)果表明,提出的模型在犧牲少量時間的前提下減少了信息損失,能在有效地保護敏感信息

4、不泄露的同時保持較高的數(shù)據(jù)效用。
  其次,針對將分類型敏感屬性的隱私保護方法直接運用于數(shù)值型敏感屬性的隱私保護上不能保證隱私信息安全性的局限,在考慮數(shù)值型屬性自身特性的基礎(chǔ)上,對面向數(shù)值型敏感屬性的隱私匿名方法進行了研究。近鄰泄露是數(shù)值型敏感屬性隱私保護問題中通常會出現(xiàn)的泄露風(fēng)險之一,當(dāng)分組中個體敏感值差異過小時,攻擊者能以較高置信度推理出個體的敏感值處于某個較小的區(qū)間范圍內(nèi),由此帶來了近鄰泄露風(fēng)險。針對此類泄露風(fēng)險,提出一種面

5、向近鄰泄露的數(shù)值型敏感屬性隱私保護方法,該方法首先在保護準(zhǔn)標(biāo)識符屬性和數(shù)值型敏感屬性內(nèi)在關(guān)系的前提下,將數(shù)值型敏感屬性進行離散化劃分;然后,提出一種面向近鄰泄露的隱私保護原則,并且設(shè)計了最大鄰域優(yōu)先算法來實現(xiàn)該原則。實驗結(jié)果表明,提出的方法能在有效地保護數(shù)值型敏感信息不泄露的同時保持較高的數(shù)據(jù)效用,并且保護了數(shù)據(jù)間的關(guān)系。
  再次,針對多維敏感屬性數(shù)據(jù)在發(fā)布過程中所面臨的隱私泄露問題,對于傳統(tǒng)的l-多樣性進行改進,給出一種l-m

6、aximum原則用以滿足多敏感屬性l-多樣性要求,該原則控制了等價類中敏感值出現(xiàn)的頻率,避免了概率攻擊的風(fēng)險,并且通過理論證明了該原則的安全性;然后,為了保護屬性間的相關(guān)性以及避免基于有損分解方法中所帶來的屬性泄露問題,提出一種基于屬性相關(guān)性的隱私保護方法,采用平均互信息作為屬性間的依賴度,根據(jù)屬性間的依賴度對屬性進行劃分,使得高依賴度的屬性在同一簇中;最后設(shè)計并實現(xiàn)了基于多維敏感屬性的l-maximum算法。實驗結(jié)果表明,提出的模型在

7、保護隱私不泄露的同時,減少了元組的隱匿率,并且保護了數(shù)據(jù)間的關(guān)系。
  最后,針對數(shù)據(jù)流具有持續(xù)時間長、變化迅速、快速到達(dá)等不同于靜態(tài)數(shù)據(jù)而特有的性質(zhì),以及靜態(tài)數(shù)據(jù)上的隱私匿名方法直接用于數(shù)據(jù)流上往往不能達(dá)到較好執(zhí)行效率的局限,提出一種基于時間密度的數(shù)據(jù)流匿名算法。首先,采用k-中心點思想對元組進行聚類,對于信息損失滿足要求的簇輸出;考慮數(shù)據(jù)流的強時態(tài)性,提出時間權(quán)重和時間密度概念,當(dāng)已發(fā)布簇的個數(shù)達(dá)到上限時,刪除時間密度最小的簇

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論