2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩56頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、數(shù)據(jù)挖掘研究如何從大量數(shù)據(jù)中發(fā)現(xiàn)潛在模式及趨勢,在科學研究、醫(yī)學研究及商業(yè)等領域,正得到越來越廣泛的應用,具有很大的發(fā)展?jié)摿ΑS捎跀?shù)據(jù)挖掘是發(fā)現(xiàn)數(shù)據(jù)中不容易發(fā)現(xiàn)的模式和規(guī)律,如果利用不當,可能對隱私和信息安全構成威脅。因此,如何在保證隱私的情況下挖掘出有用的信息是近年來數(shù)據(jù)挖掘領域研究的熱點之一。 本文首先結合數(shù)據(jù)分布方式、隱私保護目標和隱私保護技術和隱私保護的對象等多個角度,對當前流行的隱私保護關聯(lián)規(guī)則挖掘方法進行了深入淺出的

2、分析和介紹。其次,論文主要針對隱私保護關聯(lián)規(guī)則挖掘提出相關的兩個算法: (1)從隱私保護對象為原始數(shù)據(jù)集的角度出發(fā),總結Rizvid提出的的MASK算法優(yōu)缺點的基礎上,提出了一個基于多參數(shù)隨機擾動的布爾規(guī)則挖掘算法DMASK。該算法同MASK算法相比,能夠按照用戶對隱私關注不同設置不同的擾動參數(shù),從而降低了隱私泄露的可能性。通過合理的參數(shù)設置同時滿足挖掘結果的準確度和隱私保護度。另外,我們利用集合原理對算法實行優(yōu)化,并且嚴格控制

3、數(shù)據(jù)集密度的變化,消除了由于擾動引起的額外計算,從而大大提高程序運行效率。我們分別在人工數(shù)據(jù)集(IBMSyntheticDataset)和實際數(shù)據(jù)集(BMS-WebView-1)運行該算法,實驗結果表明DMASK算法在運行時間上比Aprior減慢少于5倍,同時能夠保證隱私保護度在70%以上,挖掘結果的準確度在90%以上。 (2)從隱私保護對象為敏感模式的角度出發(fā),針對Oliverira提出的SWA算法中容易因推導而產(chǎn)生隱私泄露的

4、不足,提出了一個新穎算法RWA。首先根據(jù)敏感模式和非敏感模式之間的關系建立擾動矩陣,設置矩陣中合適的值,并將原事務數(shù)據(jù)集與擾動矩陣相乘,生成一個能夠阻止向前推導攻擊擾動數(shù)據(jù)集。另外,我們使用不同的擾動參數(shù)來避免敏感規(guī)則被恢復以及降低非敏感規(guī)則被隱藏的機率,更能避免入侵者向前推導所引起的隱私泄露。最后我們利用實驗方法,通過與SWA算法在敏感模式的隱藏、非敏感規(guī)則的丟失以及運行時間等多個性能指標上進行比較,結果表明我們所提出的算法相對于SW

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論