版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、在這個信息爆炸的的時代,以關(guān)系數(shù)據(jù)和XML形式存儲、交換和發(fā)布的數(shù)字?jǐn)?shù)據(jù)顯著地增加,特別是在互聯(lián)網(wǎng)上,這種呈指數(shù)的增長是前所未有的。當(dāng)然,這兩種形式的數(shù)據(jù)不僅可以讓使用者能方便快捷地訪問和交換數(shù)據(jù),并且能極大地便利數(shù)據(jù)擁有者維護(hù)和分發(fā)他們的數(shù)據(jù)。然而,與其他類型的數(shù)字內(nèi)容一樣,關(guān)系數(shù)據(jù)和XML數(shù)據(jù)也面臨著與安全相關(guān)的威脅,特別是當(dāng)數(shù)據(jù)資源是外包的。在這方面的其他挑戰(zhàn)中,兩個重要的問題是關(guān)于版權(quán)保護(hù)和內(nèi)容認(rèn)證。數(shù)字水印技術(shù)已被作為一項(xiàng)關(guān)鍵
2、技術(shù)來保護(hù)擁有者的權(quán)利和驗(yàn)證外包數(shù)字?jǐn)?shù)據(jù)的完整性。
多年來數(shù)字水印已成功用于防止盜版和驗(yàn)證多媒體數(shù)據(jù)內(nèi)容的完整性。隨后開始展開針對其他類型的數(shù)字?jǐn)?shù)據(jù)的數(shù)字水印研究,同時也證明了對于多媒體數(shù)據(jù)也是一種有效的工具,因此研究者利用這種水印技術(shù)用于解決關(guān)系和XML數(shù)據(jù)中的安全問題。本文的研究工作解決了關(guān)于關(guān)系、XML數(shù)據(jù)的數(shù)字水印問題以及其在數(shù)據(jù)庫安全中的應(yīng)用,特別是關(guān)于版權(quán)的保護(hù)和完整性驗(yàn)證。
水印是一個隱藏在宿主
3、數(shù)字?jǐn)?shù)據(jù)中的消息,該消息可有效地用于數(shù)字內(nèi)容的版權(quán)保護(hù)和完整性驗(yàn)證。雖然使用數(shù)字水印用于多媒體內(nèi)容中的研究已有已有很長的時間,但它在應(yīng)用于關(guān)系或XML數(shù)據(jù)時仍面臨著各種嚴(yán)峻的挑戰(zhàn)。這兩種形式的數(shù)據(jù)可用于嵌入水印的空間非常有限,更進(jìn)一步的是,在多數(shù)情況下,這些數(shù)據(jù)的可用性需求并不允許嵌入水印甚至只是改變原來數(shù)字內(nèi)容的單比特信息。
嵌入的水印類型是用于數(shù)字水印技術(shù)分類的標(biāo)準(zhǔn)之一。按照水印的特性,數(shù)字水印技術(shù)可以分為三類,即魯棒
4、水印、脆弱水印和半脆弱水印。在致力于移除水印的攻擊中仍具有魯棒性的水印稱之為魯棒水印。相反的,脆弱水印則是非常脆弱的,在對宿主數(shù)據(jù)進(jìn)行任何篡改的操作時都將引起嵌入的脆弱水印的改變,使水印無法成功提取。半脆弱水印則是一種特殊的脆弱水印,能承受部分合理的對宿主數(shù)據(jù)進(jìn)行的正常修改操作,但會被惡意篡改損壞水印,從而檢測到篡改操作,也就是說如果一些授權(quán)的用戶或數(shù)據(jù)擁有者對宿主數(shù)據(jù)進(jìn)行了一些合理的修改,脆弱水印仍將保持不變。
水印的嵌
5、入對數(shù)據(jù)的使用性造成的影響不大,且水印是以惡意用戶在不嚴(yán)重破壞數(shù)據(jù)使用的情況下不能被破壞的方式進(jìn)行嵌入的。因此,盡管水印技術(shù)不能防止非法拷貝,但它為重分發(fā)的拷貝提供了一種原始版權(quán)關(guān)系認(rèn)證的手段來防止拷貝。
1.基于關(guān)系和XML數(shù)據(jù)的數(shù)字水印
以關(guān)系數(shù)據(jù)為載體的數(shù)字水印技術(shù)的研究起步較晚。最早的關(guān)系數(shù)據(jù)數(shù)字水印技術(shù)出現(xiàn)在2002年,由Agrawal和Kiernan展開的研究。如多媒體數(shù)字水印技術(shù)一樣,研究者最初
6、利用關(guān)系數(shù)據(jù)的最低有效位的修改來嵌入水印。大多數(shù)已有的工作都是基于數(shù)值數(shù)字域的,通過假設(shè)數(shù)值數(shù)據(jù)能夠容忍少量的修改來嵌入水印。當(dāng)然還存在一些其他針對分類數(shù)據(jù)的水印方案。由于有限的甚至是零可用于嵌入水印信息的帶寬,關(guān)系和XML數(shù)據(jù)的自然特性造成數(shù)字水印技術(shù)的使用受到了一定的限制。
動機(jī):本文的研究集中在關(guān)系和XML數(shù)據(jù)擁有者面臨的兩個基本問題,即版權(quán)認(rèn)證和內(nèi)容完整性的驗(yàn)證或篡改檢測。這兩個問題的性質(zhì)不同,需要分開探索使用相同
7、的技術(shù)即水印技術(shù)來設(shè)計(jì)對應(yīng)的解決方案,因此,本文提出了不同的方案來解決這些問題。
除了這兩個基本問題,本文涉及了兩種相似但不同類型的宿主數(shù)據(jù)即:關(guān)系數(shù)據(jù)庫和XML文檔。單一的方法可能不是一種最佳的選擇,如果我們能夠獲得這兩類數(shù)據(jù)的結(jié)構(gòu)、格式以及整體特性。通過大量相關(guān)的文獻(xiàn)閱讀可知,目前關(guān)系和XML數(shù)據(jù)水印技術(shù)的研究還停留在早期階段,仍存在一些問題有待解決,下面列出了其中一些主要的問題。
無失真嵌入:當(dāng)一些數(shù)據(jù)
8、作為水印添加后將改變了載體數(shù)據(jù)的實(shí)際意義。數(shù)據(jù)庫中數(shù)據(jù)的語義值是非常重要的。幾乎所有的現(xiàn)有方法都將在實(shí)際內(nèi)容中引入一些錯誤(少數(shù)除外)從而可能會影響數(shù)據(jù)的可用性。我們分析了各類水印方法中水印嵌入對數(shù)據(jù)可用性的影響,并提出了替代的解決方案。
基于非數(shù)值數(shù)據(jù)的水印嵌入:大部分關(guān)系和XML數(shù)據(jù)水印方案使用數(shù)值數(shù)據(jù)來嵌入水印,在水印的嵌入過程中將引入一些失真,從而破壞數(shù)據(jù)的語義值。當(dāng)沒有數(shù)值數(shù)據(jù)或者數(shù)值數(shù)據(jù)不能提供足夠空間用于水印
9、嵌入時,我們同樣發(fā)現(xiàn)了一個非數(shù)值編碼域來設(shè)計(jì)水印嵌入。
查詢保存:如果水印的嵌入將改變關(guān)系數(shù)據(jù)的內(nèi)容,它也將影響常見的檢索查詢的結(jié)果。通過這項(xiàng)研究工作所取得的目標(biāo)之一是提出查詢保存的水印方案。
魯棒的攻擊分析:對關(guān)系數(shù)據(jù)庫的攻擊的性質(zhì)是不同于那些針對多媒體水印的攻擊的特性。現(xiàn)有的水印方案對于一種或其它類型攻擊是魯棒的。我們還分析了常見的數(shù)據(jù)庫攻擊,并研究這些攻擊對水印的有效性和數(shù)據(jù)庫可用性的影響。
10、 靈活的篡改檢測:針對關(guān)系數(shù)據(jù)和XML文檔的大部分安全工作主要集中在版權(quán)的保護(hù)。目前還很難找到關(guān)于關(guān)系和XML數(shù)據(jù)的認(rèn)證和完整性驗(yàn)證的論文,因此,我們嘗試探索一些可選用的脆弱水印方案用于關(guān)系和XML數(shù)據(jù)認(rèn)證。
在本文,我們通過全面的深入研究現(xiàn)有工作以及他們的缺點(diǎn),分析上述這些問題。作為本文研究的結(jié)果,針對關(guān)系和XML數(shù)據(jù)的認(rèn)證和版權(quán)保護(hù)的相關(guān)問題,我們提出了新的解決方案。我們特別以那些之前沒有得到充分解決的問題為目標(biāo)來展
11、開本文的研究。
本文的各種方案均利用數(shù)字水印技術(shù)來解決這些問題。本文的研究成果表明無失真和查詢保存的水印方法可分別用于關(guān)系數(shù)據(jù)和XML數(shù)據(jù)的版權(quán)保護(hù)和完整性驗(yàn)證。下面我們將簡要地討論本文研究的主要貢獻(xiàn)。
本文的主要貢獻(xiàn):
2.查詢保存的數(shù)字水印用于關(guān)系數(shù)據(jù)的版權(quán)保護(hù)
大量用于設(shè)計(jì)多媒體水印的技術(shù)被證明是有效的,但不能直接應(yīng)用到數(shù)據(jù)庫中設(shè)計(jì)水印算法。對于多媒體,由于擁有大量的冗余比特
12、位,從而存在很多可用于嵌入額外信息的空間。只要修改操作是隱蔽的,這些比特位可以被任意修改來嵌入信息。而對于多媒體,最重要的要求是需要避免視覺失真而對于關(guān)系數(shù)據(jù)最基本的要求是需要保存數(shù)據(jù)的語義值。有時甚至是一個單比特位的變化也將改變數(shù)據(jù)的意義從而影響查詢結(jié)果。如,改變姓名,地址,年齡,戶口號碼等數(shù)據(jù)的一個單比特也將改變數(shù)據(jù)的具體值從而改變查詢結(jié)果。
在關(guān)系數(shù)據(jù)中嵌入水印與多媒體中水印的嵌入具有很大不同。在關(guān)系數(shù)據(jù)庫中,為通過
13、保持查詢結(jié)果不變來維護(hù)數(shù)據(jù)的可用性,數(shù)據(jù)的語義值比視覺的隱蔽性更重要。存在以下的基本差異阻礙了多媒體數(shù)字水印方案直接應(yīng)用于關(guān)系數(shù)據(jù)或XML文檔中。
1)多媒體數(shù)據(jù)具有相當(dāng)大的冗余空間,而數(shù)據(jù)庫具有很少甚至沒有冗余。
2)對于多媒體數(shù)據(jù),視覺隱蔽性是非常重要的,而數(shù)據(jù)庫中數(shù)據(jù)的語義值最重要。
3)各類數(shù)據(jù)片段在相對空間/時間的定位是固定的,而在一個關(guān)系的元組中沒有暗含的順序。刪除或替換一個多媒體對
14、象的部分?jǐn)?shù)據(jù)將引起對象的感知變化。然而,一個關(guān)系的盜版可以簡單地刪除或利用其他關(guān)系元組來替代一些元組。
另一個仍然需要注意的重要挑戰(zhàn)是,要是沒有數(shù)值數(shù)據(jù)或不存在不足夠空間用于水印嵌入該如何辦。此外,上述討論的包括針對分類數(shù)據(jù)的方案通過關(guān)系關(guān)系數(shù)據(jù)庫中屬性值意義的改變,且這些屬性值往往是不可取時來嵌入水印時將引起關(guān)系數(shù)據(jù)庫內(nèi)容的失真。
所有這些因素導(dǎo)致水印方案不僅需要保留數(shù)據(jù)的語義值,而且還需保持水印嵌入前后查
15、詢結(jié)果的一致性。在本文中,我們提出了一種基于非數(shù)值數(shù)據(jù)的水印方案,在嵌入過程中通過引入對數(shù)據(jù)語義值幾乎是零失真的操作保持查詢結(jié)果。
為了保持水印嵌入后關(guān)系數(shù)據(jù)的查詢結(jié)果,在水印嵌入過程中有必要保持完好無損的數(shù)據(jù)的語義值。目前大部分的相關(guān)工作集中使用數(shù)值數(shù)據(jù)為載體。但有一些基于非數(shù)值數(shù)據(jù)的水印方案,但存在一定的局限性。
我們提出了一種魯棒的查詢保持的關(guān)系數(shù)據(jù)水印方案,該方案不依賴于關(guān)系中數(shù)值屬性的存在。通過在非
16、數(shù)值數(shù)據(jù)或更精確的字母數(shù)字?jǐn)?shù)據(jù)屬性中嵌入水印,我們引入一種新的嵌入信道。由于在數(shù)據(jù)庫中,查詢是不區(qū)分大小寫的,所以將數(shù)據(jù)從小寫改為大寫不會影響數(shù)據(jù)的語義,反之亦然。利用這類數(shù)據(jù)屬性的內(nèi)在特性,我們提出了一種水印方案,不僅在嵌入水印后保持了數(shù)據(jù)的語義并且具有無失真、查詢保持的特性。對于存在非數(shù)值屬性或?qū)λ∏度胍鸬母淖儫o法適應(yīng)的數(shù)據(jù)庫,我們的方案提供更好的關(guān)系數(shù)據(jù)庫水印。此外,在水印提取時無需原始數(shù)據(jù),因此該方案是一個完全的盲水印方法。
17、
水印嵌入:給定具有主鍵P的關(guān)系R(P,A1,A2……Av-1),第一步是使用主鍵哈希值分別確定被標(biāo)記的元組和屬性。兩者的選擇取決于對數(shù)據(jù)擁有者已知的密鑰K,只有擁有者能夠識別出標(biāo)記的元組和屬性。攻擊者只能通過猜測可能的元組以及遠(yuǎn)足中的屬性來破壞水印。然后通過檢查所選數(shù)據(jù)文本的大小寫狀態(tài)提取已有比特序列Eb。提取比特位0或1遵循的規(guī)則見本文的第3章。然后,生成長度為L的候選水印序列Cj,Cj中的每個比特位對應(yīng)于已有比特模式
18、Eb。用來產(chǎn)生這些候選水印信息的密鑰可通過以密鑰K和水印索引j為種子G來獲得。最后,選定與Eb的漢明距離最小的最小的比特序列來嵌入水印W,并記錄此時的密鑰為Kw用于隨后的水印提取。為嵌入水印比特,選定屬性值的大小寫狀態(tài)是根據(jù)表3.3中所列的條件來進(jìn)行調(diào)整的。大小寫狀態(tài)的改變時遵循大多數(shù)常見的操作如:如果水印比特為1,則狀態(tài)調(diào)整為標(biāo)題狀態(tài),當(dāng)嵌入0時,調(diào)整為句子狀態(tài)。有時候數(shù)據(jù)庫包含空值的情況,此時將不能應(yīng)用大小寫狀態(tài)的改變。此外,當(dāng)出現(xiàn)
19、縮寫等類型文本時,只有一種標(biāo)準(zhǔn)而不會有改變將存在。
水印提取:設(shè)Alice為數(shù)據(jù)庫的擁有者,Mallory擁有Alice數(shù)據(jù)的一份復(fù)制盜版。由于主鍵的丟失將造成重要數(shù)據(jù)的遺失,因此假設(shè)主鍵是完整。對于水印的提取,首先選擇可能被用于嵌入水印的元組,然后識別出標(biāo)記的屬性,這兩種選擇均使用與嵌入過程相同的密鑰K,最后利用預(yù)定義的條件提取水印比特信息。
當(dāng)屬性值由單個單詞組成時,如果其為標(biāo)題狀態(tài),則提取水印比特值1,
20、否則提取0。對于有多個單詞的屬性,如果整個文本具有標(biāo)題狀態(tài)則水印比特值為1,如果為句子狀態(tài)則為0。對于水印的驗(yàn)證,采用相同的密鑰生成原始水印與提取的水印相比來判斷。對于正確的驗(yàn)證,我們保持等于70%的最低比特匹配要求。
3.關(guān)系數(shù)據(jù)的完整性驗(yàn)證
近年來利用互聯(lián)網(wǎng)服務(wù)器提供的在線數(shù)據(jù)顯著增加。由于高的硬件和管理成本,數(shù)據(jù)的擁有者寧愿外包他們的數(shù)據(jù),這種數(shù)據(jù)存儲和管理需要第三方服務(wù)器。這些服務(wù)器的使用相對地使多種
21、多樣擁有者數(shù)據(jù)的成本非常低。這種方法解決了成本問題,但也引起了數(shù)據(jù)庫完整性的問題。這些第三方服務(wù)器可能會損害客戶端的數(shù)據(jù),是不可信任的。因此,需要建立一種機(jī)制來驗(yàn)證托管在不可信服務(wù)器上數(shù)據(jù)的完整性。
目前,已有少量脆弱水印方案用于關(guān)系數(shù)據(jù)的篡改檢測和完整性驗(yàn)證。據(jù)我們所知,Gou等人的工作是這個領(lǐng)域最優(yōu)的,因此本文重點(diǎn)關(guān)注他們的工作并進(jìn)行對比。
經(jīng)過徹底全面的研究,我們發(fā)現(xiàn)已有脆弱水印方案中存在一定的問題。所
22、有這些方案中最重要的缺陷是他們的完全脆弱性,即甚至一個單比特信息的修改都將被檢測為篡改。如果有人想更新自己的已嵌入水印的關(guān)系數(shù)據(jù),也將被視為篡改。每次數(shù)據(jù)更新后都需要重新嵌入水印。在實(shí)際應(yīng)用中,關(guān)系數(shù)據(jù)不僅需要定期更新且需要驗(yàn)證完整性。此外Guo的方法還有另外的兩個缺陷:
首先,該方法只適用于數(shù)值數(shù)據(jù)。盡管Guo等人提出了一個替代的在分類數(shù)據(jù)中嵌入水印的方法,這個方法利用元組順序的調(diào)整來嵌入水印,但也容易遭遇排序攻擊而破壞
23、水印。
其次,使用了兩個最低有效位來嵌入水印將向適應(yīng)力不強(qiáng)的數(shù)據(jù)中引入較大的失真。數(shù)據(jù)庫中數(shù)據(jù)的語義值比多媒體數(shù)據(jù)的語義值更重要,有時單比特值的變化可能會導(dǎo)致數(shù)據(jù)的不可用。例如姓名、電話、帳戶號碼、年齡、價格等數(shù)據(jù)。
考慮到所有上述這些問題,我們提出了一種半脆弱水印方案,該方案具有如下的貢獻(xiàn):
1)該方案使數(shù)據(jù)擁有者能通過檢測數(shù)據(jù)庫遭受的惡意修改來驗(yàn)證數(shù)據(jù)庫的完整性,且允許擁有者一些必要的數(shù)據(jù)更
24、新操作。
2)利用選定文本的大小寫狀態(tài)來嵌入水印,不會改變數(shù)據(jù)的意義,因此可以說我們的水印方案是無失真且查詢結(jié)果保持的。
3)該方案可擴(kuò)展應(yīng)用到非數(shù)值數(shù)據(jù),特別是字母數(shù)字?jǐn)?shù)據(jù)中。
當(dāng)前,大多數(shù)互聯(lián)網(wǎng)上的數(shù)據(jù)均托管在不可完全信任的第三方外包服務(wù)器上。這些服務(wù)器上的數(shù)據(jù)很容易被篡改,因此需要建立某些機(jī)制來驗(yàn)證數(shù)據(jù)庫的完整性。此外,在認(rèn)證過程中應(yīng)能區(qū)分正常的數(shù)據(jù)更新和惡意修改操作。在我們的關(guān)系數(shù)據(jù)完整
25、性驗(yàn)證中,我們提出了一種新穎的針對關(guān)系數(shù)據(jù)庫的半脆弱水印方法,該方法不僅可以檢測篡改且允許授權(quán)用戶修改自己的數(shù)據(jù),從而使需要頻繁更新數(shù)據(jù)時不需要同步重嵌入水印。我們的完整性驗(yàn)證方案的核心思想是構(gòu)造一個半脆弱水印,在這種方式下允許數(shù)據(jù)庫進(jìn)行一些常規(guī)的更新操作,而同時可以檢測到惡意的篡改操作。水印是使用任何特定組中所有元組的元組哈希值計(jì)算得到的。而這個元組哈希值則通過使用哈希后的消息認(rèn)證碼(HMAC)來計(jì)算獲得。HMAC是基于單向哈希函數(shù)的
26、,其輸入為密鑰K以及選定元組的所有屬性值。HMAC最重要的一個特性是輸入的任何微小變化都將使輸出隨機(jī)化。我們通過定義屬性選擇以及用于元組哈希計(jì)算的特定標(biāo)準(zhǔn)來得到一個半脆弱水印。
為了達(dá)到這個目的,我們首先定義三類屬性,即敏感屬性(S)、非敏感屬性(NS)和半敏感屬性(SS)。敏感屬性指一旦錄入將不需要更新的屬性。在完整性驗(yàn)證過程中對這些屬性的任何修改都必須能夠檢測到,比如姓名、出生日期,SSN等個人資料,以及產(chǎn)品ID,生產(chǎn)
27、日期等一些產(chǎn)品信息。非敏感屬性指可能需要頻繁更新的屬性,如庫存清單系統(tǒng),現(xiàn)貨條目等。半敏感屬性指允許進(jìn)行受限更新的屬性。這些半敏感屬性的值可以在一定范圍內(nèi)進(jìn)行修改,如個人地址更改時通常不改變國籍而允許修改具體的地址。
設(shè)關(guān)系R{Pk,A1,A2…An)的主鍵為Pk,以及其他屬性為Ai(i=1…n),定義R的三類屬性子集S(包含Pk),NS和SS滿足:
S∩ NS∩ SS=φ
S∪NS∪SS=R<
28、br> 下一步為半敏感屬性定義一些約束條件。對屬性分類并定義好約束條件后,使用元組哈希的計(jì)算可獲得一個半脆弱水印。元組哈希計(jì)算采用的是基于HMAC的SHA算法,并以密鑰K、敏感屬性集合S,和廣義的半敏感屬性集SS(利用約束條件得到的)為種子。在元組哈希的計(jì)算中不包括非敏感屬性。因此,元組哈希采用如下公式計(jì)算:
TH=HMAC(K∣∣S∣∣SS(Generalized)
水印嵌入:水印嵌入主要分為三個步驟
29、,即預(yù)處理,水印生成和水印嵌入。在預(yù)處理中,首先定義屬性的子集,然后將所有元組分成g組,采用與一些早期方案相同的分組算法使每個分組中包含幾乎等數(shù)量的元組。在水印生成步驟中,為每個分組分別生成一個水印。為了保持?jǐn)?shù)據(jù)的同步性,各分組內(nèi)的元組都將進(jìn)行安全的排序,然后采用HMAC計(jì)算元組的哈希值。通過這些元組哈希值計(jì)算分組的哈希值從而獲得候選的水印。水印的大小/長度取決于選定用于水印嵌入的屬性數(shù)量。值得注意的事情是SHA1算法返回了160比特的
30、HMAC輸出值。如果所需的水印比特數(shù)小于160比特,那么算法將提取所需數(shù)量的MSB(最重要的有效位),否則從HMAC(從MSB開始)提取比特位循環(huán)追加到水印生成序列中,直到水印長度達(dá)到需要的長度。在水印嵌入步驟中,利用選定屬性的大小寫狀態(tài)來嵌入水印。此嵌入方式不會改變數(shù)據(jù)庫的內(nèi)容從而使嵌入過程無失真。
在計(jì)算元組哈希值之前,文本狀態(tài)會統(tǒng)一轉(zhuǎn)換成全部大寫或者小寫狀態(tài)。在水印提取過程中,以同樣的方式歸一化文本狀態(tài)來計(jì)算元組哈希
31、值。從而保證不是任何的大小寫狀態(tài)的改變都將被檢測為篡改操作。水印嵌入是無失真的從而可以幫助維持?jǐn)?shù)據(jù)的語義含義。此外,基于分組的嵌入確保了篡改的定位。
數(shù)據(jù)庫篡改檢測:含水印的數(shù)據(jù)可能會受到修改數(shù)據(jù)庫內(nèi)容的有意攻擊。為了驗(yàn)證含水印數(shù)據(jù)庫的完整性,首先需要對其進(jìn)行認(rèn)證。為此,我們必須知道密鑰K和分組數(shù)g。對于篡改檢測,每個分組都將單獨(dú)進(jìn)行認(rèn)證。使用參數(shù)K,g,構(gòu)建用來嵌入的水印W,然后提取數(shù)據(jù)庫中實(shí)際的水印W',最后比較構(gòu)造的
32、水印W(原始嵌入的水印)和提取的水印W'。如果這兩個水印都能互相匹配,能說明數(shù)據(jù)未被篡改。
4.XML文檔完整性和私隱性問題的解決方案
XML是一種信息/數(shù)據(jù)交換的工業(yè)標(biāo)準(zhǔn)。XML是一種允許用戶生成和格式化自己文檔標(biāo)記的源語言,提供了一種能夠把結(jié)構(gòu)化數(shù)據(jù)存儲在文本文件中的方法。這類文件易于閱讀,清晰可擴(kuò)展,且與閱讀平臺無關(guān)。到目前為止,它已經(jīng)被廣泛的用于在因特網(wǎng)上進(jìn)行數(shù)據(jù)交換。與其他通過因特網(wǎng)進(jìn)行的數(shù)據(jù)交換一
33、樣,通過XML文檔進(jìn)行數(shù)據(jù)交換容易受到版權(quán)侵犯和內(nèi)容篡改等。作為一種常用的數(shù)據(jù)交換方式,XML文件需要一些技術(shù),使數(shù)據(jù)擁有者能夠?qū)挂恍﹪L試篡改數(shù)據(jù)或者侵犯版權(quán)的惡意攻擊。
XML文檔的問題1:我們都知道魯棒水印是指能抵抗各類攻擊且不能輕易被惡意使用者摧毀的一類水印。這類水印常用于身份認(rèn)證和版權(quán)保護(hù)。
在XML數(shù)據(jù)的身份認(rèn)證方面,魯棒水印方法是很少的,且大多數(shù)都是從關(guān)系數(shù)據(jù)或純文本文檔中延伸出來的水印方案。由
34、于XML數(shù)據(jù)的性質(zhì)和格式跟純文本文件或關(guān)系數(shù)據(jù)存在很大的不同,因此這些水印方案直接應(yīng)用于XML數(shù)據(jù)中時不是十分有效的。此外,這些方案還受到一些限制,我們將會在第二章進(jìn)行討論。因此,設(shè)計(jì)一種好的用于XML文檔的魯棒水印方法是非常有必要的。
XML,文檔的問題2:在互聯(lián)網(wǎng)上多數(shù)使用XML文檔形式進(jìn)行數(shù)據(jù)交換,由于沒有足夠的安全保障,這些信息交互是不可信的。類似地,由于這些數(shù)據(jù)能對多用戶數(shù)據(jù)進(jìn)行有效的成本控制,因此使用第三方服務(wù)
35、器來托管數(shù)據(jù)以提供公共訪問服務(wù)的方式在過去幾年中增長很快。但是,這些服務(wù)器可能會受到一些對XML數(shù)據(jù)惡意操作的危害破壞XML數(shù)據(jù)的完整性。不幸的是,盡管檢測XML文檔的篡改操作是很重要的,但是這些問題卻一直未完善解決。W3C給出了一種基于簽名的方法來解決XML,完整性認(rèn)證的問題,但是這種方法卻不是一種有效的方法。這種簽名添加在原始XML文檔中,不僅增加了文檔的大小,而且不能抵抗任何去除攻擊。在這種情況下,脆弱水印能有效地保證XML數(shù)據(jù)的
36、完整性認(rèn)證。當(dāng)前有不少這類水印方法,但是性能都不夠好。此外,一個常見的問題是這些在XML數(shù)據(jù)中嵌入脆弱水印的方法將使XML數(shù)據(jù)產(chǎn)生非常多的錯誤。XML文檔中的數(shù)據(jù)通常不具有足夠的健壯性來適應(yīng)水印的嵌入而不會影響數(shù)據(jù)的可用性。特別地,這些方法只適用于數(shù)值型數(shù)據(jù),這將限制它們的使用領(lǐng)域。
已有的所有方案要么是針對XML文檔版權(quán)保護(hù)(使用魯棒水印),要么是針對完整性驗(yàn)證(使用脆弱水印)。就我們所知,還沒有一種單獨(dú)的方案能同時解決
37、XML文檔版權(quán)保護(hù)和完整性驗(yàn)證這兩個問題。因此,在我們的研究中,提出了一種聯(lián)合水印方法,能夠同時解決上述兩個問題。此外,水印嵌入是無失真的,能保證數(shù)據(jù)的可用性。
魯棒水印嵌入:魯棒水印是以密鑰K為種子采用基于HMAC的SHA算法生成的。隨后將十六進(jìn)制的水印串轉(zhuǎn)換成二進(jìn)制字符串,根據(jù)該水印串選擇水印嵌入位置。對于每個元素計(jì)算一個唯一的哈希值,因此根據(jù)哈希值對所有的元素進(jìn)行排序。用參數(shù)γ來限定標(biāo)記元素所占比例。對于多于N個元素
38、時,將選擇N/γ個元素用于標(biāo)記。用γ和元素哈希值,選擇用于嵌入水印的元素,然后改變選定元素的文本的大小寫狀態(tài)來嵌入水印。設(shè)計(jì)的文本大小寫狀態(tài)的改變規(guī)則與常規(guī)的實(shí)際操作類似。
脆弱水印嵌入:脆弱水印能夠檢測到篡改并定位篡改位置,因此水印被嵌入到分組的元素中。通過元素哈希值,所有的元素被安全地分成g組。分組后,每組中元素按照哈希值進(jìn)行排序,為每個分組分別計(jì)算出一個脆弱水印。為此,首先,根據(jù)組內(nèi)所有元素的哈希值計(jì)算該分組的組哈希
39、值,然后從該組哈希中提取出水印比特串。由于SHA的特性,組哈希值為我們提供了一個脆弱水印。對XML文檔任意部件的小小改動都將導(dǎo)致元素哈希值的修改,從而導(dǎo)致組哈希值以及水印的改變。
XML文檔的身份認(rèn)證:為了阻止盜版,對含水印的XML文檔進(jìn)行身份認(rèn)證,我們提取出事先嵌入的魯棒水印,并與計(jì)算得出的原始水印進(jìn)行對比。原始水印的計(jì)算過程其初始步驟與水印嵌入步驟類似,并采用相同的密鑰和參數(shù)計(jì)算出所有元素的哈希值,然后定位標(biāo)記的元素,
40、計(jì)算出計(jì)劃被嵌入的原始水印。通過密鑰K和擁有者的信息計(jì)算出待認(rèn)證文檔中實(shí)際存在的水印,然后將原始水印與提取的實(shí)際水印進(jìn)行比較。只有當(dāng)比特串的匹配數(shù)量超過70%才認(rèn)為是成功的身份認(rèn)證。
XML文檔的篡改檢測:利用我們的算法生成的含水印文檔,通過脆弱水印認(rèn)證過程可以檢測到篡改并進(jìn)行定位。對于一個待檢測的文檔,首先提取嵌入的水印W'F,然后將W'F與原始水印WF進(jìn)行對比。由于對文檔的任何篡改都將會使引起W'F隨機(jī)化,因此比較提取
41、的實(shí)際水印和原始水印之間的差異就能判斷該文檔是否被篡改過。由于每個分組是單獨(dú)驗(yàn)證的,所以我們能在分組級別上定位出篡改的位置。跟嵌入過程類似,這里首先需要采用同一個密鑰K計(jì)算出元素的哈希值,然后將這些元素按其哈希值大小分成不同的組。為了保持提取的實(shí)際水印和原始嵌入水印的同步性,分組中元素根據(jù)其哈希值進(jìn)行排序的。然后以相同的方式為每個分組計(jì)算一個組哈希值。組哈希值被用于計(jì)算原始水印WF。
XML文檔的聯(lián)合水印的特點(diǎn)
42、 雙重用途水?。罕疚奶岢龅慕鉀Q方法不僅能為XML文檔的擁有者提供版權(quán)認(rèn)證,同時能檢測篡改。魯棒水印提供版權(quán)/所有者的認(rèn)證的能力,而脆弱水印提供了完整性驗(yàn)證的能力。通過在魯棒水印后面嵌入脆弱水印,進(jìn)一步保障了擁有者身份認(rèn)證的水印的魯棒性要求。
提高的魯棒水印保護(hù)能力:由于魯棒水印在脆弱水印之前嵌入,因此脆弱水印也提供了一種驗(yàn)證魯棒水印的身份驗(yàn)證功能。如果一些惡意攻擊者嘗試摧毀或改變魯棒水印,那么就會被脆弱水印驗(yàn)證/檢測算法
43、檢測并定位出來。其他一些嘗試以此插入假冒水印的手段也會被檢測出來。
盲水印檢測:脆弱和魯棒水印的提取均不需要原始XML文檔,因此我們的方法是盲水印方法。在驗(yàn)證過程中也只需要少量伴隨水印文檔傳輸?shù)拿孛軈?shù)。
無失真的嵌入:水印的嵌入其最重要的要求嵌入操作是隱蔽的且不會使真實(shí)數(shù)據(jù)產(chǎn)生大的失真。除了隱蔽性,另一個重要的要求就是原始數(shù)據(jù)的可用性,在水印嵌入后原始數(shù)據(jù)必須仍然是可用的。我們的水印嵌入算法是無失真的,它能
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- Watermarking Techniques for Relational Databases Authentication and Rights Protection.pdf
- New approaches for robust digital watermarking using statistical model.pdf
- intellectual property rights protection and the surge in fdi in china
- research on the copyright protection of the digital libraries
- Digital Image Watermarking Based on Dwt-DCT.pdf
- online banking authentication using mobile phones
- Study on the Protection of Digital Copyright-the International Framework.pdf
- Design and Implementation of a DCT-Based Robust Digital Image Watermarking Scheme.pdf
- 2016版-imaging sunlight using a digital spectroheliograph
- DOES STRONGER INTELLECTUAL RPOPERTY RIGHTS (IPRs) PROTECTION AFFECT INTERNATIONAL TECHNOLOGY TRANSFR-.pdf
- blackboard-based digital hardware design using fpgas
- AN EFFICIENT DATA DISSEMINATION PROTOCOL FOR CONTENT-BASED COMMUNICATION IN DISCONNECTED MANETs.pdf
- using data guard broker and enterprise manager-
- application of digital image magnification for surface roughness evaluation using machine vision
- using openstreetmap data with python 使用python的openstrutemap數(shù)據(jù)
- Distance Protection analysis for Long Transmission Line and Arc effects on Distance relay using PSCAD.pdf
- 王家奇 翻譯原文 Content based image retrieval methods using supporting restrieval map algorithm .PDF
- Laboratory Exercices for Analog and Digital Circuits Using NI ELVIS II & NI Multisim.pdf
- Laboratory Exercices for Analog and Digital Circuits Using NI ELVIS II & NI Multisim.pdf
- 2018版-r programming fundamentals deal with data using various modeling techniques
評論
0/150
提交評論