2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩111頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、文本文檔作為一種普遍使用的信息存儲與傳輸媒體,利用它們進行隱秘通信、利用數字水印保護文本文檔版權并對文檔內容進行認證等是信息安全領域的熱門研究課題。由于文本文檔缺乏圖像、音頻和視頻等媒體所具有的人類視覺或聽覺冗余特性,以及當前自然語言處理研究領域對文本內容的理解、變換和生成缺乏堅實的理論基礎與實用的自動化技術等原因,文本載體信息隱藏的研究工作極具挑戰(zhàn)性。
   本文闡述了信息隱藏的概念、模型、應用及國內外研究動態(tài)??紤]到自然語言

2、語句是詞的序列,處于序列中的詞具有特定的詞性,比如名詞、動詞等,因此語句可以變換為詞性標記串(簡稱標記串)。將詞性標記作為文本的一個變換域來研究,提出了若干基于變換域的文本信息隱藏新算法。自然語言的詞性通常是有限的,如果在詞性標記集上定義適當的偏序關系,則標記串就具有序的特性,通過計算逆序數的奇偶性,可以將標記串映射為0或1。研究發(fā)現,隨機選取標記串序列,其對應的二進制序列具有較好的自相關性和互相關性。提出了利用序列逆序數奇偶性隱藏信息

3、的算法,并證明了逆序數奇偶性在標記串符號對換、增加和刪除變換下的性質。根據隱藏信息的要求,先對標記串做適當變換,再在變換后的標記串指導下修改自然語言句子,從理論上保證了可行修改的存在性,避免直接在自然語言句子層面上做修改的盲目性。該算法能抵抗同義詞替換攻擊。
   自然語言的句型具有穩(wěn)定性,而標記串本質上就是句型,于是一篇文檔對應的標記串具有統計特性。提出了一種基于信息熵的信息隱藏方案,該方案通過改變標記串的概率分布使其熵與隱藏

4、的信息一致。由于水印函數是一類實值函數,其值域僅受計算精度限制,可以大幅度提高水印容量。算法能抵抗同義詞替換、句子移位等攻擊,避免了信息提取過程中的同步問題。安全性分析給出了敵手擦出水印的計算復雜度。另外,給定一個離散且有限隨機變量的熵,求其對應的概率分布則需要解多元非線性方程,提出了一個將n元熵方程化為至多(n-1)個一元非線性方程求解的算法,證明了算法的正確性,給出了誤差估計。
   Wayner等提出的載體文本生成技術在自

5、然語言層次上構造文法,文法的語言是自然語言的一個子集,要保證載體文本語義的一致性而不至于引起第三方懷疑,對文法有很高要求,難于實現自動化。提出了基于Huffman樹和詞性標記文法的兩種標記串編碼信息隱藏方法。以標記串集合為變換域,將秘密信息與載體文本都映射到該域,再運用字符串匹配技術計算秘密信息句子在載體文本中的位置,位置即為密鑰。接收方與發(fā)送方有相同的標記串集合與映射函數,根據密鑰從載體文本中提取標記串,通過解碼標記串讀出秘密信息。給

6、出了信息隱藏容量公式。由于本算法將秘密信息隱藏在文本句型而不是語句本身,從而可任意選取載體文本而徹底避免了語義一致性問題。詞性標記文法易于構造,語法分析可用YACC實現,容易實現自動化。
   行移編碼信息隱藏技術使用質心檢測方法提取信息,在文本行長度較短的情況下檢測誤差較大。Low等指出質心檢測方法對短文本行失效的原因在于短行質量小會導致質心噪聲方差大,但未給出改進方法。對經典的質心檢測方法作了改進,通過模擬擴展初始文本行,綜

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論