異構(gòu)域XML自動(dòng)轉(zhuǎn)換技術(shù)的研究.pdf_第1頁
已閱讀1頁,還剩79頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、隨著計(jì)算機(jī)和網(wǎng)絡(luò)技術(shù)的發(fā)展,XML因其具有自描述性、可擴(kuò)展性等特點(diǎn),逐漸成為各領(lǐng)域描述數(shù)據(jù)的標(biāo)準(zhǔn)。然而由于應(yīng)用領(lǐng)域的不斷擴(kuò)展,產(chǎn)生了大量異構(gòu)的XML數(shù)據(jù)。為了屏蔽各數(shù)據(jù)源在結(jié)構(gòu)、運(yùn)行環(huán)境上的差異,以XML作為標(biāo)準(zhǔn)數(shù)據(jù)描述的中間語言,將各種異構(gòu)源數(shù)據(jù)轉(zhuǎn)換成統(tǒng)一的XML標(biāo)準(zhǔn)描述形式,可以方便的實(shí)現(xiàn)數(shù)據(jù)的共享。傳統(tǒng)的XML轉(zhuǎn)換基本都是通過全手工編寫轉(zhuǎn)換程序,需要相當(dāng)?shù)木幊碳寄埽绕洚?dāng)數(shù)據(jù)量很大且文檔信息經(jīng)常改變時(shí),手工操作非常耗時(shí)且容易出現(xiàn)錯(cuò)

2、誤。因此,研究XML自動(dòng)轉(zhuǎn)換技術(shù)具有十分重要的意義。本文對(duì)當(dāng)前主要的XML轉(zhuǎn)換技術(shù)進(jìn)行了比較和分析,提出了一種基于模式匹配的XML自動(dòng)轉(zhuǎn)換技術(shù)。本文的工作主要包括以下幾個(gè)方面:
  (1)分析了異構(gòu)域XML轉(zhuǎn)換方法的研究狀況,對(duì)模式匹配技術(shù)作了詳細(xì)的闡述,并提出了基于模式匹配實(shí)現(xiàn)XML轉(zhuǎn)換的總體設(shè)計(jì)思路。
  (2)研究了XML Schema建模方法,將可視化技術(shù)引入到XML Schema的建模過程中,通過可視化界面使得用戶

3、更容易理解XML Schema的結(jié)構(gòu)。在數(shù)據(jù)處理過程中,采用有向標(biāo)記圖來表示XML Schema文檔,給出了相關(guān)規(guī)范和定義。
  (3)提出XML Schema匹配算法,在模式匹配過程中,首先通過名稱規(guī)范化處理,結(jié)合語義相似度和編輯距離計(jì)算元素名稱相似度;其次根據(jù)元素和屬性的數(shù)據(jù)類型及上下文關(guān)系計(jì)算結(jié)構(gòu)相似度;最后通過用戶驗(yàn)證、調(diào)整,得到兩個(gè)模式之間準(zhǔn)確的匹配關(guān)系。該算法充分考慮了語法和語義信息、結(jié)構(gòu)信息,大大提高了匹配質(zhì)量。實(shí)驗(yàn)

4、表明,該算法具有較高的查準(zhǔn)率和查全率。
  (4)提出了一組XML Schema轉(zhuǎn)換函數(shù),解決模式之間語義和結(jié)構(gòu)等沖突。定義了映射關(guān)系描述規(guī)則,將模式元素之間的匹配關(guān)系和轉(zhuǎn)換函數(shù)以XML描述形式保存到映射文件中,它封裝了從一個(gè)模式實(shí)例到另一個(gè)模式實(shí)例轉(zhuǎn)換所有必需的信息和轉(zhuǎn)換操作。
  (5)通過XSLT引擎將映射文件轉(zhuǎn)換成XSLT腳本,執(zhí)行XML文檔的轉(zhuǎn)換。
  異構(gòu)域XML自動(dòng)轉(zhuǎn)換技術(shù)的研究是一個(gè)新的研究領(lǐng)域,本文對(duì)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論