版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、XML(Extensible Markup Language)即可擴展的標(biāo)記語言,是一套定義語義標(biāo)記的規(guī)范,其目的在于定義計算機和人都能方便識別的數(shù)據(jù)類型。隨著網(wǎng)絡(luò)應(yīng)用的快速發(fā)展,XML已經(jīng)被廣泛應(yīng)用到Internet智能信息檢索、數(shù)字圖書館、數(shù)據(jù)集成、Web Service等領(lǐng)域,這使得XML類型的數(shù)據(jù)已成為主流的數(shù)據(jù)形式,從XML數(shù)據(jù)中提取有用的信息也就成為了當(dāng)前的研究熱點。 目前,XML查詢根據(jù)查詢請求描述特點的不同,可概
2、括為兩大類查詢模式:XML結(jié)構(gòu)化查詢和XML關(guān)鍵字查詢。XML結(jié)構(gòu)化查詢要求用戶必須掌握XML文檔結(jié)構(gòu)及查詢語言,這對用戶來說有著較大的難度,不易使用。而XML關(guān)鍵字查詢則相對比較靈活,它只需要用戶提供簡單的關(guān)鍵字信息,而無需懂得任何查詢語言或文檔結(jié)構(gòu)就可方便使用,因此該模式被廣泛采用,有著重要的研究價值。 XML關(guān)鍵字查詢的基本問題是求解滿足關(guān)鍵字組合語義的最緊致片段,求解最緊致片段算法的性能及對最緊致片段的定義決定了XML
3、關(guān)鍵字查詢的性能和準(zhǔn)確率。 目前,對最緊致片段的最好定義是SLCA,對SLCA求解算法的研究也較為成熟。因此,本文圍繞SLCA展開,分析SLCA求解算法性能上的缺點并提出新的改進算法,之后通過實驗進行驗證。實驗過程中發(fā)現(xiàn),盡管算法性能有較大提高,但結(jié)果集中存在較多并非期望的節(jié)點,因此,本文又對SLCA的概念進行擴展,提出同源SLCA(Heterogeneous SLCA,HSLCA)的概念,HSLCA在SLCA的基礎(chǔ)上引入標(biāo)簽信
4、息,能夠顯著提高XML關(guān)鍵字查詢的準(zhǔn)確率。 在改進SLCA求解算法性能方面,本文在分析已有經(jīng)典算法基礎(chǔ)上展開,做出了以下創(chuàng)新: 一、提出基于并查集的SLCA求解算法USSSA。針對求解SLCA性能最優(yōu)的LISAⅡ算法空間復(fù)雜度較大,占用存儲空間較多的缺點,USSSA算法使用層次編碼進行求解,算法的空間復(fù)雜度明顯降低,在理論求解時間與LISAⅡ基本相同的情況下,使用了更少的存儲空間。 二、提出基于疊加樹思想的SLC
5、A求解算法IREE_Set。針對LISAⅡ算法在查詢關(guān)鍵字較少時性能較差的缺點,TREE_Set以樹的方式求解SLCA,當(dāng)查 詢關(guān)鍵字較少時,TREE_Set比LISAⅡ具有更好的性能。同時,這種算法具有很強的直觀意義,便于理解,易于實現(xiàn)。 在提高XML關(guān)鍵字查詢準(zhǔn)確率方面,本文在分析SLCA概念本身不足的基礎(chǔ)上展開,所做工作和改進有: 一、對SLCA的概念進行改進,提出新的最緊致片段定義同源SLCA(HSLCA
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- XML上基于SLCA的關(guān)鍵字查詢研究.pdf
- 基于SLCA的XML關(guān)鍵字查詢技術(shù)研究.pdf
- 基于SLCA語義的不確定XML關(guān)鍵字查詢技術(shù)研究.pdf
- 基于關(guān)鍵字的XML查詢.pdf
- 基于XML的關(guān)鍵字查詢算法研究.pdf
- 基于查詢語義的XML關(guān)鍵字查詢算法的研究.pdf
- 基于查詢語義的xml關(guān)鍵字查詢算法的研究(1)
- 基于LCA并行的XML關(guān)鍵字查詢.pdf
- 基于Hadoop的XML關(guān)鍵字查詢算法研究.pdf
- 基于ELCA語義的XML關(guān)鍵字查詢算法研究.pdf
- XML關(guān)鍵字查詢中包含關(guān)鍵字的最小片段問題的研究.pdf
- 綜合文檔語義與用戶查詢語義的XML關(guān)鍵字查詢研究.pdf
- 面向XML文檔的關(guān)鍵字查詢的研究.pdf
- 基于語義的XML關(guān)鍵字近似查詢方法的研究.pdf
- 基于上下文的XML LCA關(guān)鍵字查詢技術(shù).pdf
- 基于語義相關(guān)性的XML關(guān)鍵字查詢的研究與實現(xiàn).pdf
- kFilter-基于關(guān)鍵字查詢的XML流過濾系統(tǒng).pdf
- 基于語義的XML關(guān)鍵字查詢結(jié)果多樣化.pdf
- XML數(shù)據(jù)流上關(guān)鍵字查詢的研究與實現(xiàn).pdf
- XML關(guān)鍵字查詢中最緊致片段問題的研究.pdf
評論
0/150
提交評論