版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、日益加劇的競(jìng)爭(zhēng)迫使企業(yè)必須構(gòu)建能夠迅速、準(zhǔn)確地分析和挖掘行業(yè)信息的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng),目前的磁盤(pán)存儲(chǔ)器卻無(wú)法滿(mǎn)足企業(yè)日益增長(zhǎng)的海量信息管理需要,由主存、磁盤(pán)和聯(lián)機(jī)使用的第三級(jí)存儲(chǔ)器構(gòu)成的三級(jí)存儲(chǔ)器系統(tǒng)為海量數(shù)據(jù)的管理提供了一種廉價(jià)可行的解決方案。然而三級(jí)存儲(chǔ)器與磁盤(pán)系統(tǒng)的物理特性差異很大,為磁盤(pán)存儲(chǔ)器設(shè)計(jì)的存儲(chǔ)結(jié)構(gòu)和操作算法無(wú)法直接移植到三級(jí)存儲(chǔ)器中,需要針對(duì)三級(jí)存儲(chǔ)器的特點(diǎn)設(shè)計(jì)優(yōu)化的存儲(chǔ)結(jié)構(gòu)與高效的關(guān)系操作算法。本文結(jié)合三級(jí)存儲(chǔ)器的物理特征
2、與聯(lián)機(jī)分析處理應(yīng)用的特點(diǎn),設(shè)計(jì)出了適合管理三級(jí)存儲(chǔ)器上海量數(shù)據(jù)的讀優(yōu)化的存儲(chǔ)結(jié)構(gòu)、關(guān)系操作算法和查詢(xún)優(yōu)化方法。主要研究成果如下:
在三級(jí)存儲(chǔ)器上的數(shù)據(jù)組織方面,提出了三級(jí)存儲(chǔ)器各存儲(chǔ)層次間的數(shù)據(jù)分布方法、第三級(jí)存儲(chǔ)器上針對(duì)讀操作優(yōu)化的數(shù)據(jù)組織結(jié)構(gòu)和將數(shù)據(jù)遷移到第三級(jí)存儲(chǔ)器時(shí)的數(shù)據(jù)預(yù)處理方法。由于三級(jí)存儲(chǔ)器各個(gè)存儲(chǔ)層次的物理特性存在差異,并且不同數(shù)據(jù)的訪問(wèn)頻率不同,合理地在三級(jí)存儲(chǔ)器上分布數(shù)據(jù)會(huì)顯著提高三級(jí)存儲(chǔ)器的訪問(wèn)性能。第三
3、級(jí)存儲(chǔ)器中的數(shù)據(jù)主要面向分析型應(yīng)用,針對(duì)分析型應(yīng)用的特點(diǎn)提出了數(shù)據(jù)緊縮、聚簇、按列方式的數(shù)據(jù)存儲(chǔ)、引入多個(gè)關(guān)系副本等一系列方法,每種方法針對(duì)不同類(lèi)型的查詢(xún)。通過(guò)選擇合適的數(shù)據(jù)組織方法,可以顯著提高從第三級(jí)存儲(chǔ)器訪問(wèn)數(shù)據(jù)的效率。數(shù)據(jù)從磁盤(pán)遷移到第三級(jí)存儲(chǔ)器之前,通過(guò)預(yù)排序、代理信息抽取、聚集的預(yù)計(jì)算等一系列方法,顯著地提高查詢(xún)執(zhí)行效率。通過(guò)在磁盤(pán)中保存必要的代理信息,使一部分查詢(xún)可以在磁盤(pán)上直接得到回答。
在基于三級(jí)存儲(chǔ)器的關(guān)系
4、操作算法方面,重點(diǎn)研究了三級(jí)存儲(chǔ)器上的非阻塞連接算法和基于屬性分離的連接算法。設(shè)計(jì)與實(shí)現(xiàn)了兩種盡早產(chǎn)生連接結(jié)果的非阻塞式連接算法CDT-PH和CDT-Merge。傳統(tǒng)的連接操作是阻塞式操作,需要對(duì)磁盤(pán)中的數(shù)據(jù)進(jìn)行預(yù)處理,然后才能產(chǎn)生第一個(gè)連接結(jié)果。阻塞式連接不適用于數(shù)據(jù)可視化等應(yīng)用。非阻塞式連接算法不僅在連接開(kāi)始的時(shí)候就能產(chǎn)生結(jié)果,而且整體性能與目前最高效 CDT-GH性能很相近, CDT-Merge算法的性能甚至高于CDT-GH算法。
5、設(shè)計(jì)與實(shí)現(xiàn)了基于屬性分離的磁帶-磁帶連接算法ASJ。針對(duì)通常磁帶上連接操作具有的數(shù)據(jù)多遍掃描問(wèn)題和冗余 I/O問(wèn)題,ASJ算法利用屬性分離技術(shù)、連接索引技術(shù)有效地避免了以上問(wèn)題。ASJ算法比目前最好的磁帶-磁帶連接算法CTT-GH性能提高很多。該算法最大的優(yōu)點(diǎn)是能夠?qū)⒋艓?磁帶連接算法轉(zhuǎn)變?yōu)榇疟P(pán)上的連接算法與磁帶數(shù)據(jù)的一遍掃描操作。
在基于三級(jí)存儲(chǔ)器的查詢(xún)優(yōu)化方面,提出了適用于三級(jí)存儲(chǔ)器的代價(jià)模型和能夠處理多關(guān)系副本的查詢(xún)優(yōu)化
6、算法。傳統(tǒng)的關(guān)系代價(jià)模型都是針對(duì)磁盤(pán)上的關(guān)系操作,不能夠直接用于估算第三級(jí)存儲(chǔ)器上的操作代價(jià)。提出的代價(jià)模型不僅能夠估算第三級(jí)存儲(chǔ)器上關(guān)系操作的代價(jià),而且能夠比較磁盤(pán)上關(guān)系操作與第三級(jí)存儲(chǔ)器上相同關(guān)系操作的代價(jià)。提出的查詢(xún)優(yōu)化方法不僅能夠?yàn)椴樵?xún)中的關(guān)系操作選擇優(yōu)化的執(zhí)行算法,而且能夠?yàn)閰⑴c查詢(xún)的關(guān)系選擇最優(yōu)數(shù)據(jù)組織方式的關(guān)系副本,從而顯著地提高查詢(xún)效率。
最后基于上述研究成果,設(shè)計(jì)與實(shí)現(xiàn)了一個(gè)數(shù)據(jù)庫(kù)原型系統(tǒng) TERMS。TER
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于Hypertable數(shù)據(jù)庫(kù)XML存儲(chǔ)和查詢(xún)技術(shù)研究.pdf
- 基于第三級(jí)存儲(chǔ)器的海量數(shù)據(jù)管理技術(shù)研究.pdf
- Native XML數(shù)據(jù)庫(kù)技術(shù)研究存儲(chǔ)、索引及查詢(xún)處理.pdf
- 能耗有效的數(shù)據(jù)庫(kù)查詢(xún)處理技術(shù)研究.pdf
- 移動(dòng)對(duì)象數(shù)據(jù)庫(kù)查詢(xún)及處理技術(shù)研究.pdf
- 圖數(shù)據(jù)庫(kù)查詢(xún)處理技術(shù)的研究.pdf
- 時(shí)空數(shù)據(jù)庫(kù)查詢(xún)處理關(guān)鍵技術(shù)研究.pdf
- 基于三級(jí)存儲(chǔ)系統(tǒng)的海量數(shù)據(jù)查詢(xún)處理方法的研究.pdf
- 基于WEB的數(shù)據(jù)庫(kù)查詢(xún)處理研究.pdf
- WEB數(shù)據(jù)庫(kù)模糊查詢(xún)技術(shù)研究.pdf
- 基于關(guān)系數(shù)據(jù)庫(kù)的Ontology存儲(chǔ)技術(shù)研究.pdf
- 基于XML數(shù)據(jù)庫(kù)的數(shù)據(jù)查詢(xún)優(yōu)化技術(shù)研究.pdf
- 基于關(guān)系型數(shù)據(jù)庫(kù)的XML存儲(chǔ)與查詢(xún)研究.pdf
- 網(wǎng)格數(shù)據(jù)庫(kù)自適應(yīng)查詢(xún)處理技術(shù)研究與實(shí)現(xiàn).pdf
- 基于模糊理論的關(guān)系數(shù)據(jù)庫(kù)查詢(xún)技術(shù)研究.pdf
- 面向數(shù)據(jù)庫(kù)的語(yǔ)義查詢(xún)技術(shù)研究.pdf
- 基于純XML數(shù)據(jù)庫(kù)Natix系統(tǒng)存儲(chǔ)技術(shù)研究.pdf
- 精確子圖數(shù)據(jù)庫(kù)查詢(xún)技術(shù)研究.pdf
- 圖數(shù)據(jù)庫(kù)中子圖查詢(xún)技術(shù)研究.pdf
- 內(nèi)存數(shù)據(jù)庫(kù)并行化查詢(xún)技術(shù)研究.pdf
評(píng)論
0/150
提交評(píng)論