基于進(jìn)化算法的本體匹配問(wèn)題研究.pdf_第1頁(yè)
已閱讀1頁(yè),還剩120頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、本體是最新的一種信息交換參考模型,它是迄今為止用于獲取最準(zhǔn)確的語(yǔ)義規(guī)范化描述的技術(shù)。然而,由于本體設(shè)計(jì)者的主觀性,對(duì)于同一個(gè)領(lǐng)域中的同一對(duì)象可能會(huì)有不同的描述方式(同一個(gè)概念在不同本體中可能會(huì)有不同的名字),這就直接導(dǎo)致了術(shù)語(yǔ)和概念描述不一致的異質(zhì)本體的產(chǎn)生(即語(yǔ)義異質(zhì)問(wèn)題)。為了克服這一問(wèn)題,在實(shí)現(xiàn)語(yǔ)義層面交互的同時(shí)充分利用本體靈活的表達(dá)能力,目前普遍認(rèn)可的可行方法是執(zhí)行本體匹配過(guò)程。本體匹配過(guò)程通過(guò)確定本體中語(yǔ)義相關(guān)的實(shí)體間的對(duì)應(yīng)關(guān)

2、系來(lái)實(shí)現(xiàn)本體間的相互通信。由于本體匹配問(wèn)題通常可以建立成一個(gè)復(fù)雜的(非線性且有許多局部最優(yōu)解)和耗時(shí)的(尤其當(dāng)本體的規(guī)模龐大時(shí))優(yōu)化模型,因此通常會(huì)采用近似的方法來(lái)確定本體匹配元素以求解本體匹配問(wèn)題。從這個(gè)角度來(lái)看,進(jìn)化算法是一種求解本體匹配問(wèn)題的有效算法。然而,已有的基于進(jìn)化算法的本體匹配系統(tǒng)都存在以下五個(gè)缺陷:
  (1)經(jīng)典進(jìn)化算法的收斂速度慢和早熟收斂問(wèn)題使得這些系統(tǒng)無(wú)法有效地確定大規(guī)模的和復(fù)雜問(wèn)題的最優(yōu)解;
  (

3、2)在求解的過(guò)程中需要專(zhuān)家事先提供標(biāo)準(zhǔn)的本體匹配結(jié)果,而這種標(biāo)準(zhǔn)的本體匹配結(jié)果在實(shí)際的應(yīng)用場(chǎng)景中是很難獲得的;
  (3)無(wú)法一次同時(shí)匹配多對(duì)本體,即同時(shí)為不同的待匹配本體對(duì)確定一個(gè)統(tǒng)一的參數(shù)配置;
  (4)由經(jīng)典的質(zhì)量度量指標(biāo)f-measure引起的質(zhì)量度量偏好導(dǎo)致本體匹配結(jié)果的質(zhì)量不高;
  (5)無(wú)法一次提供多組不同的本體匹配結(jié)果以滿足決策者不同的要求。針對(duì)上述的缺陷,本文的研究工作主要圍繞本體匹配領(lǐng)域中的單目

4、標(biāo)和多目標(biāo)優(yōu)化問(wèn)題展開(kāi),全文的內(nèi)容可概括為以下幾個(gè)方面:
  (1)建立了基于部分參考匹配結(jié)果的本體元匹配單目標(biāo)優(yōu)化模型,提出了基于部分參考匹配結(jié)果的度量方法并進(jìn)一步提出一種本體概念聚類(lèi)算法以構(gòu)建部分參考匹配結(jié)果,并在此基礎(chǔ)上提出了一種基于部分參考匹配結(jié)果的混合Memetic算法的本體匹配方法,給出了用混合Memetic算法求解基于部分參考匹配結(jié)果的本體元匹配單目標(biāo)優(yōu)化模型的詳細(xì)步驟:預(yù)處理程序、混合Memetic算法個(gè)體編碼方案

5、、遺傳算子和局部搜索算法。實(shí)驗(yàn)采用本體匹配領(lǐng)域公認(rèn)的測(cè)試數(shù)據(jù)集,即本體匹配評(píng)價(jià)競(jìng)賽(Ontology Alignment Evaluation Initiative,OAEI)的Benchmark測(cè)試數(shù)據(jù)集,提出了混合Memetic算法的本體匹配方法的參數(shù)選擇原則并給出了具體的參數(shù)配置。實(shí)驗(yàn)結(jié)果表明,基于本體概念聚類(lèi)方法構(gòu)建的部分參考匹配結(jié)果的混合Memetic算法能比基于隨機(jī)方法構(gòu)建的部分參考匹配結(jié)果的混合Memetic算法找到更好的

6、解,這些解的質(zhì)量不僅十分接近基于參考匹配結(jié)果的方法而且解的查準(zhǔn)率都很高。Wilcoxons測(cè)試結(jié)果表明本章提出的方法在性能上比起經(jīng)典的基于進(jìn)化算法的本體匹配系統(tǒng)GOAL的平均的改進(jìn)程度為47.33%?;诓糠謪⒖计ヅ涞幕旌螹emetic算法也能夠克服經(jīng)典遺傳算法的早熟收斂問(wèn)題,從而獲取比基于經(jīng)典的進(jìn)化算法的本體匹配系統(tǒng)以及其他前沿的本體匹配系統(tǒng)質(zhì)量更高的解。
  (2)建立了基于無(wú)參考匹配結(jié)果的本體元匹配單目標(biāo)優(yōu)化模型,提出了基于

7、無(wú)參考匹配結(jié)果的度量方法,并進(jìn)一步提出采用一致性度量比率(Unanimous Improvement Ratio,UIR)結(jié)合基于無(wú)參考匹配結(jié)果的度量方法來(lái)共同度量本體匹配結(jié)果的質(zhì)量,以克服質(zhì)量度量的偏好問(wèn)題并實(shí)現(xiàn)同時(shí)匹配多對(duì)本體(即為多對(duì)本體提供一致的最優(yōu)參數(shù)匹配方案),并在此基礎(chǔ)上提出了一種基于無(wú)參考匹配結(jié)果和UIR的混合Memetic算法的本體匹配方法。實(shí)驗(yàn)數(shù)據(jù)采用OAEI2012的Benchmark測(cè)試數(shù)據(jù)集,實(shí)驗(yàn)的結(jié)果表明基于

8、無(wú)參考匹配結(jié)果的度量方法和一致性改進(jìn)比率度量的混合Memetic算法不需要專(zhuān)家事先提供標(biāo)準(zhǔn)的本體匹配結(jié)果、能夠同時(shí)匹配多對(duì)本體、在克服質(zhì)量度量偏好問(wèn)題的同時(shí)能夠獲取比前沿的本體匹配系統(tǒng)質(zhì)量更高的解。
  (3)建立了以查全率和查準(zhǔn)率為目標(biāo)的本體元匹配多目標(biāo)優(yōu)化模型,給出了通過(guò)進(jìn)化算法求解本體匹配多目標(biāo)問(wèn)題的動(dòng)機(jī)和多目標(biāo)進(jìn)化算法的Pareto前沿中代表性解的選擇方法,分別采用NSGA-II和MOEA/D求解本體元匹配多目標(biāo)優(yōu)化模型。

9、提出了一種自適應(yīng)的相似度集成策略以提高NSGA-II的求解效率,給出了MOEA/D優(yōu)化目標(biāo)的分解方法和算法的實(shí)現(xiàn)細(xì)節(jié)。實(shí)驗(yàn)數(shù)據(jù)采用OAEI2012的Benchmark測(cè)試數(shù)據(jù)集,T-test靜態(tài)分析結(jié)果表明基于自適應(yīng)的相似度集成策略的NSGA-II的本體匹配方法和基于MOEA/D的本體匹配方法都可以找到比基于傳統(tǒng)進(jìn)化算法的本體匹配系統(tǒng)和其他前沿的本體匹配系統(tǒng)相同的或是更好的解。此外,通過(guò)Wilcoxons測(cè)試的結(jié)果表明基于MOEA/D的

10、本體匹配方法在性能上優(yōu)于基于NSGA-II的本體匹配方法。
  (4)建立了以查全率和查準(zhǔn)率為目標(biāo)的本體匹配多目標(biāo)優(yōu)化模型,提出了新的實(shí)例相似度度量技術(shù)和相似度擴(kuò)散算法,設(shè)計(jì)了新的個(gè)體編碼方案,并在此基礎(chǔ)上提出了一種基于實(shí)例的NSGA-II本體匹配方法。實(shí)驗(yàn)數(shù)據(jù)采用OAEI2012的Benchmark、Anatomy和Library測(cè)試數(shù)據(jù)集,實(shí)驗(yàn)結(jié)果表明基于實(shí)例的NSGA-II本體匹配方法獲取的本體匹配結(jié)果的質(zhì)量在前沿的本體匹配

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論