2023年全國(guó)碩士研究生考試考研英語(yǔ)一試題真題(含答案詳解+作文范文)_第1頁(yè)
已閱讀1頁(yè),還剩110頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、當(dāng)前的網(wǎng)絡(luò)環(huán)境正在向語(yǔ)義Web的美好愿景不斷擴(kuò)展和演進(jìn)。然而,數(shù)據(jù)源的不斷增長(zhǎng),信息流動(dòng)的加快,數(shù)據(jù)在傳遞過(guò)程中的頻繁復(fù)制、演化,給信息的可靠性、真實(shí)性和可信度帶來(lái)了巨大的挑戰(zhàn)。被W3C稱(chēng)之為語(yǔ)義Web最佳實(shí)踐的關(guān)聯(lián)數(shù)據(jù)發(fā)布越來(lái)越呈現(xiàn)如下特點(diǎn):數(shù)量增長(zhǎng)快,質(zhì)量參差不齊,分布式發(fā)布使連接的復(fù)用越來(lái)越普遍,動(dòng)態(tài)更新進(jìn)一步導(dǎo)致數(shù)據(jù)的不一致。其根本原因在于起源信息的缺失。因此,在語(yǔ)義Web環(huán)境下,如何應(yīng)用統(tǒng)一的數(shù)據(jù)溯源模型定位和查詢(xún)起源信息,如

2、何在相似網(wǎng)頁(yè)中辨別真?zhèn)危约叭绾卧陉P(guān)聯(lián)數(shù)據(jù)發(fā)布中增加溯源元數(shù)據(jù),成為亟待解決的問(wèn)題。
  論文從目前語(yǔ)義Web研究中存在的瓶頸入手,以語(yǔ)義Web、數(shù)據(jù)溯源、關(guān)聯(lián)數(shù)據(jù)為理論基礎(chǔ),以語(yǔ)義Web應(yīng)用為研究目標(biāo),綜合運(yùn)用文獻(xiàn)研究、調(diào)查研究、系統(tǒng)分析、比較研究、歸納推理和軟件工程等研究方法,在以下幾個(gè)方面進(jìn)行了創(chuàng)新性探索:
  (1)開(kāi)展了語(yǔ)義Web環(huán)境下數(shù)據(jù)溯源模型的比較研究。討論了DCMI術(shù)語(yǔ)、OPM-O、PV、VoIDP、Pro

3、v-O等目前國(guó)外主要的數(shù)據(jù)溯源描述語(yǔ)言,從來(lái)源和目的、資源描述角度、主要服務(wù)對(duì)象和解決的問(wèn)題、標(biāo)注方式、詞表結(jié)構(gòu)等方面分別對(duì)這些數(shù)據(jù)溯源描述語(yǔ)言進(jìn)行了比較分析。
  (2)構(gòu)建了PROV模型的應(yīng)用情境。在分析W3C數(shù)據(jù)溯源推薦標(biāo)準(zhǔn)PROV的基礎(chǔ)上,闡釋該模型的主要功能,深入解析該標(biāo)準(zhǔn)的核心要素,構(gòu)建了PROV模型的Web應(yīng)用情境并進(jìn)行描述;總結(jié)出該模型的Web應(yīng)用特征:可解析性、語(yǔ)義性和可追溯性。這些工作對(duì)于推進(jìn)國(guó)內(nèi)同行在該標(biāo)準(zhǔn)的

4、框架下,進(jìn)行分布式環(huán)境下信息追溯和起源記錄互操作的進(jìn)一步研究具有一定參考價(jià)值。
  (3)驗(yàn)證了PROV本體描述的起源記錄在未來(lái)Web應(yīng)用中的語(yǔ)義表達(dá)和查詢(xún)服務(wù)問(wèn)題。在深入解析Web應(yīng)用中起源記錄的定位、傳遞模式、實(shí)現(xiàn)途徑和實(shí)現(xiàn)模式的基礎(chǔ)上歸納總結(jié)出Web應(yīng)用中起源元數(shù)據(jù)的四類(lèi)定位發(fā)現(xiàn)機(jī)制與兩類(lèi)查詢(xún)機(jī)制。結(jié)合語(yǔ)義標(biāo)注Web頁(yè)面和溯源信息表達(dá)技術(shù),采用在線(xiàn)論文追溯案例,實(shí)現(xiàn)了包含RDFa語(yǔ)義標(biāo)注起源記錄的HTML頁(yè)面顯示,并通過(guò)可視

5、化方式揭示起源,最后對(duì)案例中的起源記錄查詢(xún)服務(wù)問(wèn)題進(jìn)行了探討。
  (4)提出了一種借助PROV本體自動(dòng)化發(fā)現(xiàn)相似網(wǎng)頁(yè)起源關(guān)系的實(shí)現(xiàn)方法。針對(duì)目前大多數(shù)已有的網(wǎng)頁(yè)內(nèi)容缺乏起源標(biāo)注的問(wèn)題,通過(guò)文檔的變化過(guò)程分析,將文檔定義為實(shí)體,并由多個(gè)語(yǔ)義屬性進(jìn)行特征描述,采用基于語(yǔ)義相似性的聚類(lèi)方法發(fā)現(xiàn)文檔間的變化關(guān)系,借助PROV本體發(fā)現(xiàn)文檔的特征變化和責(zé)任人。通過(guò)屬性識(shí)別抽取命名實(shí)體,建立文檔屬性的關(guān)系,鏈接到LOD云,借助通用語(yǔ)義本體發(fā)現(xiàn)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論