版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、隨著互聯(lián)網(wǎng)2.0的興起,利用集體智慧的協(xié)作式編輯系統(tǒng)被廣泛地用于知識(shí)管理中。維基系統(tǒng)就是這樣一個(gè)例子,其中維基百科就是流行的一種維基系統(tǒng)。維基百科是目前最大的免費(fèi)在線百科全書,它是由廣大的志愿者來共同編輯的。維基百科具備以下作為一個(gè)潛在的語義數(shù)據(jù)源的特征:廣泛的知識(shí)覆蓋面、明確定義的結(jié)構(gòu)化信息和隨著世界知識(shí)變遷而變遷動(dòng)態(tài)更新的特點(diǎn)。語義維基是對(duì)維基的一種擴(kuò)展,利用語義萬維網(wǎng)的技術(shù)對(duì)維基元素增加顯示的語義。 然而,盡管這種自由的、
2、協(xié)作式的編輯方式促成了維基百科的成功,但是這同時(shí)也帶來了一些問題。尤其地,它會(huì)導(dǎo)致大量的標(biāo)注缺失和噪音標(biāo)注的問題,這會(huì)影響到文章的內(nèi)容質(zhì)量和妨礙術(shù)語的收斂。當(dāng)前,低質(zhì)量的標(biāo)注不得不由一小批專家去修改,這也成為了一種效率的瓶頸。 同時(shí),這些專家也是做了大部分編輯工作的最活躍的貢獻(xiàn)者,對(duì)他們而言,這無非是一個(gè)巨大的負(fù)擔(dān)。語義維基百科也面臨同樣的問題:缺少標(biāo)注的語義和語義標(biāo)注者。特別地,對(duì)一個(gè)普通用戶來說,要編輯一個(gè)高質(zhì)量的維基百科文
3、章,必須處理好當(dāng)前編輯的文章與系統(tǒng)現(xiàn)有的文檔集的關(guān)系。這就要求用戶對(duì)系統(tǒng)文檔集以及其包含的知識(shí)有一定的了解,在編輯語義維基時(shí)還要理解其潛在的語義技術(shù)。他們要面臨以下一些問題: 1) 什么時(shí)候有必要提供一個(gè)超鏈接指向一個(gè)被引用的實(shí)體?如何正確定位到它? 2) 可以用哪些類別標(biāo)簽來恰當(dāng)?shù)貥?biāo)識(shí)這篇文章? 3) 可以用什么信息盒模板來描述文章主題對(duì)象的屬性? 4) 在編輯語義維基百科的時(shí)候,實(shí)體之間是否有潛在的語
4、義關(guān)系? 如果存在,則應(yīng)該用什么謂詞來標(biāo)注關(guān)系的類型? 在本課題中,試圖通過知識(shí)抽取與知識(shí)重用來幫助用戶回答以上這些問題。知識(shí)抽取是知識(shí)重用的前提和依據(jù),而知識(shí)重用是知識(shí)抽?取的目的。受到協(xié)同過濾的思想的啟發(fā):根據(jù)相似用戶的評(píng)價(jià)行為來產(chǎn)生對(duì)當(dāng)前用戶的推薦。類似地,通過標(biāo)注推薦的方式來實(shí)現(xiàn)知識(shí)重用。為了達(dá)到這個(gè)目的,首先要從當(dāng)前維基百科中的標(biāo)注的數(shù)據(jù)集中抽取有用的知識(shí)作為作推薦的依據(jù)或背景知識(shí),這些知識(shí)是結(jié)構(gòu)化或半結(jié)構(gòu)化的
5、實(shí)體語義特征,包括:實(shí)體的術(shù)語詞典、實(shí)體的類型、實(shí)體之間的關(guān)系特征等。還將提出一個(gè)統(tǒng)一的標(biāo)注推薦算法框架來重用所抽取的知識(shí),并將這個(gè)知識(shí)重用方案應(yīng)用到當(dāng)前的維基百科的編輯中去。將展示原形系統(tǒng)EachWiki,它對(duì)維基百科提供了以下的推薦服務(wù):鏈接推薦、類別推薦、信息盒推薦、以及關(guān)系推薦,通過這種方式,使得用戶在編輯維基百科時(shí)可以充分利用集體的智慧。這些推薦服務(wù)不但可以便利用戶編輯高質(zhì)量的維基百科知識(shí),還可以幫助構(gòu)筑語義維基百科。最后,通
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于維基百科的人物關(guān)系抽取研究.pdf
- 自動(dòng)抽取維基百科文本中的語義關(guān)系.pdf
- 基于中文維基百科的知識(shí)庫構(gòu)建.pdf
- 基于維基百科的語義比較.pdf
- 基于中文維基百科的文本擴(kuò)充.pdf
- 基于維基百科的漁業(yè)知識(shí)庫構(gòu)建研究.pdf
- 基于中文維基百科的語義知識(shí)挖掘相關(guān)研究.pdf
- 基于維基百科的搜索結(jié)果挖掘.pdf
- 中文網(wǎng)絡(luò)百科全書的知識(shí)傳播研究——以維基百科與互動(dòng)百科為例.pdf
- 水楊酸維基百科
- 維基百科不自由
- 維基百科知識(shí)的層次化體系構(gòu)建.pdf
- 維基百科上的語義搜索.pdf
- 基于中文維基百科的全文語義標(biāo)注系統(tǒng).pdf
- 基于維基百科的語義相關(guān)度計(jì)算研究.pdf
- 中文維基百科類別推薦的研究.pdf
- 關(guān)于維基百科內(nèi)容質(zhì)量的研究.pdf
- 中文維基百科的結(jié)構(gòu)化信息抽取及詞語相關(guān)度計(jì)算.pdf
- 基于維基百科的評(píng)論主題詞聚類.pdf
- 基于維基百科的垂直搜索查詢擴(kuò)展問題研究.pdf
評(píng)論
0/150
提交評(píng)論