版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、1.前言隨著20世紀90年代中醫(yī)藥文獻數(shù)字化研究的開展,中醫(yī)古籍文獻數(shù)字化工作已經(jīng)走過了幾個階段。從2000年國家中醫(yī)藥管理局設(shè)立的重點研究專項“中醫(yī)藥古代文獻資源數(shù)字化關(guān)鍵問題研究”的起步階段,到2001年國家科技部基礎(chǔ)工作重大項目“中醫(yī)藥科技信息數(shù)據(jù)庫建設(shè)”項目,再至2003年國家科技部醫(yī)學科學數(shù)據(jù)共享服務(wù)系統(tǒng)“中醫(yī)藥學科學數(shù)據(jù)共享服務(wù)中心”建設(shè)項目,中醫(yī)古籍文獻數(shù)字化已成功研制出“中醫(yī)本草文獻數(shù)據(jù)庫”、“中醫(yī)方劑文獻數(shù)據(jù)庫”,在全
2、國三十余家中醫(yī)院校和和研究機構(gòu)的參與下,成功構(gòu)建了我國第一個中醫(yī)古籍文獻知識庫,目前已收錄了本草、方劑類古籍260余種,6000余萬漢字,并于2003年實現(xiàn)了網(wǎng)絡(luò)運行。 在數(shù)字化工作的研究中,導師柳長華教授提出的基于“知識元”的中醫(yī)古籍計算機知識表示方法在知識庫建設(shè)中取得了進展,基本形成了一套較成熟的建庫技術(shù)。 以這種技術(shù)建立的數(shù)據(jù)庫使知識的查詢更加精確,避免了大量冗余信息的出現(xiàn),使用戶最大限度地擺脫了信息爆炸的困擾。但
3、隨之而來的另一個問題又出現(xiàn)在查詢者面前,這就是所謂的“信息孤島”現(xiàn)象。 古籍數(shù)字化的功能不僅在于一般的信息查詢,更重要的是古籍文獻中的知識發(fā)現(xiàn)。普通的數(shù)據(jù)庫難以達到知識挖掘的深層次要求,古籍數(shù)字化的目標是建設(shè)知識庫。 2.知識庫系統(tǒng)的原理從知識的使用角度來看,知識庫是由知識和知識處理機構(gòu)組成,知識庫形成一個知識域,該知識域中除了事實、規(guī)則和概念之外還包含各種推理、歸納、演繹等知識處理方法。 知識庫系統(tǒng)的核心組成部
4、分是知識庫和推理機構(gòu)。知識庫對知識進行存儲和管理,推理機構(gòu)是推理機使用知識庫內(nèi)的知識執(zhí)行推理的機構(gòu)。如果一個系統(tǒng)具有能用計算機所存貯的知識對輸入的數(shù)據(jù)進行解釋和推理,并有對其進行驗證的功能,則該系統(tǒng)稱為知識庫系統(tǒng)。 知識庫系統(tǒng)的實現(xiàn)涉及到兩個關(guān)鍵問題:知識表示和知識推理。知識庫的處理過程分為二個層面:先將知識由底層數(shù)據(jù)經(jīng)過一系列加工,如分類、歸納、綜合等處理過程而得到上層信息,稱為知識表示。這種信息再經(jīng)過解釋、比較、推理得到我們
5、所獲取的知識,即知識推理的過程。 為了實現(xiàn)知識推理,一種基于本體的知識表示方法成為各個領(lǐng)域構(gòu)建知識庫推理系統(tǒng)的首選。 3.本體的概念、作用與分類本體(Ontology)起源于哲學領(lǐng)域,古希臘哲學家亞里士多德(Aristotle)定義Ontology為“對世界客觀存在物的系統(tǒng)的描述,即存在論”。Ontology是客觀存在的一個系統(tǒng)的解釋或說明,它關(guān)心的是客觀現(xiàn)實的抽象本質(zhì)。Ontology這個哲學范疇,被人工智能界賦予了新
6、的定義,從而被引入信息科學中。 目前普遍接受的本體定義為:共享概念模型的形式化規(guī)范說明。從內(nèi)涵上來看,本體是領(lǐng)域(可以是特定領(lǐng)域的,也可以是更廣的范圍)內(nèi)部不同主體(人、機器、軟件系統(tǒng)等)之間進行交流(對話、互操作、共享等)的一種語義基礎(chǔ),即由本體提供一種明確定義。Ontology自身所要實現(xiàn)的目標,即:“在人類和應(yīng)用系統(tǒng)之間實現(xiàn)共享和相互理解”。 Ontology能夠?qū)㈩I(lǐng)域中的各種概念及概念之間的關(guān)系顯示地、形式化地表
7、達出來,從而將術(shù)語的語義表達出來,因而在語義查詢方面發(fā)揮著重要作用。自W3C主席TimBermem-Lee在1998年首先提出了語義web的概念之后,Ontology正在成為人工智能和信息處理領(lǐng)域的研究熱點之一。 本體強調(diào)相關(guān)領(lǐng)域的本質(zhì)概念,同時強調(diào)這些概念之間的關(guān)聯(lián)。本體論可以有效地表達知識和知識之間的關(guān)系,基于本體論的知識庫系統(tǒng)可以建立有效的知識表達體系,揭示知識之間的內(nèi)在關(guān)系。 本體技術(shù)主要在以下幾個方面提高知識庫
8、系統(tǒng)的性能:可重用性、知識獲取、查找智能性、可靠性、規(guī)范定義、任務(wù)解析、可維護性。 本體通??煞譃橐韵聨最悾侯I(lǐng)域本體、通用本體、應(yīng)用本體、表示本體。本文關(guān)注的是本體類型中的領(lǐng)域本體,主要討論如何運用Ontology技術(shù)構(gòu)建中醫(yī)古籍領(lǐng)域本體。 4.本研究的意義、方法與創(chuàng)新點本文通過對本體的國內(nèi)外研究與發(fā)展現(xiàn)狀的考察,根據(jù)中醫(yī)古籍數(shù)據(jù)庫的實際情況,在知識推理層面提出了建設(shè)面向中醫(yī)古籍數(shù)據(jù)庫應(yīng)用的中醫(yī)古籍文獻領(lǐng)域本體的設(shè)想。參
9、考國內(nèi)外領(lǐng)域本體的建設(shè)方法,論述了利用敘詞表建設(shè)領(lǐng)域本體的優(yōu)勢,提出了基于敘詞表的適合中醫(yī)古籍數(shù)據(jù)庫應(yīng)用的中醫(yī)古籍文獻領(lǐng)域本體建設(shè)方法。最后通過一個實例闡述了中醫(yī)古籍文獻領(lǐng)域本體的具體建設(shè)方法,為中醫(yī)古籍數(shù)據(jù)庫的進一步建設(shè)提供了理論與實踐的雙重參考。 研究意義:中醫(yī)古籍知識庫建設(shè)的要求;中醫(yī)古籍知識深入整理研究的要求;便于網(wǎng)絡(luò)中醫(yī)古籍文獻資源的統(tǒng)一管理。 研究方法:文獻調(diào)研法、概念分析法、本體構(gòu)建法。創(chuàng)新點:在中醫(yī)古籍文
10、獻數(shù)字化領(lǐng)域提出建立本體系統(tǒng)的設(shè)想;分析了適合中醫(yī)古籍文獻數(shù)據(jù)庫的本體表示語言和編輯工具;提出中醫(yī)古籍文獻領(lǐng)域本體的建設(shè)目標;設(shè)計了中醫(yī)古籍文獻領(lǐng)域本體的建設(shè)方法;建立了一個以“病證”概念為核心的中醫(yī)古籍文獻領(lǐng)域本體模型。 5.本體的國內(nèi)外研究現(xiàn)狀國外主要研究現(xiàn)狀:①理論深化研究;②信息系統(tǒng)中的應(yīng)用;③本體作為一種能在知識層提供知識共享和復用的工具在語義網(wǎng)中的應(yīng)用。 國外較為知名的本體知識系統(tǒng):WordNet、Frame
11、Net、GUM、SENSUS、OntoSeek、Cyc、HowNet和SUMO等。國內(nèi)主要研究現(xiàn)狀:我國本體的研究尚處于起步階段,一個是對W3C發(fā)布的關(guān)于本體的外文資料的翻譯,一個是主要為面向應(yīng)用的研究,無論是理論還是實際應(yīng)用都相對落后于國外。 面向中醫(yī)藥領(lǐng)域的研究主要有:浙江大學網(wǎng)格計算實驗室開發(fā)的基于語義的中醫(yī)藥信息本體虛擬組織模型——DartGrid服務(wù)棧;北京中醫(yī)藥大學和中國科學院計算機研究所開發(fā)的基于本體的中醫(yī)專家臨床
12、病案知識庫。 6.領(lǐng)域本體的構(gòu)建20世紀50年代敘詞表得到了很大發(fā)展,成為主題檢索的主要語言,各國擁有的敘詞表數(shù)以千計,并涵蓋了各個領(lǐng)域。從一定意義上講,敘詞表可以說是一種輕量級本體(Light-weightOntology)?;跀⒃~表構(gòu)建領(lǐng)域本體有諸多的的優(yōu)越性,目前人工智能界普遍推薦利用敘詞表構(gòu)建領(lǐng)域本體。 中醫(yī)古籍文獻敘詞表與本體的關(guān)系:中醫(yī)古籍文獻敘詞表表示的是中醫(yī)古籍文獻中包含的概念,概念來自于古籍內(nèi)容與古籍
13、本身,是對中醫(yī)古籍文獻的客觀反映。 敘詞表表示的是樹狀結(jié)構(gòu),這種樹狀結(jié)構(gòu)反映了古籍文獻內(nèi)部的自然構(gòu)成方式。敘詞表的結(jié)構(gòu)是可見的、清晰的,可稱為顯性結(jié)構(gòu)。領(lǐng)域本體繼承了敘詞表的樹狀結(jié)構(gòu)特征。本體更重在表示一種概念之間的隱含關(guān)系,這種關(guān)系是模糊的,不明顯的,可以稱為隱性結(jié)構(gòu)。相對來說,本體的反映更微細,更深入,為文獻中的知識關(guān)聯(lián)提供了可實現(xiàn)的途徑。敘詞表或本體是對體現(xiàn)古籍內(nèi)涵的概念的集合。 領(lǐng)域本體的建模元語:(概念)類、屬
14、性、函數(shù)、公理、實例。 建模語言:選用OWL語言。本語言的優(yōu)勢在于:基底層語法符合XML標準格式;為W3C推薦的標準本體編輯語言,便于與數(shù)據(jù)庫之間的數(shù)據(jù)交換;支持多種語言輸入,并支持中文;網(wǎng)絡(luò)中有免費教學手冊,便于下載學習。 編輯工具:選用Protégé-2000。其優(yōu)勢在于:界面友好,具有圖形化的用戶界面;版本更新速度快,目前已發(fā)布了3.1.1版;支持多種語言格式,支持中文編輯;本體文檔可以不倚賴于本體編輯器進行代碼修
15、改,方便與數(shù)據(jù)庫的連接;網(wǎng)絡(luò)開放資源;是W3C推薦的本體編輯器;是基于XML的本體標記語言,多種存儲格式,可以適應(yīng)不同需要。 構(gòu)建方法:選用斯坦弗大學醫(yī)學院開發(fā)的七步法。7.中醫(yī)古籍文獻領(lǐng)域本體模型(病證模型)的構(gòu)建元數(shù)據(jù)(Metadata)就是數(shù)據(jù)之數(shù)據(jù),或描述原始數(shù)據(jù)的獨立數(shù)據(jù)。元數(shù)據(jù)是針對網(wǎng)絡(luò)信息標引發(fā)展起來的,它以Web頁作背景,通過元數(shù)據(jù)將Web信息組織起來,構(gòu)成基于元數(shù)據(jù)的有序信息系統(tǒng),為網(wǎng)絡(luò)信息資源的組織提供了重要
16、手段。其主要學術(shù)意義和應(yīng)用價值在于信息處理。 根據(jù)中醫(yī)文獻數(shù)字化研究室的最新研究,中醫(yī)藥古籍元數(shù)據(jù)包括三類概念:一是表達古籍外部特征的元數(shù)據(jù),稱為書目元數(shù)據(jù);二是表達古籍內(nèi)部篇、卷、章、節(jié)層次特征的元數(shù)據(jù),稱為書體結(jié)構(gòu)元數(shù)據(jù);三是表達古籍知識單元內(nèi)容的元數(shù)據(jù),稱為語義元數(shù)據(jù)。本領(lǐng)域本體模型以“語義元數(shù)據(jù)”為核心概念集,以“病證”語義元數(shù)據(jù)及其包涵的概念為中心建立本體模型。 有關(guān)病證與其他概念間的關(guān)系主要有二類:等級關(guān)系,
17、包括上下位關(guān)系和實例關(guān)系;非等級關(guān)系,包括同義關(guān)系、交叉關(guān)系、排斥關(guān)系等。 以《諸病源候論》“風痙候”為例,為本體添加類和實例:“風痙候”條文:“風痙者,口噤不開,背強而直,如發(fā)癇之狀。其重者,耳中策策痛;卒然身體痙直者,死也。由風邪傷于太陽經(jīng),復遇寒濕,則發(fā)痙也。診其脈,策策如弦,直上下者,風痙脈也?!?“風痙候”的概念等級鏈為:病證——風病——風痙。條文中與與本概念相關(guān)的其他概念有:證候表現(xiàn)、預后、病因、病位、脈象。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于本體的中醫(yī)古籍敘詞表構(gòu)建方法研究.pdf
- 基于敘詞表的領(lǐng)域本體建模方法研究.pdf
- 基于敘詞表的領(lǐng)域本體建模研究.pdf
- 基于敘詞表的領(lǐng)域本體構(gòu)建.pdf
- 基于敘詞表和文獻數(shù)據(jù)庫的農(nóng)業(yè)領(lǐng)域本體構(gòu)建方法研究.pdf
- 期貨領(lǐng)域本體構(gòu)建——基于敘詞表與本體的轉(zhuǎn)換研究.pdf
- 基于網(wǎng)絡(luò)環(huán)境下中文敘詞表本體知識表示的研究
- 基于中醫(yī)骨傷古籍本體的語義檢索研究.pdf
- 基于敘詞表詞間關(guān)系的領(lǐng)域信息檢索.pdf
- 中醫(yī)古籍圖像文獻的自由標引方法研究.pdf
- 基于本體的領(lǐng)域需求建模過程研究.pdf
- 領(lǐng)域敘詞表融合中概念優(yōu)選詞選擇研究.pdf
- 基于OWL的領(lǐng)域本體構(gòu)建方法研究.pdf
- 基于本體的服裝領(lǐng)域知識表示的建模研究.pdf
- 基于本體的突發(fā)事件領(lǐng)域知識建模.pdf
- 基于本體的領(lǐng)域構(gòu)件檢索方法的研究.pdf
- 基于MDA的本體建模方法研究.pdf
- 基于中醫(yī)古籍文獻咳嗽病因病機的研究.pdf
- 基于mda的本體建模方法研究
- 農(nóng)業(yè)科學敘詞表向農(nóng)業(yè)本體轉(zhuǎn)化系統(tǒng)的研究與實現(xiàn).pdf
評論
0/150
提交評論