中醫(yī)藥學(xué)語言系統(tǒng)超級敘詞表分類原則和構(gòu)架的探討.pdf_第1頁
已閱讀1頁,還剩55頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、一體化醫(yī)學(xué)語言系統(tǒng)解決了生物醫(yī)學(xué)信息檢索中相同的概念具有不同的表達方式、有用的信息分散在不同的數(shù)據(jù)庫系統(tǒng)中所造成的查詢困難等問題。超級敘詞表作為一體化醫(yī)學(xué)語言系統(tǒng)的重要組成部分,在系統(tǒng)中發(fā)揮著不可替代的作用,超級敘詞表是系統(tǒng)的核心,為系統(tǒng)提供了“基本素材”——術(shù)語和概念。對于詞表的研究而言,詞表的分類占有重要的地位,合理的分類可以優(yōu)化系統(tǒng),提高用戶的檢索速度,減少加工人員的工作量,同時分類也是實現(xiàn)數(shù)據(jù)資源管理現(xiàn)代化的必要條件。
 

2、  參照國家標準、中醫(yī)藥學(xué)詞典、詞表等的分類,本文在現(xiàn)在的中醫(yī)藥學(xué)語言系統(tǒng)(TCMLS)超級敘詞表的基礎(chǔ)上制定了中醫(yī)藥超級敘詞表的分類原則,提出了新的詞表分類框架,以期能對中醫(yī)藥學(xué)語言系統(tǒng)的分類進行優(yōu)化。
   1一體化醫(yī)學(xué)語言系統(tǒng)研究現(xiàn)狀
   目前,國內(nèi)外研究一體化醫(yī)學(xué)語言系統(tǒng)的有美國國立醫(yī)學(xué)圖書館(NLM)的一體化醫(yī)學(xué)語言系統(tǒng)(UMLS)、中國醫(yī)學(xué)科學(xué)院醫(yī)學(xué)信息研究所的中文一體化醫(yī)學(xué)語言系統(tǒng)(CUMLS)和中國中

3、醫(yī)科學(xué)院中醫(yī)藥信息研究所的中醫(yī)藥學(xué)語言系統(tǒng)(TCMLS)。
   UMLS于1986年開始研制,到現(xiàn)在已經(jīng)處于成熟階段,廣泛應(yīng)用于詞表的編制、自然語言的處理、自動索引和生物醫(yī)學(xué)信息檢索、醫(yī)療決策支持系統(tǒng)等地方。它有3個組成部分:超級敘詞表、語義網(wǎng)絡(luò)、專家詞典。
   CUMLS的研究主要集中在中國醫(yī)學(xué)科學(xué)院醫(yī)學(xué)信息研究所,它建立的目的是為解決中文生物醫(yī)學(xué)檢索中相同的概念有不同的表達方式,有用的信息分散在不同地方的問題。該

4、系統(tǒng)由中國醫(yī)學(xué)用語數(shù)據(jù)庫、中國醫(yī)學(xué)用語語義網(wǎng)絡(luò)系統(tǒng)、中國醫(yī)學(xué)用語與標引檢索語言對應(yīng)轉(zhuǎn)換系統(tǒng)3個部分組成。
   TCMLS是在參照UMLS基礎(chǔ)上,根據(jù)中醫(yī)藥語言特點及學(xué)科體系特色,按照本體論設(shè)計原理而研制的語言系統(tǒng)。系統(tǒng)的建立將為中醫(yī)藥學(xué)科的數(shù)字化和標準化及與國際接軌提供必要的工具,同時將進一步提示中醫(yī)藥學(xué)科的完整性和概念中的相互關(guān)聯(lián)性。
   2中醫(yī)藥詞表研究現(xiàn)狀
   目前,中醫(yī)藥相關(guān)詞表主要有《中國中醫(yī)藥學(xué)

5、主題詞表》、中醫(yī)藥學(xué)語言系統(tǒng)的中醫(yī)藥超級敘詞表和《中國圖書館分類法·醫(yī)學(xué)專業(yè)分類表》。
   《中國中醫(yī)藥學(xué)主題詞表》以中醫(yī)藥學(xué)學(xué)科體系為基礎(chǔ),同時兼顧了《漢語關(guān)鍵詞表》和美國《醫(yī)學(xué)主題詞表》詞表,將全部主題詞按學(xué)科門類劃分,排列于15個類目68個子類目,它是目前使用最廣泛、影響最大的一部中醫(yī)藥學(xué)專業(yè)關(guān)鍵詞表。
   中醫(yī)藥超級敘詞表在參照《中醫(yī)藥表》、《中圖法》、《醫(yī)學(xué)主題詞注釋字順表》及近年來各種版本的中醫(yī)藥學(xué)教科書

6、的基礎(chǔ)上分為16大類。由于TCMLS還沒有完整建立,因此其分類還在不斷完善中。
   《醫(yī)學(xué)專業(yè)分類表》采用理、法、方、藥的類目編制原則,將中國醫(yī)學(xué)分為中醫(yī)預(yù)防、衛(wèi)生學(xué)、中醫(yī)基礎(chǔ)理論、中醫(yī)臨床學(xué)、內(nèi)科學(xué)、外科學(xué)、婦產(chǎn)科學(xué)、兒科學(xué)、骨傷科學(xué)、皮膚科學(xué)、五官科學(xué)、急癥學(xué)、中藥學(xué)、中國少數(shù)民族醫(yī)學(xué)等。
   3中醫(yī)藥超級敘詞表分類原則
   在參照GB/T7072—2002信息分類和編碼的基本原則與方法、《中醫(yī)藥表》分

7、類原則、地理信息分類原則等基礎(chǔ)上,本課題將中醫(yī)藥超級敘詞表的分類原則分為基本原則和獨特原則。
   分類的基本原則是詞表分類需要遵循的一般性原則,包括科學(xué)性原則、系統(tǒng)性原則、可延性原則、實用性原則、邏輯性原則、兼容性原則等。
   中醫(yī)藥學(xué)科有區(qū)別與其它學(xué)科的特征,所以中醫(yī)藥超級敘詞表的分類原則也有別與其他學(xué)科詞表的分類原則。中醫(yī)藥概念詞的分類需要遵循中醫(yī)的理論體系、診療手段等邏輯思維習(xí)慣,同時在制定中醫(yī)藥超級敘詞表分類

8、原則的時候需要考慮到中醫(yī)藥學(xué)語言系統(tǒng)的應(yīng)用目的。中醫(yī)藥超級敘詞表分類除遵循信息分類的基本原則外,還需要遵循以下獨特原則:類名規(guī)范原則、詳盡性原則、一致性原則、專指性原則、類目粒度的控制性原則、自調(diào)整原則、約定俗稱原則、優(yōu)先性原則、平衡性原則等。
   4中醫(yī)藥超級敘詞表分類方法
   信息分類常見的方法有三種:線分類法、面分類法、混合分類法。其中線分類法又稱層級分類法、體系分類法;面分類法又稱組配分類法。
  

9、本課題采用混合分類法,遵循中醫(yī)藥學(xué)科特色,自上而下建立中醫(yī)藥超級敘詞表分類框架,將詞表層層劃分,形成樹狀結(jié)構(gòu)表,從而清晰明了地展現(xiàn)中醫(yī)藥學(xué)的知識等級體系,滿足不同角度和多途徑查詢知識信息。
   5中醫(yī)藥超級敘詞表分類框架
   中醫(yī)藥學(xué)理論體系是包括理、法、方、藥在內(nèi)的整體,是關(guān)于中醫(yī)學(xué)的基本概念、基本原理和基本方法的科學(xué)知識體系。在參照中醫(yī)藥相關(guān)詞表體系類別的基礎(chǔ)上,采用自上而下的方法,按照理、法、方、藥的類目編排原

10、則,對中醫(yī)藥超級敘詞表類目體系進行構(gòu)造。將中醫(yī)藥超級敘詞表的一級類目分為“病因病機與診斷”、“地理學(xué)”、“方劑學(xué)”、“疾病”、“預(yù)防與養(yǎng)生”、“針灸學(xué)”、“治則治法”、“中藥化學(xué)”、“中藥學(xué)”、“中醫(yī)基礎(chǔ)理論”、“中醫(yī)藥研究機構(gòu)”、“民族醫(yī)學(xué)”、“中醫(yī)人體形態(tài)”、“中醫(yī)藥相關(guān)學(xué)科”、“中西醫(yī)結(jié)合”。
   6中醫(yī)藥超級敘詞表分類框架的驗證
   本課題通過兩種途徑來驗證中醫(yī)藥超級敘詞表的分類框架,一種途徑是與現(xiàn)在系統(tǒng)的分

11、類框架作對比,另一種是從中醫(yī)藥相關(guān)期刊中抽取主題詞和關(guān)鍵詞,驗證其能否歸入本文提出的框架。
   (1)與現(xiàn)在中醫(yī)藥超級敘詞表作對比研究
   與現(xiàn)在的中醫(yī)藥超級敘詞表相比,本文建議增加以下類目:“民族醫(yī)學(xué)”、“中醫(yī)人體形態(tài)”、“中西醫(yī)結(jié)合”?!懊褡遽t(yī)學(xué)”作為中國傳統(tǒng)醫(yī)學(xué)的一部分,與中醫(yī)藥學(xué)的研究息息相關(guān);疾病的診斷和治療都離不開“人體形態(tài)學(xué)”的支持;醫(yī)學(xué)的快速發(fā)展使得“中西醫(yī)結(jié)合”的研究如火如荼,相關(guān)的機構(gòu)、文獻量激增

12、。
   在原來的中醫(yī)藥超級敘詞表基礎(chǔ)上合并了部分類目,有些類目在語言系統(tǒng)中涉及的概念術(shù)語比較少,檢索中很少用到,建議將其合并。例如“人文科學(xué)”、“醫(yī)學(xué)信息學(xué)與文獻學(xué)”、“自然科學(xué)與物理科學(xué)”等類目,系統(tǒng)中它們作為一級類目,其子類目僅有一個或者兩個,因此建議將它們合并為“中醫(yī)藥相關(guān)學(xué)科”。
   (2)框架的驗證
   抽取中醫(yī)藥相關(guān)核心期刊的主題詞和關(guān)鍵詞做分類框架的驗證,從《中醫(yī)雜志》、《中國中西醫(yī)結(jié)合雜志》

13、、《中國中醫(yī)藥信息雜志》中抽取2010年文章的關(guān)鍵詞和關(guān)鍵詞共5638個,與現(xiàn)在的TCMLS系統(tǒng)中的概念和術(shù)語匹配后,有1578個未在系統(tǒng)中出現(xiàn)。對這些詞進行統(tǒng)計后,發(fā)現(xiàn)很多是西醫(yī)的術(shù)語,例如:熱休克蛋白70、理化檢查、白細胞介素、碘放射性同位素等。還有些是自擬方劑、人物名稱、疾病名稱等,但是這些都可以歸入系統(tǒng)的類目中,所以此分類框架還是比較合理的,可以囊括中醫(yī)藥相關(guān)的概念和術(shù)語。
   7總結(jié)與展望
   中醫(yī)藥超級敘

14、詞表的研究無論是對中醫(yī)藥詞表的分類,還是對語言系統(tǒng)的應(yīng)用開發(fā)都有重要的意義,其分類成果是理論與應(yīng)用的橋梁。但是,由于人類的主觀性和客觀的復(fù)雜性,人類對中醫(yī)藥的認識不可避免存在局限性。本文提出的中醫(yī)藥超級敘詞表分類原則與方法參考了國內(nèi)外詞表分類的相關(guān)研究,期望能在實踐中不斷完善,為中醫(yī)藥概念、術(shù)語的分類研究、相關(guān)標準的制定和語言系統(tǒng)的完善及應(yīng)用提供幫助。
   中醫(yī)藥學(xué)語言系統(tǒng)不是一天建立的,它需要不斷完善。中醫(yī)藥超級敘詞表框架的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論