版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、2006年5月第5期May2006No5論網(wǎng)絡(luò)環(huán)境下情報(bào)檢索語言的發(fā)展趨勢易紅’徐軍華李金波(1湖北民族學(xué)院,恩施445000’;2武漢大學(xué)中國科學(xué)評價(jià)研究中心,武漢430072;3華南師范大學(xué)經(jīng)濟(jì)與管理學(xué)院,廣州510631)[摘要]論述了網(wǎng)絡(luò)環(huán)境下采用自然語言是必然趨勢,然而自然語言井不會成為網(wǎng)絡(luò)環(huán)境下的惟一檢索語言,自然語言爭人工語言相結(jié)合才是發(fā)展的方向。【關(guān)鍵制】網(wǎng)絡(luò)環(huán)境;情報(bào)檢索語言;自然語言;人工語言【st髓d]dspape
2、rdiscussesthattheuseofnatulltllanguageisnecessaryundernetworkenvironmentbutlla~a]languagewillnotbetheexclusiveretrievallanguageThedevd0pingtrendofinformationretrievall/tngLlageisthecombinationofnatura1]Jlllguageandartifi
3、ciallanguage【Keywords]networkenvironment;informationretrievallanguage;natl1ra]language;artificiallanguage[中圖分類號)G254[文獻(xiàn)標(biāo)識碼)A[文章編號)1008—0821(2OO6)05—0013—02情報(bào)檢索語言是情報(bào)檢索的保證,其發(fā)展同科學(xué)技術(shù)的進(jìn)步、社會環(huán)境及用戶需求密切相關(guān)。進(jìn)入新世紀(jì)以來互聯(lián)網(wǎng)絡(luò)已基本在全球得到普及,基于
4、手工檢索而產(chǎn)生的人工語言,面對著網(wǎng)絡(luò)信息資源的浩瀚海洋、多種多樣的用戶檢索需求以及計(jì)算機(jī)技術(shù)的進(jìn)一步應(yīng)用和發(fā)展,已經(jīng)越來越暴露出它的弱點(diǎn),回歸自然語言的呼聲越來越高。這里筆者不禁要問,網(wǎng)絡(luò)環(huán)境下人工語言會完全失去用武之地嗎,自然語言會完全取代人工語言成為網(wǎng)絡(luò)環(huán)境下信息檢索的惟一工具嗎這個問題也是近些年來情報(bào)語言學(xué)界討論的熱點(diǎn)。l網(wǎng)絡(luò)環(huán)境下采用自然語言是必然趨勢11網(wǎng)絡(luò)環(huán)境的特點(diǎn)及其對情報(bào)檢索語言的要求111信息海量且載體電子化網(wǎng)絡(luò)上的海
5、量信息一直是人們所津津樂道的,但同時也是令人們很頭疼的一件事。網(wǎng)絡(luò)上信息包羅萬象,類型多種多樣,而且新的類型不斷涌現(xiàn),即使是經(jīng)過加工的機(jī)讀數(shù)據(jù)也是數(shù)以萬計(jì),包括書目數(shù)據(jù)庫、數(shù)值數(shù)據(jù)庫、全文數(shù)據(jù)庫、圖像數(shù)據(jù)庫、多媒體數(shù)據(jù)庫等等,它們逐漸取代印刷型二次文獻(xiàn)。另外,電子出版物也是急劇增長。面對這些,即使是專業(yè)人員有時都難以檢索到自己所需的信息,更別提用戶了,人們呼喚檢索語言出現(xiàn)新局面:由難以容納新類目的分類語言為主走向以敘詞語言、自然語言為主
6、;由使用單一的檢索語言并用或混用。112信息資源的網(wǎng)絡(luò)化、共享化隨著信息技術(shù)的進(jìn)步和互聯(lián)網(wǎng)絡(luò)的日益完善全球網(wǎng)絡(luò)用戶發(fā)展迅速,達(dá)到上億,信息資源的跨國流動、各國之間的科技文化交流日益頻繁,全球共享著一個因特網(wǎng)。在這樣的計(jì)算機(jī)網(wǎng)絡(luò)環(huán)境中,檢索語言(分類表、詞表)的使用對象由原先的專業(yè)標(biāo)引人員和檢索人員擴(kuò)大到專業(yè)不同、層次不一的廣大終端用戶。各國所采用的情報(bào)檢索語言不同,標(biāo)識方法各異,分類表、詞表的兼容性差,而且傳統(tǒng)的分類語言和主體語言還存在
7、標(biāo)引難度大、速度慢、詞匯更新滯后、對標(biāo)引和檢索人員要求過高等弊端,在網(wǎng)絡(luò)環(huán)境中,這些弊端已明顯的暴露出來。網(wǎng)絡(luò)環(huán)境下用戶的變化也呼喚著兼容性強(qiáng)、易用的自然語言的登臺亮相。113檢索方式的多樣化以及技術(shù)的現(xiàn)代化網(wǎng)絡(luò)環(huán)境下,虛擬圖書館已成為現(xiàn)實(shí),信息用戶已不必親自去圖書館借閱書刊,坐在計(jì)算機(jī)終端前利用網(wǎng)絡(luò)進(jìn)行居家檢索成為潮流,如此勢必要求用最符合他們習(xí)慣的語言來進(jìn)行檢索。人們的情報(bào)檢索行為也不再僅是手工檢索時代占主導(dǎo)的“提問——檢索式”、“
8、瀏覽——檢索式”已盛行,表現(xiàn)出了更多的隨意性和自然性。同時。檢索技術(shù)也越來越先進(jìn),超文本、多媒體、全文檢索等技術(shù)及計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的發(fā)展和運(yùn)用,使檢索語言詞匯的兼容和互換成為現(xiàn)實(shí),也為自然語言的應(yīng)用開拓了廣闊的前景。12自然語言的優(yōu)越性通常所說的自然語言是指人們?nèi)粘Uf話、寫文章和思想交流的各種語言。在情報(bào)檢索中應(yīng)用自然語言其實(shí)質(zhì)是使用文獻(xiàn)作者或文摘編寫者原來所用的語詞,或標(biāo)引人員自擬的而不是取自詞表的語詞來作為文獻(xiàn)檢索標(biāo)識,包括關(guān)鍵詞、自
9、由詞和出現(xiàn)在文獻(xiàn)題名、文獻(xiàn)中的小標(biāo)題和章節(jié)名、文摘或正文中的語詞。過去在手工檢索條件下,自然語言在情報(bào)檢索中很難應(yīng)用,人工語言正是基于此而創(chuàng)造,可是在檢索計(jì)算機(jī)化網(wǎng)絡(luò)化的條件下,自然語言的優(yōu)勢卻凸顯出來:121自然語言是文獻(xiàn)作者的書面語言,用作情報(bào)檢索能客觀的反映文獻(xiàn)的主題內(nèi)容,可以避免由于文獻(xiàn)分析標(biāo)引的誤差和人工語言的粗化所造成的標(biāo)識表達(dá)文獻(xiàn)主題的失真,更好的體現(xiàn)了文獻(xiàn)保障原則。122符合用戶習(xí)慣,具有易用性,檢索方便、簡單。用戶直接
10、以日常使用的語言(只要不脫離文獻(xiàn)中的主要自然語言)便可以任意檢索,既不受詞表控制。也毋需培訓(xùn)。如此較易激發(fā)檢索者的熱情,取得更佳的檢索效果。123自然語言符合客觀發(fā)展需要,它可以不受限制的隨收稿日期:2O05—O8一l6作者簡介:易紅,現(xiàn)在湖北民族學(xué)院圖書館工作。徐軍華(1979一)。男,武漢大學(xué)信息管理學(xué)院2003級研究生。研究方向:知識管理,發(fā)表論文6篇。李金波(198O一)。男。華南師范大學(xué)經(jīng)濟(jì)與管理學(xué)院信息管理系碩士研究生。一l
11、3一理論探索維普資訊理論探索2006年5月第5期May2006No5時輸入新詞,因而能容納新類目,較容易跟蹤學(xué)科的發(fā)展。124自然語言能達(dá)到足夠的專指度,它可以使用文摘、索引或文獻(xiàn)正文中出現(xiàn)的任何一個具有實(shí)際意義的詞進(jìn)行檢索,甚至可以指定檢索的詞在某一段落或某一句子中出現(xiàn)。因而有較好的查準(zhǔn)率。125自然語言標(biāo)引簡便,可以取消費(fèi)時費(fèi)力的標(biāo)引工作,或至少可以降低標(biāo)引工作的難度和成本,標(biāo)引和建庫速度快,也易于實(shí)現(xiàn)自動化。126通用性好。自然語
12、言具有通用性,可以避免由于標(biāo)引人員的素質(zhì)和理解、判斷等方面的差異而造成的歸類和選詞的不同,因而消除了人工語言的兼容性問題,易于實(shí)現(xiàn)資源共享。綜上所述,自然語言憑借其突出的優(yōu)點(diǎn),順應(yīng)了網(wǎng)絡(luò)環(huán)境的特點(diǎn)及其對情報(bào)檢索語言提出的要求,成為網(wǎng)絡(luò)環(huán)境下情報(bào)檢索語言發(fā)展的必然趨勢。目前國外網(wǎng)絡(luò)信息檢索中自然語言的應(yīng)用占著主要地位,幾乎所有網(wǎng)絡(luò)信息檢索工具都提供關(guān)鍵詞(自然語言)途徑,就是例證。然而問題在于,自然語言是否會成為網(wǎng)絡(luò)環(huán)境下的惟一檢索語言,
13、人工語言是否已失去其使用價(jià)值,我們應(yīng)該專注于自然語言而削弱甚至放棄人工語言的研究嗎2自然語言不會成為網(wǎng)絡(luò)環(huán)境下的惟一檢索語言21自然語言完美嗎自然語言有著眾多的優(yōu)點(diǎn),這筆者在上面已經(jīng)論述過,但這并不代表自然語言是完美的,沒有缺陷。事實(shí)上,自然語言的最大優(yōu)點(diǎn)——不作詞匯規(guī)范和詞間關(guān)系顯示,也是它的最大缺點(diǎn):211自然語言表達(dá)概念的自由度很大,不僅存在著許多同義詞和近義詞,而且還存在著大量同義和近義的詞組,除一般同義詞(組)外,有學(xué)名和俗稱
14、、新稱和舊稱、全稱和簡稱、不同譯名、不同書寫形式的詞、一般近義詞(組)等等。這些詞(組)在文獻(xiàn)中的存在,造成檢索內(nèi)容的嚴(yán)重分散,對檢全率的影響相當(dāng)大。212自然語言中還存在著大量多義詞和同形異義詞,會影響檢準(zhǔn)率。這對專業(yè)數(shù)據(jù)庫來說影響不會很大,但用戶檢索綜合性數(shù)據(jù)庫時,往往會感到頭疼。213自然語言標(biāo)引不采用詞表,對這些大量存在著的同義詞、近義詞、多義詞及其他相關(guān)關(guān)系的詞匯沒有進(jìn)行規(guī)范和詞間關(guān)系顯示,因而無法利用詞匯間的語義關(guān)系網(wǎng)來進(jìn)行
15、縮檢和擴(kuò)檢,影響查全率。另外,由于選詞沒有嚴(yán)格限制,詞量勢必過多過雜,造成主題分散,相關(guān)文獻(xiàn)也不能集中,影響查全率和查準(zhǔn)率。自然語言的這些缺陷,使得它在情報(bào)檢索中的應(yīng)用面臨著兩個難題:“一是如何從自然語言文本中抽出最能準(zhǔn)確、充分的表達(dá)文獻(xiàn)有價(jià)值內(nèi)容的詞,以及這些詞與檢索課題有效匹配的問題;二是克服自然語言由于不規(guī)范和缺乏語義關(guān)聯(lián)性而對檢索不利的問題?!边@兩個難題的克服都不能完全靠自動化的方法,而又要以人工語言,利用人工語言的長處來解決。
16、,22人工語言已成昨日黃花了嗎誠然,計(jì)算機(jī)和網(wǎng)絡(luò)檢索的發(fā)展使人工語言的缺點(diǎn)暴露無遺:人工語言標(biāo)引速度慢,遠(yuǎn)遠(yuǎn)跟不上數(shù)量龐大的網(wǎng)絡(luò)信息資源的增長速度;處理時差大,不能及時反映最新發(fā)布的信息;對新學(xué)科、新技術(shù)和新方法等出現(xiàn)的新生詞無法標(biāo)引;標(biāo)引規(guī)則復(fù)雜,標(biāo)引難度大,對標(biāo)引人員要求高,一般用戶使用困難等。許多人也正是基于此認(rèn)為人工語言不適合于標(biāo)引檢索網(wǎng)絡(luò)信息資源,認(rèn)為人工語言將被一14~淘汰。這種觀點(diǎn)的正確性是值得懷疑的,他們忽略了人工語言還
17、有著許多優(yōu)點(diǎn):221能簡單明白又比較專指的表達(dá)文獻(xiàn)以及檢索課題的主題概念,并且容易將概念進(jìn)行系統(tǒng)排列,在檢索時便于將標(biāo)引用語與檢索用語進(jìn)行相符性比較;222詞匯規(guī)范,語詞與概念一一對應(yīng),能控制同義詞、近義詞、多義詞和相關(guān)詞,減少語義含混現(xiàn)象,促進(jìn)主題表達(dá)的一致性,提高查準(zhǔn)率;223進(jìn)行詞間關(guān)系顯示,表達(dá)概念之間的關(guān)系,便于進(jìn)行上位擴(kuò)檢、下位縮檢和相關(guān)檢索,獲得較高的查全率。歸納到一點(diǎn),人工語言的最大優(yōu)點(diǎn)就是:使用它標(biāo)引的數(shù)據(jù)庫檢索效率(
18、查全率和查準(zhǔn)率)相當(dāng)高。這正是自然語言的致命缺點(diǎn),也是標(biāo)引檢索人員和用戶追求的首要目標(biāo)?!耙恍┙?jīng)過信息工作者標(biāo)引的專業(yè)數(shù)據(jù)庫它們的檢索功能和效果都是現(xiàn)有網(wǎng)絡(luò)信息檢索工具望塵莫及的”,這些網(wǎng)絡(luò)信息檢索工具如搜索引擎都主要是使用關(guān)鍵詞(自然語言)檢索。而目前為了對網(wǎng)絡(luò)環(huán)境下的數(shù)字信息進(jìn)行描述與組織而大力開發(fā)的元數(shù)據(jù),也是對“人工語言不適合于網(wǎng)絡(luò)環(huán)境”的觀點(diǎn)的否定??梢姡斯ふZ言非但不會成為昨B黃花,還應(yīng)該加強(qiáng)研究。一句話,網(wǎng)絡(luò)環(huán)境下的信息檢
19、索不會使用惟一的自然語言,還必須使用人工語言。3自然語言和人工語言相結(jié)合才是發(fā)展的方向從以上對自然語言和人工語言各自優(yōu)缺點(diǎn)的分析,純粹的自然語言檢索在實(shí)際中是不可行的,單純的人工語言也難以應(yīng)付網(wǎng)絡(luò)環(huán)境下的信息檢索,但是兩者結(jié)合起來就不一樣了:自然語言可以解決人工語言時差大、不靈活、使用困難等問題,而人工語言憑借其控制作用可以解決自然語言檢索效率不高等問題。實(shí)際上,也已經(jīng)出現(xiàn)了二者相結(jié)合的方法,就是二者的對應(yīng)轉(zhuǎn)換,人口詞表、后控制詞表就是
20、為了實(shí)現(xiàn)這種轉(zhuǎn)換而編制的詞表。但是,目前這些對應(yīng)轉(zhuǎn)換詞表的水平和編制的自動化程度并不高,還有待進(jìn)一步研究。綜上,在網(wǎng)絡(luò)環(huán)境下,自然語言檢索將被廣泛應(yīng)用,人工語言將成為對自然語言強(qiáng)有力的后控制手段,依然有它的發(fā)展前途,檢索語言應(yīng)朝著并且必然朝著自然語言和人工語言相結(jié)合的方向發(fā)展。其中,我們可以清楚的看到這樣一點(diǎn):自然語言和人工語言的優(yōu)(缺)點(diǎn)反映在對方身上便變成了其缺(優(yōu))點(diǎn),二者具有很強(qiáng)的互補(bǔ)性。參考文獻(xiàn)[1]張琪玉情報(bào)檢索語言的發(fā)展趨
21、勢(與吳建中的對話)[J]圖書館雜志,1996,(4):29—32[2]儲荷婷等Intemet網(wǎng)絡(luò)信息檢索——原理工具技巧[M]北京:清華大學(xué)出版社,199910[3]張琪玉網(wǎng)絡(luò)信息檢索用語言的發(fā)展趨勢[J]圖書館雜志,200l,(3):5—7,22[4]趙英莉聯(lián)網(wǎng)環(huán)境中的情報(bào)檢索語言研究[J]圖書情報(bào)工作,1998,(5):9—12[5]寇均鋒論情報(bào)檢索語言的自然語言化發(fā)展趨勢[J]中國圖書館學(xué)報(bào),1999,(3):28—31[6]張
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于情報(bào)檢索語言互操作技術(shù)的集成詞庫構(gòu)建研究——以教育詞庫為例.pdf
- 情報(bào)檢索試題及答案
- 科技情報(bào)檢索基礎(chǔ)理論
- 情報(bào)檢索試題及答案--三套
- 情報(bào)檢索試題及答案三套
- 楊洪達(dá)外文科技情報(bào)檢索
- 我國情報(bào)服務(wù)的發(fā)展趨勢
- 網(wǎng)絡(luò)語言的現(xiàn)狀及其發(fā)展趨勢分析.pdf
- 論新環(huán)境下國家審計(jì)的發(fā)展趨勢
- 淺談網(wǎng)絡(luò)環(huán)境下傳統(tǒng)會計(jì)的發(fā)展趨勢
- 淺談網(wǎng)絡(luò)環(huán)境下傳統(tǒng)會計(jì)的發(fā)展趨勢
- —論旅游發(fā)展趨勢
- 情報(bào)檢索試題及答案--三套匯總
- 網(wǎng)絡(luò)環(huán)境下會展模式發(fā)展趨勢研究.pdf
- 論工程測量的發(fā)展趨勢
- 論網(wǎng)絡(luò)文化的形成機(jī)制及發(fā)展趨勢.pdf
- 社交網(wǎng)絡(luò)未來發(fā)展趨勢
- 30304.陜西財(cái)經(jīng)職業(yè)技術(shù)學(xué)院情報(bào)檢索系統(tǒng)
- 論中國未來建筑的發(fā)展趨勢
- 論鐵路監(jiān)理行業(yè)的發(fā)展趨勢
評論
0/150
提交評論