版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第二節(jié) 信息檢索的基礎(chǔ)知識(shí),2.1 信息檢索的概念廣義:指將信息按一定的方式組織和存儲(chǔ)起來(lái),并根據(jù)用戶的需要檢出所需信息的過(guò)程。包括信息存儲(chǔ)和信息檢索兩個(gè)過(guò)程。信息存儲(chǔ):將大量無(wú)序的信息集中起來(lái),根據(jù)其外表特征和內(nèi)容特征,經(jīng)過(guò)加工,使其系統(tǒng)化、有序化,并按一定的技術(shù)要求建成一個(gè)具有檢索功能的工具或系統(tǒng)。 外表特征:題名、著者、出版事項(xiàng)等 內(nèi)容特征:分類(lèi)號(hào)、主題詞等 信息檢索:指運(yùn)用編制好的檢索工具或系統(tǒng),從信息集合中
2、查找并獲取與用戶提問(wèn)相關(guān)的信息的過(guò)程 。,——狹義,,信息源,篩選信息,概念分析,概念轉(zhuǎn)換成檢索語(yǔ)言-標(biāo)引,信息檢索系統(tǒng),概念轉(zhuǎn)換成檢索語(yǔ)言-提問(wèn),概念分析,需求分析,信息用戶,檢索策略,,,,,,,,存儲(chǔ)過(guò)程,檢索過(guò)程,,信息檢索原理,,,檢索結(jié)果,,2.2 信息檢索的類(lèi)型 根據(jù)檢索對(duì)象的不同,信息檢索分為:,,信息檢索的類(lèi)型,文獻(xiàn)檢索與數(shù)據(jù)檢索、事實(shí)檢索的關(guān)系,文獻(xiàn)檢索:相關(guān)性檢索,只檢索出包含所需知
3、識(shí)信息的文獻(xiàn),不直接解答用戶所提出的具體問(wèn)題。數(shù)據(jù)檢索、事實(shí)檢索:確定性檢索,檢索出包含在文獻(xiàn)中的知識(shí)信息,檢索結(jié)果可供用戶直接利用。通常,文獻(xiàn)檢索通過(guò)二次文獻(xiàn)來(lái)實(shí)現(xiàn),是信息檢索中最基本、最主要的形式。而數(shù)據(jù)與事實(shí)檢索則一般是通過(guò)三次文獻(xiàn)來(lái)完成。,2.3 信息檢索工具2.3.1 概述 指用來(lái)存儲(chǔ)、報(bào)道和查找各類(lèi)信息線索或特定數(shù)據(jù)和事實(shí)的工具或系統(tǒng)?!≈饕ǎ?(1)二次、三次印刷型手工檢索工具 (2)面向計(jì)算機(jī)
4、和網(wǎng)絡(luò)的各種數(shù)據(jù)庫(kù)檢索系統(tǒng) (3)搜索引擎等網(wǎng)絡(luò)檢索工具,2.3.2 檢索工具的作用 a. 報(bào)道作用:報(bào)道已經(jīng)公開(kāi)或發(fā)表的相關(guān)領(lǐng)域的信息及線索。 b. 存儲(chǔ)作用:將已經(jīng)公開(kāi)或發(fā)表的信息及線索按一定方式存儲(chǔ)起來(lái),供用戶檢索利用。 c. 檢索作用:供讀者查找信息及線索。,信息檢索工具,2.4 二次文獻(xiàn)的分類(lèi)分類(lèi):目錄、題錄、文摘、索引(1) 目錄(Catalog):是以“本”為報(bào)道單位,它主要用于反
5、映文獻(xiàn)(圖書(shū)、期刊等)的出版情況或收藏情況,揭示文獻(xiàn)外部特征(題名、著者、出版事項(xiàng)等)的檢索工具?!±吼^藏目錄:反映一個(gè)圖書(shū)館文獻(xiàn)收藏情況的目錄?! ÷?lián)合目錄:反映一個(gè)地區(qū)或一個(gè)系統(tǒng)甚至全國(guó)或世界范圍的圖書(shū)館、信息服務(wù)機(jī)構(gòu)文獻(xiàn)收藏情況的一種統(tǒng)一目錄。,石家莊鐵道大學(xué)圖書(shū)館館藏目錄,點(diǎn)擊題名可查看館藏地址。,二次文獻(xiàn),中國(guó)高等教育文獻(xiàn)保障系統(tǒng)(Calis)聯(lián)合目錄,點(diǎn)擊題名可查看該文獻(xiàn)信息及收藏單位。,(2) 題錄(Title):
6、是以 “篇” 為報(bào)道單位,揭示文獻(xiàn)(期刊論文、會(huì)議論文、學(xué)位論文、圖書(shū)章節(jié)等)外部特征(篇名、作者、出處等)的檢索工具。,《中國(guó)學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫(kù)》中的部分題錄信息,《CCC》中的部分題錄信息,二次文獻(xiàn),(3) 文摘(Abstract):也是以 “篇” 作為報(bào)道單位,描述文獻(xiàn)外部特征和內(nèi)容特征的檢索工具。比題錄多了一個(gè)內(nèi)容摘要項(xiàng)。,《中國(guó)學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫(kù)》中的部分文摘信息,《SCI》中的部分文摘信息,二次文獻(xiàn),(4) 索引(Ind
7、ex):是將文獻(xiàn)中具有檢索意義的事項(xiàng),按照一定方式有序編排起來(lái),供讀者查檢使用的一種附屬性的檢索工具,通常稱為輔助索引,起指引作用。常用的索引類(lèi)型有:分類(lèi)索引、主題索引、著者索引、引文索引等。,二次文獻(xiàn),,超星數(shù)字圖書(shū)館的分類(lèi)索引,EI的 主題詞(受控詞)索引,EI的作者索引,SCI的某篇文章的引文索引,2.5 文獻(xiàn)檢索的方法,(1) 追溯法 指以已有的文獻(xiàn)后面所附的參考文獻(xiàn)為線索查找相關(guān)文獻(xiàn)的方法。 向前追溯法:從一篇有價(jià)值的
8、論文出發(fā),利用其后所附的參考文獻(xiàn),查找其引用了哪些文獻(xiàn)。由近及遠(yuǎn)的回溯,越查越深,獲取更多相關(guān)文獻(xiàn)?!獊?lái)龍 向后追溯法:找到一篇有價(jià)值的論文后,進(jìn)一步查找該論文被哪些其它文獻(xiàn)引用過(guò)。由遠(yuǎn)及近地追尋,越查資料越新,研究也就越深入?!ッ} 美國(guó)《科學(xué)引文索引(SCI)》通過(guò)揭示文獻(xiàn)的引用與被引用關(guān)系來(lái)報(bào)道文獻(xiàn)。,文獻(xiàn)檢索方法,(2) 常用法:利用常規(guī)檢索工具查找有關(guān)文獻(xiàn)的方法 順查法 按課題的起始年代,按時(shí)
9、間順序由遠(yuǎn)及近逐年查找。用于掌握課題研究的進(jìn)展及過(guò)程,一般用于撰寫(xiě)研究綜述。 倒查法 以當(dāng)前時(shí)間為起點(diǎn),由近及遠(yuǎn)逐年查找文獻(xiàn)。一般用于新開(kāi)課題,以便掌握最近一段時(shí)間該課題達(dá)到的水平及研究動(dòng)向。 抽查法 根據(jù)課題所屬學(xué)科研究發(fā)展的某一高峰時(shí)期,抽出一個(gè)時(shí)間段,進(jìn)行集中查找。,文獻(xiàn)檢索方法,(3) 綜合法(循環(huán)法或分段法) 常用法+追溯法。即利用常用法檢索出一批有用文獻(xiàn),然后利用這些文獻(xiàn)所附的參考文獻(xiàn)由近及遠(yuǎn),或這些文獻(xiàn)被引用
10、情況由遠(yuǎn)及近地查找。如此分段交替循環(huán)進(jìn)行,從而可得到大量相關(guān)文獻(xiàn)。,文獻(xiàn)檢索方法,2.6 文獻(xiàn)檢索的途徑,指利用文獻(xiàn)的各種特征——檢索標(biāo)識(shí),通過(guò)檢索工具查找所需文獻(xiàn)的過(guò)程。 (1)分類(lèi)途徑 按文獻(xiàn)內(nèi)容所屬的學(xué)科類(lèi)別來(lái)檢索文獻(xiàn),使用的檢索語(yǔ)言是分類(lèi)語(yǔ)言。分類(lèi)法體現(xiàn)知識(shí)的系統(tǒng)性,它能把同一學(xué)科的信息集中在一起。,中國(guó)知網(wǎng):分類(lèi)號(hào)TU37——混凝土結(jié)構(gòu)方面的文章,,(2)主題途徑 從文獻(xiàn)內(nèi)容的主題概念出發(fā),按確定的主題詞來(lái)檢索文獻(xiàn)
11、 主題法打破了傳統(tǒng)的學(xué)科分類(lèi)的框框,把分散于各個(gè)學(xué)科的有關(guān)信息集中于同一主題詞之下。,文獻(xiàn)檢索途徑,EI:主題詞Civil Engineering——土木工程方面的文章,,文獻(xiàn)檢索途徑,(3)題名途徑 書(shū)名、刊名、篇名等(4)關(guān)鍵詞途徑(5)作者途徑(5)機(jī)構(gòu)途徑(6)引文途徑 從文獻(xiàn)的引用和被引用關(guān)系查找相關(guān)文獻(xiàn)。(7)代碼途徑 文獻(xiàn)號(hào)碼(報(bào)告號(hào)、專(zhuān)利號(hào)、標(biāo)準(zhǔn)號(hào)等) (8)其他途徑 例:美國(guó)《化學(xué)文摘》中的“分子
12、式索引”,一、概述二、分類(lèi)語(yǔ)言三、關(guān)鍵詞語(yǔ)言四、主題詞語(yǔ)言,第三節(jié) 檢索語(yǔ)言,3.1 概述 檢索語(yǔ)言是根據(jù)文獻(xiàn)信息的存儲(chǔ)和檢索的需要而創(chuàng)制的一種人工語(yǔ)言,又稱檢索標(biāo)識(shí)?!⌒畔⒋鎯?chǔ):用來(lái)描述文獻(xiàn)的內(nèi)容特征和外部特征,形成檢索標(biāo)識(shí)。 信息檢索:用來(lái)描述檢索提問(wèn),形成提問(wèn)標(biāo)識(shí)?!‘?dāng)提問(wèn)標(biāo)識(shí)與檢索標(biāo)識(shí)完全匹配或部分匹配時(shí),即可命中所需文獻(xiàn)信息。,檢索語(yǔ)言,自然語(yǔ)言,檢索語(yǔ)言的分類(lèi),描述內(nèi)容特征語(yǔ)言,分類(lèi)號(hào),檢索語(yǔ)言,主題詞(敘詞
13、),,,,描述外表特征語(yǔ)言,關(guān)鍵詞,檢索語(yǔ)言,人工語(yǔ)言,,分類(lèi)語(yǔ)言,,題名(書(shū)名/刊名/篇名)著者(作者)出版事項(xiàng)(出版者、出版地)代碼(標(biāo)準(zhǔn)號(hào)、專(zhuān)利號(hào)、報(bào)告號(hào)、 ISBN號(hào)、ISSN號(hào)),,3.2 分類(lèi)語(yǔ)言,檢索語(yǔ)言,按學(xué)科范疇從上至下、從總體到局部層層劃分、展開(kāi),形成一種直接體現(xiàn)知識(shí)分類(lèi)的等級(jí)制概念的標(biāo)識(shí)系統(tǒng)?!∶總€(gè)學(xué)科類(lèi)目都用相對(duì)固定的代碼作為標(biāo)識(shí)——分類(lèi)號(hào) 每一個(gè)分類(lèi)號(hào)代表一個(gè)特定的知識(shí)概念?!√攸c(diǎn):集中體
14、現(xiàn)學(xué)科的系統(tǒng)性,反應(yīng)事物的從屬、派生關(guān)系,便于按學(xué)科門(mén)類(lèi)進(jìn)行族性檢索?!∽畛R?jiàn)的是體系分類(lèi)語(yǔ)言,3.2.1 體系分類(lèi)語(yǔ)言 國(guó)內(nèi): 《中國(guó)圖書(shū)館分類(lèi)法》(簡(jiǎn)稱“中圖法”) 《中國(guó)科學(xué)院圖書(shū)館分類(lèi)法》(簡(jiǎn)稱“科圖法”) 《中國(guó)人民大學(xué)圖書(shū)館分類(lèi)法》(簡(jiǎn)稱“人大法”)?!?guó)外: 《杜威十進(jìn)分類(lèi)法》 《國(guó)際十進(jìn)分類(lèi)法》等 《中國(guó)圖書(shū)館分類(lèi)法》是國(guó)家推薦統(tǒng)一使用的分類(lèi)法,分類(lèi)語(yǔ)言,3.2.2 中圖分類(lèi)表的結(jié)構(gòu)(1) 基本部類(lèi)
15、 (5個(gè))(2) 基本大類(lèi) (22個(gè))(3) 簡(jiǎn)表(4) 詳表(5) 輔助表,分類(lèi)語(yǔ)言,《中國(guó)圖書(shū)館分類(lèi)法》,,分類(lèi)語(yǔ)言,《中國(guó)圖書(shū)館分類(lèi)法》,,分類(lèi)語(yǔ)言,其中“T工業(yè)技術(shù)”大類(lèi)范圍廣泛,內(nèi)容繁多,故又在該類(lèi)基礎(chǔ)上采用了雙位拉丁字母標(biāo)記其所屬的16個(gè)二級(jí)類(lèi)目。,分類(lèi)語(yǔ)言,簡(jiǎn)表:又稱為基本類(lèi)目表,是分別對(duì)每個(gè)基本大類(lèi),依據(jù)它的某些屬性,作進(jìn)一步劃分后而形成的二、三級(jí)類(lèi)目表 。 如:O 數(shù)理科學(xué)和化學(xué) 一
16、度劃分: O1 數(shù)學(xué) O3 力學(xué) O4 物理學(xué) O6 化學(xué) O7 晶體學(xué),分類(lèi)語(yǔ)言,O1 數(shù)學(xué),二度劃分: O11 古典數(shù)學(xué)O12 初等數(shù)學(xué)O13 高等數(shù)學(xué)O14 數(shù)理邏輯、數(shù)學(xué)基礎(chǔ)O15 代數(shù)、數(shù)論、組合理論O17 數(shù)學(xué)分析O18 幾何、拓?fù)銸19 動(dòng)力系統(tǒng)理論……,分類(lèi)語(yǔ)言,詳表:整個(gè)分類(lèi)法的正文,亦稱正表
17、,由簡(jiǎn)表進(jìn)一步細(xì)分而成的最小概念性分類(lèi)表,是類(lèi)分信息資料的依據(jù),兩萬(wàn)個(gè)。 O17 數(shù)學(xué)分析 O171 分析基礎(chǔ) O172 微積分 O172.1 微分學(xué) O172.2 積分學(xué),分類(lèi)語(yǔ)言,《中國(guó)圖書(shū)館分類(lèi)法》,,分類(lèi)語(yǔ)言,3.2.3 杜威十進(jìn)分類(lèi)法(DDC),世界上流傳最廣影響最大的分類(lèi)法 在美國(guó)有95%的公共圖書(shū)館在
18、使用,分類(lèi)語(yǔ)言,DDC第21版的類(lèi)目共有10大類(lèi),000 計(jì)算機(jī)、信息與總類(lèi)100 哲學(xué)和心理學(xué)200 宗教300 社會(huì)科學(xué)400 語(yǔ)言500 科學(xué)(指自然科學(xué))600 技術(shù)應(yīng)用科學(xué)700 藝術(shù)和娛樂(lè)800 文學(xué)900 歷史、地理,分類(lèi)語(yǔ)言,3.3 主題詞語(yǔ)言,定義:國(guó)外稱敘詞,是以概念為基礎(chǔ),經(jīng)過(guò)嚴(yán)格規(guī)范化,通過(guò)概念組配方式表達(dá)文獻(xiàn)主題的規(guī)范化的詞或詞組。屬于人工語(yǔ)言,經(jīng)規(guī)范化處理。(由文獻(xiàn)加
19、工者提?。?如:電腦、微機(jī)(不規(guī)范詞)——計(jì)算機(jī)(規(guī)范詞)。受主題詞表(敘詞表)控制優(yōu)點(diǎn):檢索結(jié)果準(zhǔn)確而全面缺點(diǎn):需要查閱主題詞表常用INSPEC的詞表《INSPEC Thesaurus》、EI的《EI Thesaurus》及我國(guó)編輯出版的《漢語(yǔ)主題詞表》等。,主題詞語(yǔ)言,從文獻(xiàn)的題名和內(nèi)容中抽取出來(lái)的,能夠表達(dá)主題內(nèi)容的具有檢索意義的關(guān)鍵性詞匯。 屬于自然語(yǔ)言,未經(jīng)過(guò)規(guī)范處理。(由文獻(xiàn)作者提?。?沒(méi)有固定詞表
20、,標(biāo)引文獻(xiàn)時(shí)根據(jù)文獻(xiàn)內(nèi)容選擇恰當(dāng)?shù)脑~匯進(jìn)行組配,以表達(dá)文獻(xiàn)的內(nèi)容特征。 優(yōu)點(diǎn): 一是有利于計(jì)算機(jī)自動(dòng)抽詞標(biāo)引,適合于電子信息資源的標(biāo)引和檢索?!《欠狭?xí)慣、容易接受。,3.4 關(guān)鍵詞語(yǔ)言,關(guān)鍵詞語(yǔ)言,缺點(diǎn):查全率、準(zhǔn)確率較差。 同義詞標(biāo)引——引起漏檢;多義詞標(biāo)引——引起誤檢 例:同義詞,飛機(jī): Airplane、Aircraft、Planes 多義詞, cell : 電池、細(xì)胞
21、,關(guān)鍵詞語(yǔ)言,主題詞是經(jīng)過(guò)人工規(guī)范的詞匯關(guān)鍵詞是沒(méi)有經(jīng)過(guò)規(guī)范的自然語(yǔ)言詞匯如:圖書(shū)館在標(biāo)引“土豆”、“洋芋”等方面的文獻(xiàn)時(shí)用“馬鈴薯”這一規(guī)范詞。 主顧、顧客、購(gòu)物者、消費(fèi)者、使用者、讀者等用“用戶”這一規(guī)范詞來(lái)表達(dá)。主題詞可以很好地避免漏檢,提高檢全率。,主題詞與關(guān)鍵詞的區(qū)別,分類(lèi)法與主題法的區(qū)別,分類(lèi)法以學(xué)科性質(zhì)類(lèi)分文獻(xiàn),它以學(xué)科集中文獻(xiàn),屬于族性檢索,可能造成事物主題文獻(xiàn)的分散。主題法以主題詞概括文獻(xiàn)內(nèi)容,以事物主
22、題集中文獻(xiàn),屬于特性檢索, 它可能造成學(xué)科文獻(xiàn)的分散。 例如:《地下工程系統(tǒng)分析與設(shè)計(jì)》這本書(shū)進(jìn)行標(biāo)引 分類(lèi)標(biāo)引:考慮本文主題內(nèi)容所屬學(xué)科及隸屬關(guān)系:“工業(yè)技術(shù)—建筑科學(xué)—地下建筑”,相應(yīng)分類(lèi)號(hào)TU92。 主題標(biāo)引:不需考慮其所屬學(xué)科專(zhuān)業(yè),直接用描述內(nèi)容主題詞“地下工程“、”系統(tǒng)分析”標(biāo)引即可。,第四節(jié) 計(jì)算機(jī)檢索技術(shù),一、計(jì)算機(jī)檢索系統(tǒng)二、檢索提問(wèn)式三、計(jì)算機(jī)檢索步驟,依檢索手段,信息檢索分為:手工檢索
23、:使用印刷型(書(shū)本式)的檢索工具 計(jì)算機(jī)檢索:運(yùn)用計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)通信技術(shù),通過(guò)數(shù)據(jù)庫(kù)系統(tǒng)實(shí)現(xiàn)檢索。,4.1 計(jì)算機(jī)檢索系統(tǒng),4.1.1 發(fā)展歷程脫機(jī)批處理信息檢索聯(lián)機(jī)檢索系統(tǒng) 光盤(pán)檢索系統(tǒng)Internet網(wǎng)絡(luò)檢索,脫機(jī)批處理檢索階段(50年代中期至60年代中后期)1954年,美國(guó)海軍武器實(shí)驗(yàn)站圖書(shū)館在一臺(tái)電子管計(jì)算機(jī)上建立了世界上第一個(gè)計(jì)算機(jī)檢索系統(tǒng)。20世紀(jì)50年代末,IBM公司利用一臺(tái)IBM650計(jì)算機(jī)成功地編制出關(guān)
24、鍵詞索引,并建立了世界上第一個(gè)“定題情報(bào)檢索”系統(tǒng)。利用單臺(tái)計(jì)算機(jī)進(jìn)行檢索。過(guò)程:檢索機(jī)構(gòu)把多個(gè)用戶的檢索提問(wèn)匯總到一起,進(jìn)行批量檢索,然后把檢索結(jié)果通知各個(gè)用戶。特點(diǎn):委托專(zhuān)業(yè)人員批量檢索,用戶不能在檢索過(guò)程中與主機(jī)進(jìn)行“對(duì)話”和瀏覽文獻(xiàn),不能及時(shí)修改檢索策略,不能及時(shí)獲得檢索結(jié)果。,發(fā)展歷程,聯(lián)機(jī)檢索階段(60年代中后期——80年代)20世紀(jì)60年代末,數(shù)據(jù)通訊網(wǎng)絡(luò)出現(xiàn),大容量計(jì)算機(jī)分時(shí)操作系統(tǒng)和強(qiáng)功能檢索軟件研制成功,使脫
25、機(jī)檢索發(fā)展到聯(lián)機(jī)檢索并迅速得到了推廣。終端/主機(jī)結(jié)構(gòu),由聯(lián)機(jī)檢索中心、通訊網(wǎng)、檢索終端等三部分組成。特點(diǎn): (1) 無(wú)需委托。檢索過(guò)程是“人—機(jī)對(duì)話”式,用戶直接檢索,及時(shí)修改檢索策略。 (2) 檢索指令復(fù)雜,多為專(zhuān)業(yè)檢索人員才能熟練使用。 (3) 只對(duì)授權(quán)用戶開(kāi)放。按時(shí)計(jì)費(fèi),檢索費(fèi)用昂貴。,發(fā)展歷程,光盤(pán)檢索階段(80年代中期開(kāi)始)1985年出現(xiàn)CD-ROM數(shù)據(jù)庫(kù),利用計(jì)算機(jī)設(shè)備對(duì)只讀式光盤(pán)數(shù)據(jù)庫(kù)進(jìn)
26、行檢索。單機(jī)光盤(pán)檢索系統(tǒng):提供單用戶、單機(jī)的使用,系統(tǒng)結(jié)構(gòu)簡(jiǎn)單,但數(shù)據(jù)量少。光盤(pán)網(wǎng)絡(luò)系統(tǒng) :將光盤(pán)放在光盤(pán)塔或光盤(pán)庫(kù)中,由服務(wù)器管理運(yùn)行。一般只提供在局域網(wǎng)上檢索,如圖書(shū)館網(wǎng)、校園網(wǎng)等,網(wǎng)上用戶可以分時(shí)共享光盤(pán)數(shù)據(jù)庫(kù)的資源。特點(diǎn): (1) 系統(tǒng)配置簡(jiǎn)單,實(shí)行菜單檢索,系統(tǒng)操作簡(jiǎn)單。 (2) 光盤(pán)數(shù)據(jù)庫(kù)具有容量小的局限性、數(shù)據(jù)更新慢。,發(fā)展歷程,Internet網(wǎng)絡(luò)檢索階段(從90年代開(kāi)始)隨著互聯(lián)網(wǎng)的迅速發(fā)展及超
27、文本技術(shù)的出現(xiàn),基于B/S(瀏覽器/服務(wù)器)的檢索軟件的開(kāi)發(fā),將原來(lái)的主機(jī)系統(tǒng)轉(zhuǎn)移到Web服務(wù)器上,使B/S(瀏覽器/服務(wù)器)聯(lián)機(jī)檢索模式開(kāi)始取代以往的終端/主機(jī)結(jié)構(gòu)。特點(diǎn): (1)實(shí)現(xiàn)了任何時(shí)間、任何地點(diǎn)的檢索。 (2)操作簡(jiǎn)單,適合大眾檢索。,發(fā)展歷程,DIALOG國(guó)際聯(lián)機(jī)檢索系統(tǒng),簡(jiǎn)介 是目前世界上最大的國(guó)際聯(lián)機(jī)情報(bào)檢索系統(tǒng),覆蓋各行業(yè)的900多個(gè)數(shù)據(jù)庫(kù)。內(nèi)容涉及自然科學(xué)、社會(huì)科學(xué)、工程技術(shù)、人文科學(xué)、時(shí)事
28、報(bào)道及商業(yè)經(jīng)濟(jì)等各個(gè)領(lǐng)域。是全球最大的專(zhuān)業(yè)信息供應(yīng)商。功能 利用DIALOG系統(tǒng),可進(jìn)行項(xiàng)目查新、文獻(xiàn)調(diào)研、課題立項(xiàng)、申報(bào)專(zhuān)利、了解市場(chǎng)動(dòng)態(tài)和競(jìng)爭(zhēng)對(duì)手、新產(chǎn)品開(kāi)發(fā)、公司的背景情況、經(jīng)濟(jì)預(yù)測(cè)等等信息。,OCLC國(guó)際聯(lián)機(jī)檢索系統(tǒng),OCLC,即聯(lián)機(jī)計(jì)算機(jī)圖書(shū)館中心,創(chuàng)立于1967年,是一個(gè)不以盈利為目的、提供圖書(shū)館服務(wù)的會(huì)員制研究組織。 1991年,OCLC推出FirstSearch數(shù)據(jù)庫(kù),把原有的聯(lián)機(jī)檢索服務(wù)擴(kuò)展為綜合的、基于We
29、b的聯(lián)機(jī)參考服務(wù)系統(tǒng),目前發(fā)展成為全世界使用量最大的交互式聯(lián)機(jī)檢索系統(tǒng)。面向最終用戶,界面直觀、操作簡(jiǎn)單、提供多種語(yǔ)言界面、多種輔助檢索工具,方便非專(zhuān)業(yè)檢索人員使用。當(dāng)前利用FirstSearch可以檢索到86個(gè)數(shù)據(jù)庫(kù),內(nèi)容覆蓋15個(gè)主題范疇的各個(gè)學(xué)科領(lǐng)域。,http://www.oclc.org/asiapacific/zhcn/default.htm,4.1.2 數(shù)據(jù)庫(kù)(1) 概念數(shù)據(jù)庫(kù):指長(zhǎng)期存儲(chǔ)在計(jì)算機(jī)存儲(chǔ)設(shè)備上的、可
30、供計(jì)算機(jī)快速檢索的、有組織的、可共享的數(shù)據(jù)集合。本課程所指數(shù)據(jù)庫(kù)是指包含文獻(xiàn)信息有關(guān)數(shù)據(jù)的機(jī)讀記錄的有序集合。計(jì)算機(jī)檢索系統(tǒng)數(shù)據(jù)庫(kù):一定專(zhuān)業(yè)范圍內(nèi)信息記錄及其索引的集合體。,(2) 數(shù)據(jù)庫(kù)結(jié)構(gòu),由字段——記錄——文檔三個(gè)層次構(gòu)成,字段(Fields):組成記錄的數(shù)據(jù)項(xiàng)(檢索項(xiàng)),一個(gè)字段代表一項(xiàng)特征。,,,,計(jì)算機(jī)檢索就是通過(guò)字段檢索,查找滿足條件的記錄。,,記錄(Record):數(shù)據(jù)庫(kù)的基本信息單元,每條記錄都描述了原始信息的各項(xiàng)
31、外表特征和內(nèi)容特征。,,計(jì)算機(jī)檢索的目的就是查找符合條件的記錄。,,,,,,,,,文檔,記錄,字段,文檔(File) :是機(jī)讀記錄的有序集合,由記錄及其索引組成。,,,,,,各文檔的集合,數(shù)據(jù)庫(kù)(Database):是文檔的集合。,綜合性數(shù)據(jù)庫(kù):多按學(xué)科劃分文檔,(3) 數(shù)據(jù)庫(kù)的記錄格式,數(shù)據(jù)庫(kù),存取號(hào)字段基本索引字段 篇名字段(TI)---Title 文摘字段(AB)---Abstract
32、 關(guān)鍵詞字段(KY)---Keyword 敘詞字段(DE)---Descriptor 自由詞字段(ID)---Identifier——全文檢索輔助索引字段 著者字段 (AU)--- Author 期刊名稱字段 (JN) ---Journal 語(yǔ)種字段(LA)---Language,4.2 檢索提問(wèn)式,采用計(jì)算機(jī)信息檢索系統(tǒng)
33、規(guī)定使用的組配符號(hào)(也稱為算符)將反映不同檢索途徑的檢索單元組合在一起而形成的一種邏輯運(yùn)算表達(dá)式?!?、布爾邏輯運(yùn)算符 2、位置運(yùn)算符 3、精確檢索符 4、限制符號(hào)(截詞符),舉例:查“計(jì)算機(jī)”方面的文章 計(jì)算機(jī) or 電腦 or 微機(jī) 計(jì)算機(jī) + 電腦 + 微機(jī),檢索提問(wèn)式,4.2.1 布爾邏輯算符 把一些具有簡(jiǎn)單概念的檢索詞通過(guò)布爾邏輯算符組配成為一個(gè)具有復(fù)雜概念的檢索式,用
34、來(lái)準(zhǔn)確表達(dá)檢索提問(wèn)。 (1) 邏輯“或”:并列概念關(guān)系的一種組配,通常用 or 或 + 表示,有助于擴(kuò)大檢索范圍,提高查全率,防止漏檢?!∪纾篈 or B 、 A + B 表示它所連接的兩個(gè)檢索詞(A、B)中有任何一個(gè)出現(xiàn)在檢索結(jié)果中就滿足檢索條件。,舉例:查“分布式網(wǎng)絡(luò)系統(tǒng)”方面的文章 分布式 and 網(wǎng)絡(luò)系統(tǒng) 分布式 * 網(wǎng)絡(luò)系統(tǒng),檢索提問(wèn)式,(2) 邏輯“與”:交叉概念關(guān)系和限
35、定關(guān)系的一種組配。通常用 and 或 * 表示,可以縮小檢索范圍,提高查準(zhǔn)率,防止誤檢。 如:A and B 、 A * B 表示它所連接的兩個(gè)檢索詞(A、B)必須同時(shí)出現(xiàn)在檢索結(jié)果中才滿足檢索條件。,舉例:查不含公路運(yùn)輸?shù)慕煌ㄟ\(yùn)輸方面的文章 交通運(yùn)輸 not 公路 交通運(yùn)輸-公路,檢索提問(wèn)式,(3) 邏輯“非”:不包含某種概念關(guān)系的一種組配。通常用not或 - 表示?!∪纾篈 not B
36、 、 A - B 表示它所連接的兩個(gè)檢索詞中,應(yīng)從第一個(gè)概念中排除第二個(gè)概念。,檢索提問(wèn)式,(4) 優(yōu)先算符:( ) 可以改變布爾邏輯的正常運(yùn)算次序。 布爾邏輯運(yùn)算次序?yàn)椋?非(not)——與(and)——或(or) 例如: 大學(xué)生 or 研究生 not 就業(yè) (大學(xué)生 or 研究生) not 就業(yè) 兩者檢索結(jié)果不同。,檢
37、索提問(wèn)式,4.2.2 位置運(yùn)算符 限定“位置算符”兩邊的檢索詞出現(xiàn)在記錄中的位置。?。?)(W)算符With:要求檢索詞必須按指定順序緊密相連,詞序不可變,詞之間除允許有空格、標(biāo)點(diǎn)、連字符外,不得夾單詞或字母?!。╪W):表示連接的兩個(gè)詞之間最多可加入n個(gè)詞,詞序不可顛倒。,例如:building (W) construction :可檢出: “building construction”
38、 “building-construction” 又如:air(2W)Pollution :可檢出: “air pollution” “air environment pollution” “air and noise pollution”,檢索提問(wèn)式,檢索提問(wèn)式,(2) (N)算符Near:要求被連接的檢索詞必須緊密相連,詞序任意,詞之間
39、除允許有空格、標(biāo)點(diǎn)、連字符外,不得夾單詞或字母。 (nN)表示兩個(gè)檢索詞之間最多可加入N個(gè)詞,詞序任意。,例如: internet(N)accessing 可以檢出 “internet accessing”互聯(lián)網(wǎng)接入 “accessing internet”訪問(wèn)因特網(wǎng)又如: environment(2N)protection,可檢出: “environment protec
40、tion” “environment resource protection” “protection of environment” “protection of water environment”,檢索提問(wèn)式,(3) F算符(Field) 表示兩個(gè)檢索詞必須同時(shí)出現(xiàn)在同一個(gè)字段內(nèi),兩詞的詞序和中間插入的詞數(shù)不限?!±纾?pollution(F)control/T
41、i 表示檢索同一字段中含有pollution 和control的文獻(xiàn)。如題名字段、文摘字段、關(guān)鍵詞字段,檢索提問(wèn)式,(4) Same算符 檢索詞必須出現(xiàn)在同一句子中(指兩個(gè)句號(hào)之間的字符串),檢索詞在句子中的順序和位置是任意的?!±纾?education Same school 表示檢索某一句子中education 和 school 的文獻(xiàn)。,使用位置算符要注意的問(wèn)題:主要應(yīng)用于英文數(shù)據(jù)庫(kù)多數(shù)用于數(shù)據(jù)庫(kù)的專(zhuān)業(yè)檢索方式(需
42、輸入檢索指令的檢索)不同的數(shù)據(jù)庫(kù)用到的位置算符不一樣,使用前查看檢索提 示或相關(guān)幫助,檢索提問(wèn)式,4.2.3 精確(exact)檢索: 兩個(gè)或多個(gè)詞不能拆開(kāi),不能互換位置,中間不能插入任何字符。 提示:不同的數(shù)據(jù)庫(kù)對(duì)精確檢索的規(guī)定不一樣?!∮械氖褂谩?”、{?。?,如EI:“intelligent control” 有的使用空格,如IEE/IEEE:凵intelligent control凵; 還有一些數(shù)據(jù)庫(kù)通過(guò)特定程序控
43、制。,檢索提問(wèn)式,4.2.4 截詞符 是指用給定的詞干做檢索詞,查找含有該詞干的全部檢索詞的記錄?!?” ,或 “?”,防止漏檢,提高查全率。?。?) 無(wú)限制截詞 “ * ” 一般用于詞尾,即“ 詞干* ”,——后截?cái)啵硎驹~干后面的字符位數(shù)不受限制?!∪?economic*,可檢索: economic 、economics、economicst、economicalism , … ?!∫灿杏糜谠~中間的, ——中間截?cái)啵鐂u
44、l*ur,可檢索:sulfur、sulphur , … 也有用于詞前的, ——前截?cái)?,?magnetic,可檢索:magnetic, electro-magnetic, electromagnetic, …,檢索提問(wèn)式,(2) 有限制截詞“ ? ” 在詞尾、詞中加有限個(gè) “?”號(hào)。 n個(gè)“?”號(hào)表示添加的字符數(shù)少于等于n個(gè)?!∪纾簊mok??,可檢索:smoke, smoky, smoker, … wom?n ,可檢索:
45、woman, women。,檢索提問(wèn)式,檢索實(shí)例,1、工程造價(jià) and(控制 or 管理) 2、TI= 青藏鐵路 * AU=朱永權(quán) * AF=(石家莊鐵道大學(xué) or 石家莊鐵道學(xué)院),檢索提問(wèn)式,4.3 計(jì)算機(jī)檢索步驟,71,1、課題分析:明確檢索需求、確定查找范圍,檢索目的:大致分為三種類(lèi)型普查型 —— 需要全面收集有關(guān)某一主題的文獻(xiàn)資料,強(qiáng)調(diào)“查全率”。如查新攻關(guān)型 —— 需要收集某一特定方面的文獻(xiàn)資料,旨在解決科研生產(chǎn)中的
46、關(guān)鍵問(wèn)題。探索型 —— 了解和掌握某一領(lǐng)域的研究現(xiàn)狀,最新研究動(dòng)向和研究成果,要求查到的文章具有新穎和及時(shí)的特點(diǎn)。查找范圍:主題、學(xué)科范圍,文獻(xiàn)類(lèi)型,年限,語(yǔ)種,計(jì)算機(jī)檢索步驟,2、選擇數(shù)據(jù)庫(kù),書(shū)目數(shù)據(jù)庫(kù),文摘數(shù)據(jù)庫(kù),數(shù)據(jù)、事實(shí)數(shù)據(jù)庫(kù),WWW,……,全文數(shù)據(jù)庫(kù),計(jì)算機(jī)檢索步驟,3、確定檢索詞及檢索途徑,(1)確定檢索詞: 將所有和主題相關(guān)的關(guān)鍵詞和短語(yǔ)標(biāo)出來(lái)。如可能,查主題詞表,利用規(guī)范的檢索詞。 刪除沒(méi)有檢索意義的詞、
47、存在蘊(yùn)含關(guān)系可合并的詞 例如:研究、探討、討論、系統(tǒng)(2)選擇檢索途徑:主題詞、題名、關(guān)鍵詞、作者等,計(jì)算機(jī)檢索步驟,4、構(gòu)造檢索式,注意:在構(gòu)造檢索表達(dá)式之前一定弄清所用數(shù)據(jù)庫(kù)的檢索功能和支持的操作算符。,用布爾邏輯符、截詞符、位置符、精確符等連接檢索詞,來(lái)表達(dá)檢索詞之間的邏輯關(guān)系。,5、實(shí)施檢索,6、修改檢索策略,檢索結(jié)果過(guò)多——縮小檢索范圍檢索結(jié)果過(guò)少——擴(kuò)大檢索范圍檢索結(jié)果相關(guān)度小——修改檢索詞、檢索式,更換檢索工具
48、,7、獲取原文,a. 館藏目錄、文摘數(shù)據(jù)庫(kù)——查找原始出版物,如圖書(shū)、期刊、學(xué)位論文等b. 全文數(shù)據(jù)庫(kù)——直接下載原文c. 文獻(xiàn)傳遞——通過(guò)圖書(shū)館的原文傳遞服務(wù)d. 其他方式,計(jì)算機(jī)檢索步驟,第1步:標(biāo)出和主題相關(guān)的關(guān)鍵詞 神經(jīng)網(wǎng)絡(luò)在旋轉(zhuǎn)機(jī)械故障診斷中的應(yīng)用研究第2步:刪除不必要的檢索詞 刪除“應(yīng)用”和“研究第3步:對(duì)核心詞進(jìn)行補(bǔ)充和擴(kuò)展 神經(jīng)網(wǎng)絡(luò)——人工智能(上位詞) 故障診斷——故障定
49、位、故障檢測(cè)第4步:選擇檢索途徑 題名、關(guān)鍵詞、主題詞等。第5步:構(gòu)造檢索式(檢索詞之間的關(guān)系)DE=(神經(jīng)網(wǎng)絡(luò) or 人工智能) and TI=旋轉(zhuǎn)機(jī)械 and KY=(故障診斷 or 故障定位 or 故障檢測(cè)),課題:神經(jīng)網(wǎng)絡(luò)在旋轉(zhuǎn)機(jī)械故障診斷中的應(yīng)用研究,,,,,,,,,,,計(jì)算機(jī)檢索步驟,—以主題檢索為例,—以關(guān)鍵詞檢索為例,旋轉(zhuǎn)機(jī)械—以題名檢索為例,舉例:我國(guó)城市軌道交通經(jīng)營(yíng)模式研究,(1)分析課題,明確目的(2)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- [學(xué)習(xí)]網(wǎng)絡(luò)信息檢索基礎(chǔ)知識(shí)
- 第二節(jié)激勵(lì)理論基礎(chǔ)
- 第二節(jié) 資產(chǎn)的計(jì)稅基礎(chǔ)
- 第二節(jié)溫度的測(cè)量[知識(shí)梳理]
- 第二節(jié)
- 第二節(jié):激勵(lì)理論基礎(chǔ).doc
- 第二節(jié) 核能
- 第二節(jié)疼痛
- 第二節(jié)陶淵明
- 第二節(jié) 貧血
- 第二節(jié)物理
- 第二節(jié)功率
- 第二節(jié)功率
- 第二節(jié)血管
- 閱讀第二節(jié)
- 第二節(jié) 質(zhì)量
- 音樂(lè)基礎(chǔ)與欣賞——第二節(jié)記譜法
- 第二節(jié) 地球的運(yùn)動(dòng)
- 第二節(jié) 運(yùn)動(dòng)的描述
- 第二節(jié)臂.dwg
評(píng)論
0/150
提交評(píng)論