版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、由于科學(xué)技術(shù)的快速發(fā)展、文獻出版周期的大大縮短,文獻成果目前呈現(xiàn)數(shù)量龐大、主題多樣的特點,在這樣情況下,如何快速獲取當(dāng)前領(lǐng)域的研究熱點、把握研究趨勢是擺在科研工作者及科研部門面前亟待解決的問題,也是數(shù)字圖書館需要解決的難題。數(shù)字圖書館作為知識經(jīng)濟實現(xiàn)的基礎(chǔ)設(shè)施,是國民經(jīng)濟運行不可缺少的必要條件;同時作為社會的公共信息存儲中心、信息中轉(zhuǎn)站,數(shù)字圖書館為社會公眾提供綜合的信息服務(wù),發(fā)揮著素質(zhì)教育、文化保護與傳播的作用。數(shù)字圖書館自上世紀(jì) 9
2、0 年代提出并付諸實施以來,經(jīng)歷了近 20 年的理論研究及其實踐發(fā)展,現(xiàn)已進入相對成熟的階段,對其學(xué)術(shù)成果進行主題分析,將有助于發(fā)現(xiàn)學(xué)術(shù)發(fā)展脈絡(luò)、學(xué)術(shù)熱點及學(xué)術(shù)發(fā)展趨勢,有利于學(xué)者尋找新的研究切入點,也有助于延續(xù)和提升數(shù)字圖書館生命力與活力。LDA(Latent Dirichlet Allocation)作為一種經(jīng)典有效的概率生成模型,包含文本-主題-詞項三層貝葉斯結(jié)構(gòu),能挖掘出文本中的潛在語義信息,已在文本分類、信息檢索、情感分析、話
3、題挖掘等領(lǐng)域廣泛應(yīng)用,在科技文獻主題發(fā)現(xiàn)與演化研究中的作用也日益凸顯。同時,科技文獻中的題目、摘要、關(guān)鍵詞是一篇文獻的重要組成部分,通常代表了作者對文章內(nèi)容要點的濃縮和總結(jié),在進行文獻主題分析時能發(fā)揮巨大作用。遺憾的是,現(xiàn)有數(shù)字圖書館相關(guān)主題研究未能重視和利用這些元素。本文利用LDA模型對2007-2016近十年的國內(nèi)數(shù)字圖書館研究論文進行內(nèi)容挖掘,分析其主題結(jié)構(gòu),揭示熱點主題及主題演化過程,最后結(jié)合實際背景對演化結(jié)果進行討論,以期為數(shù)
4、字圖書館的相關(guān)研究及工作開展提供參考與支持,進而促進數(shù)字圖書館的健康發(fā)展。
具體內(nèi)容如下:(1)總結(jié)現(xiàn)有的主題識別演化分析方法,從基本原理、研究現(xiàn)狀、優(yōu)缺點等方面對這些方法進行詳細(xì)分析。對利用LDA進行建模的完整過程進行研究(其中包括:Gibbs參數(shù)估計方法、最優(yōu)主題數(shù)確定方法、基于信息熵的主題過濾技術(shù)、熱點主題選取方法、后離散主題演化方式以及主題演化度量方法等)。將其中關(guān)鍵問題進行提煉研究,在此基礎(chǔ)上提出了一種基于主題強度聚
5、類的主題趨勢的識別分析方法。(2)選取國內(nèi)數(shù)字圖書館2007-2016十年的期刊論文,引入時間因素,運用LDA對其進行主題演化分析,識別出數(shù)字圖書館研究的主題結(jié)構(gòu)(用戶研究、建設(shè)對策、評價研究、信息服務(wù)、教育與培訓(xùn)、知識管理、資源組織、資源共享、版權(quán)研究、移動圖書館、資源存儲與安全、領(lǐng)域研究述評、應(yīng)用技術(shù)研究、云計算下的數(shù)字圖書館),可以作為數(shù)字圖書館研究人員以及數(shù)字圖書館管理人員、建設(shè)人員的決策實施參考方案。(3)利用上述同樣數(shù)據(jù),通
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 數(shù)字圖書館的知識發(fā)現(xiàn)研究.pdf
- 基于主題圖的數(shù)字圖書館知識組織研究.pdf
- 基于數(shù)字圖書館用戶日志的學(xué)術(shù)熱點分析與發(fā)現(xiàn)方法研究.pdf
- 數(shù)字圖書館與傳統(tǒng)圖書館關(guān)系新探
- 基于圖書館權(quán)利與圖書館倫理的圖書館自律制度研究.pdf
- 煤炭數(shù)字圖書館暨安全生產(chǎn)數(shù)字圖書館
- 數(shù)字圖書館中基于主題層次的瀏覽技術(shù)研究.pdf
- 基于LDA模型的圖書館文獻分類系統(tǒng)設(shè)計與開發(fā).pdf
- 基于Hadoop的數(shù)字圖書館構(gòu)建研究.pdf
- 數(shù)字圖書館的研究與開發(fā).pdf
- 基于主題圖的數(shù)字圖書館信息資源整合研究.pdf
- 數(shù)字圖書館資源主題信息門戶的設(shè)計與實現(xiàn)研究.pdf
- 國內(nèi)數(shù)字圖書館集成檢索系統(tǒng)發(fā)展對策研究
- 國內(nèi)數(shù)字圖書館集成檢索系統(tǒng)發(fā)展對策研究.pdf
- 基于主題圖的數(shù)字圖書館個性化服務(wù)模式研究.pdf
- 數(shù)字圖書館發(fā)展與建設(shè)全軍醫(yī)學(xué)數(shù)字圖書館對策探討.pdf
- 基于高等院校圖書館服務(wù)計劃的數(shù)字圖書館系統(tǒng)的設(shè)計與實現(xiàn).pdf
- 高臺縣圖書館數(shù)字圖書館建設(shè)
- 數(shù)字圖書館門戶研究.pdf
- 基于情景信息的數(shù)字圖書館服務(wù)研究.pdf
評論
0/150
提交評論