不確定語義檢索在專利智能服務(wù)平臺中的應(yīng)用.pdf_第1頁
已閱讀1頁,還剩65頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、專利信息是人類智慧的結(jié)晶,它幾乎囊括了一切應(yīng)用領(lǐng)域中的技術(shù)成果,涉及經(jīng)濟(jì)發(fā)展、科技創(chuàng)新和戰(zhàn)略決策等最重要的信息資源。在當(dāng)今國際市場競爭極為激烈的形勢下,專利信息是各國發(fā)展經(jīng)濟(jì)技術(shù)不可缺少的重要資源。 本文將不確定語義檢索和專利信息檢索相結(jié)合,在傳統(tǒng)基于關(guān)鍵詞檢索的基礎(chǔ)上給專利檢索賦予語義含義,以提高檢索的查準(zhǔn)率和查詢效率。本文主要工作包括如下幾點: (1)對國內(nèi)外知名專利檢索系統(tǒng)的數(shù)據(jù)結(jié)構(gòu)進(jìn)行分析,并著重研究了當(dāng)前專利檢

2、索中存在的專利檢索數(shù)據(jù)異構(gòu)分散、專利檢索準(zhǔn)確率不高等問題,同時還對數(shù)據(jù)集成和信息檢索的研究現(xiàn)狀、相關(guān)技術(shù)進(jìn)行了綜述; (2)從我國及七國兩組織專利數(shù)據(jù)結(jié)構(gòu)分析入手,提煉出各國各組織異構(gòu)專利數(shù)據(jù)組織結(jié)構(gòu)的共性,設(shè)計了通用數(shù)據(jù)轉(zhuǎn)換模型(CDTM),同時考慮專利信息的海量需求,為提高查詢速度,減輕服務(wù)器壓力,對數(shù)據(jù)庫集群技術(shù)進(jìn)行研究,并且采用Oracle數(shù)據(jù)庫集群技術(shù)將專利數(shù)據(jù)集成結(jié)果本地化; (3)對不同用戶的個性化專利檢索

3、需求進(jìn)行研究,構(gòu)建用戶興趣本體。首先,從用戶靜態(tài)和動態(tài)特征中獲取用戶興趣關(guān)鍵詞,計算關(guān)鍵詞權(quán)重,篩選出用戶關(guān)心的關(guān)鍵字,構(gòu)成用戶興趣文本,然后根據(jù)用戶興趣文本構(gòu)建用戶興趣本體。用戶興趣本體中描述了用戶感興趣的檢索詞及詞與詞之間的關(guān)系,結(jié)合領(lǐng)域本體進(jìn)行檢索,以提高檢索效率,同時用戶興趣本體在信息的推送過程中也起著重大作用; (4)以上述技術(shù)為基礎(chǔ),構(gòu)建了一個專利信息服務(wù)平臺,并依據(jù)該平臺,實現(xiàn)了對專利信息的有效查詢,同時專利數(shù)據(jù)的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論