版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、專利大數(shù)據(jù)已成為國(guó)內(nèi)外科學(xué)研究、商業(yè)情報(bào)分析以及精準(zhǔn)創(chuàng)新創(chuàng)業(yè)的重要基礎(chǔ)性資源,實(shí)現(xiàn)專利數(shù)據(jù)高質(zhì)量的數(shù)據(jù)清洗目標(biāo)以提高對(duì)該資源的利用效率具有重要意義。然而,由于漢字及其輸入法特性,我國(guó)專利數(shù)據(jù)中的著錄項(xiàng)信息清洗存在其特有的難點(diǎn),其中發(fā)明家姓名消歧是最急需解決的關(guān)鍵性問題。在使用漢字輸入法向?qū)@麛?shù)據(jù)庫(kù)中輸入專利信息時(shí),可能把專利數(shù)據(jù)中的發(fā)明家名字輸入錯(cuò)誤而產(chǎn)生姓名歧義(同音字和形近字歧義),從而導(dǎo)致專利數(shù)據(jù)質(zhì)量的降低。在以專利創(chuàng)新為背景的前
2、提下,一些高科技創(chuàng)新企業(yè)可能因?yàn)閷@麛?shù)據(jù)質(zhì)量的降低而影響對(duì)優(yōu)秀發(fā)明家的培養(yǎng)、辨別和他們之間的合作關(guān)系考察,從而會(huì)弱化資源的合理配置功能。
應(yīng)用專利數(shù)據(jù)中發(fā)明家信息做專利數(shù)據(jù)分析時(shí),首先需要對(duì)發(fā)明家姓名的歧義進(jìn)行檢查和糾正。因?yàn)閷@麛?shù)據(jù)中發(fā)明家名字的含糊性為實(shí)現(xiàn)高質(zhì)量的數(shù)據(jù)清洗目標(biāo)產(chǎn)生障礙,從而會(huì)導(dǎo)致企業(yè)的準(zhǔn)確性決策、低成本投入、研發(fā)方向選擇產(chǎn)生一定的偏差。對(duì)于專利信息中發(fā)明家姓名歧義問題,國(guó)外研究已經(jīng)比較成熟,形成了形形色色的
3、發(fā)明家消歧算法,但是對(duì)于中文發(fā)明家姓名消歧的研究鮮有涉及,由于中英文語(yǔ)言文字在邏輯結(jié)構(gòu)、詞語(yǔ)分布特征以及使用習(xí)慣等方面有著較大差異,國(guó)外專利數(shù)據(jù)清洗算法已不能夠適用于中文專利數(shù)據(jù)中發(fā)明家信息的清洗需求。
本文通過對(duì)國(guó)內(nèi)外姓名消歧以及英文發(fā)明家姓名消歧算法的回顧,主要從中國(guó)漢字的特殊性出發(fā),設(shè)計(jì)了一套高效、科學(xué)的姓名消歧算法來解決中國(guó)專利數(shù)據(jù)中存在的發(fā)明家歧義。主要貢獻(xiàn)是基于專利著錄項(xiàng)組合相似度的發(fā)明家姓名消歧算法和基于綜合集成
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 發(fā)明家的故事
- 小小發(fā)明家
- 有心父親煉就了小發(fā)明家
- 第四屆中國(guó)專利山東優(yōu)秀發(fā)明家申報(bào)表
- 繪畫《小發(fā)明家的畫展》大班
- 漢語(yǔ)人名消歧算法研究.pdf
- 中文人名消歧算法研究.pdf
- 基于語(yǔ)義指紋的中文文獻(xiàn)著者姓名消歧方法研究.pdf
- 我國(guó)發(fā)明專利價(jià)值評(píng)估研究.pdf
- 江蘇省第五屆青少年發(fā)明家評(píng)選結(jié)果公示
- 基于唯一性特征的中文論文作者姓名消歧實(shí)證研究.pdf
- 發(fā)明與專利考試專利
- 基于兩階段聚類的人名消歧算法研究.pdf
- 漢語(yǔ)詞義消歧研究.pdf
- 職務(wù)發(fā)明創(chuàng)造中發(fā)明人權(quán)益保障研究.pdf
- 基于結(jié)構(gòu)數(shù)據(jù)的多模式智能問答消歧系統(tǒng).pdf
- 基于專利維持?jǐn)?shù)據(jù)的國(guó)內(nèi)外發(fā)明專利質(zhì)量比較研究
- 中藥發(fā)明專利
- 基于專利數(shù)據(jù)的“985工程”高校發(fā)明專利生存時(shí)間影響因素研究.pdf
- 人名消歧關(guān)鍵技術(shù)研究.pdf
評(píng)論
0/150
提交評(píng)論