基于CRF模型的初等數(shù)學(xué)問題命名實體的識別.pdf_第1頁
已閱讀1頁,還剩81頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、近年來,人工智能領(lǐng)域機(jī)器學(xué)習(xí)、深度學(xué)習(xí)技術(shù)的發(fā)展使語音識別、圖像識別取得了巨大的成功,因此人工智能技術(shù)越來越受到國內(nèi)外專家學(xué)者的關(guān)注,而知識推理是機(jī)器學(xué)習(xí)、深度學(xué)習(xí)研究又是最重要、最核心的問題。因此基于知識推理的863課題“類人求解系統(tǒng)”相繼被提出。然而在初等數(shù)學(xué)領(lǐng)域的類人解題系統(tǒng)進(jìn)行知識推理的基礎(chǔ)是數(shù)學(xué)知識的正確獲取,然后才能進(jìn)行準(zhǔn)確的推理。所以本文從理論和實踐兩方面重點(diǎn)研究了如何正確高效的抽取數(shù)學(xué)領(lǐng)域的知識點(diǎn)。本文主要進(jìn)行了以下幾個

2、方面的研究。
  1、基于自動解題的初等數(shù)學(xué)問題的相關(guān)研究
  首先通過分析初等數(shù)學(xué)語言的特點(diǎn)和基于自動求解初等數(shù)學(xué)問題的知識表示本文確定了以命名實體的方式進(jìn)行知識的抽取。因為應(yīng)用于解題的數(shù)學(xué)實體沒有相關(guān)的研究,所以本文依據(jù)幾何和代數(shù)知識的具體特點(diǎn)確定了基于解題需要的數(shù)學(xué)命名實體的類別。
  2、提出了新的基于解題的初等數(shù)學(xué)命名實體標(biāo)注方法
  由于代數(shù)和幾何實體的特點(diǎn)不同以及代數(shù)部分實體長度較長、實體邊界判斷容

3、易出錯的原因,本文針對于代數(shù)部分提出了新的6詞位實體標(biāo)注法。通過實驗的方法證明了代數(shù)部分6詞位標(biāo)注方法效果要好于4詞位和2詞位的標(biāo)注方法。
  3、提出了自動生成詞典的實體識別后處理方法
  因為基于統(tǒng)計方法的命名實體的識別并不能達(dá)到100%的正確率,而解題需要完全正確的知識才能保證推理的正確。根據(jù)幾何和代數(shù)部分實體的詞形構(gòu)造的特點(diǎn),本文在統(tǒng)計模型識別之后添加了自動生成詞典的識別后處理算法,大大的提高了實體識別的效果,也解決

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論