版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、如何從海量的信息中獲取有用的信息,如何從迅速爆炸的信息中及時(shí)獲取最新信息,這是檢索技術(shù)目前面臨的挑戰(zhàn)。全文檢索是現(xiàn)代信息檢索技術(shù)的一個(gè)非常重要的分支,是為解決信息的高效獲取問題而應(yīng)運(yùn)而生,它是以電子文本數(shù)據(jù)為主要處理對(duì)象,基于全文索引,使用自然語(yǔ)言進(jìn)行檢索的技術(shù)。 存在兩種基本的索引庫(kù)結(jié)構(gòu),即基于“字表”的索引庫(kù)和基于“詞表”的索引庫(kù)。在對(duì)中文全文檢索的有關(guān)技術(shù),尤其是對(duì)中文信息處理的基礎(chǔ)技術(shù):“中文分詞技術(shù)”進(jìn)行了較為深入的研
2、究后,本文提出了一種基于粒子群優(yōu)化算法(PSO)的適用于構(gòu)建全文索引的分詞方案。該分詞方案結(jié)合了“字表法”和“詞表法”的優(yōu)點(diǎn),在減少信息冗余的前提下得到準(zhǔn)確的檢索結(jié)果。 粒子群優(yōu)化算法自提出以來(lái),由于它的計(jì)算快速性和算法本身的易實(shí)現(xiàn)性,引起了國(guó)際上相關(guān)領(lǐng)域眾多學(xué)者的關(guān)注和研究,已在函數(shù)優(yōu)化、神經(jīng)網(wǎng)絡(luò)訓(xùn)練、模糊系統(tǒng)控制等領(lǐng)域取得長(zhǎng)足的發(fā)展。本文是粒子群算法在求解實(shí)際問題中的應(yīng)用。受粒了群算法解決旅行商問題的肩發(fā),本文把中文分詞問題
3、轉(zhuǎn)化成了求解最短路徑問題,并給出了其完整的建模和求解過程。精選了128條具有典型交集型歧義字段的切分例句作為測(cè)試用例,在與中科院計(jì)算所漢語(yǔ)詞法分析系統(tǒng)ICTCLAS的實(shí)驗(yàn)結(jié)果對(duì)比中,表明該分詞方案是適合于全文檢索系統(tǒng)的分詞方案。 根據(jù)本文提出的分詞算法,從實(shí)際問題出發(fā),把該分詞算法應(yīng)用于實(shí)際的FAQ(常見問題解答)全文檢索系統(tǒng)的設(shè)計(jì)中。采用面向?qū)ο蠛湍P万?qū)動(dòng)的程序設(shè)計(jì)方法,利用開源項(xiàng)目Lucene建立和實(shí)現(xiàn)全文本索引庫(kù),文中給出
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 全文檢索系統(tǒng)研究——檢索結(jié)果排序算法研究.pdf
- 基于lucene中文全文檢索系統(tǒng)的研究與實(shí)現(xiàn).pdf
- 中文全文檢索系統(tǒng)中索引的研究.pdf
- 基于Lucene的電子公文全文檢索系統(tǒng)研究與實(shí)現(xiàn).pdf
- 基于知識(shí)分詞算法的病案全文檢索系統(tǒng).pdf
- 粒子群優(yōu)化算法粒子群優(yōu)化算法簡(jiǎn)介
- 基于Lucene的蒙古文全文檢索系統(tǒng)研究與實(shí)現(xiàn).pdf
- 粒子群優(yōu)化算法粒子群優(yōu)化算法簡(jiǎn)介
- 基于混合粒子群算法的倉(cāng)儲(chǔ)系統(tǒng)優(yōu)化研究.pdf
- 基于全文檢索系統(tǒng)的文檔關(guān)聯(lián)研究與實(shí)現(xiàn).pdf
- 基于粒子群算法的超聲測(cè)溫系統(tǒng)研究.pdf
- 粒子群優(yōu)化算法在圖像檢索中的應(yīng)用.pdf
- 基于詞典與統(tǒng)計(jì)結(jié)合的中文分詞方法研究及全文檢索系統(tǒng)設(shè)計(jì).pdf
- 基于Google Desktop的教育資源庫(kù)全文檢索系統(tǒng)研究.pdf
- 基于語(yǔ)義自動(dòng)標(biāo)注算法的圖像檢索系統(tǒng)研究.pdf
- 基于詞典與統(tǒng)計(jì)結(jié)合的中文分詞方法研究及全文檢索系統(tǒng)設(shè)計(jì)
- 基于粒子群算法的查詢優(yōu)化研究與應(yīng)用.pdf
- 基于本體的語(yǔ)義全文檢索系統(tǒng)的研究.pdf
- 全文檢索系統(tǒng)的分析與設(shè)計(jì).pdf
- 微博信息檢索系統(tǒng)研究與開發(fā).pdf
評(píng)論
0/150
提交評(píng)論