版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、自然語(yǔ)言處理已歷時(shí)幾十年了,熱潮莫過(guò)于機(jī)器翻譯。機(jī)器翻譯的熱潮過(guò)去后,語(yǔ)言處理逐漸進(jìn)入平靜、現(xiàn)實(shí)的務(wù)實(shí)階段。近期人們將目標(biāo)定在文本的自動(dòng)分摘要、信息的自動(dòng)檢索和過(guò)濾以及限定領(lǐng)域的人機(jī)對(duì)話系統(tǒng)等方面。本文介紹口語(yǔ)人機(jī)對(duì)話系統(tǒng)語(yǔ)言分析的研究。 語(yǔ)言處理中,實(shí)用性很強(qiáng)、高效的是統(tǒng)計(jì)方法。但基于規(guī)則的方法可以細(xì)致刻言?xún)?nèi)在結(jié)構(gòu)的各個(gè)方面,如果能綜合運(yùn)用情景、上下文和常識(shí)獲取語(yǔ)義特征,定領(lǐng)域的情況下,分析的準(zhǔn)確率將會(huì)顯著提高。 本文
2、根據(jù)漢語(yǔ)口語(yǔ)缺省多、插入語(yǔ)多、短句多和語(yǔ)序靈活等語(yǔ)言特點(diǎn),設(shè)計(jì)了以規(guī)則為主、結(jié)合概率信息的語(yǔ)言綜合分析方法。在漢語(yǔ)分詞和詞性標(biāo)注的基基于合一文法利用圖算法進(jìn)行部分句法分析,最后結(jié)合上下文、情景、常識(shí)率信息獲取語(yǔ)義特征。該方法有效提高了漢語(yǔ)口語(yǔ)對(duì)話系統(tǒng)語(yǔ)言分析的準(zhǔn)確同時(shí)考慮了效率和領(lǐng)域切換等實(shí)用方面的問(wèn)題。并實(shí)現(xiàn)了上海市交通信息查詢(xún)——SHJTQ,同時(shí)完成了相關(guān)的測(cè)試評(píng)價(jià)工作,從而確保了系統(tǒng)的正確性、有。 詞切分和詞性標(biāo)注方面,本
3、文通過(guò)建立索引和采用合適的Hash算法,改進(jìn)了詞組織形式,極大提高了分詞和詞性標(biāo)注的效率。從而減少系統(tǒng)實(shí)時(shí)響應(yīng)時(shí)間。句法分析方面,本文根據(jù)漢語(yǔ)口語(yǔ)特點(diǎn)進(jìn)行了如下改進(jìn)和嘗試:(1)、采用部分分析而不是常規(guī)的完全句法分析,從而有效分析含有插入語(yǔ)、缺省、語(yǔ)序變化、多個(gè)短句等不規(guī)正語(yǔ)句;(2)、采用基于合一文法的語(yǔ)法體系,通過(guò)特征校驗(yàn)限制句法規(guī)則歸約,減少句法分析的歧義;通過(guò)特征傳遞獲取短語(yǔ)的語(yǔ)義語(yǔ)法信息,以便進(jìn)一步獲取整句的語(yǔ)義特征;(3)、
4、實(shí)現(xiàn)了特征和句法規(guī)則的預(yù)編譯,使得句法知識(shí)庫(kù)具有良好的開(kāi)放性,減少了領(lǐng)域切換時(shí)所需工作量。 語(yǔ)義分析的難點(diǎn)在于如何處理缺省、指代、否定等復(fù)雜語(yǔ)言現(xiàn)象。本文從所限定的領(lǐng)域特點(diǎn)出發(fā),嘗試給出一些實(shí)用的處理方法:(1)、采用合一算法根據(jù)上下文、情景求解缺省;(2)、采用史列表方法結(jié)合語(yǔ)法語(yǔ)義限制規(guī)則求解指代;(3)、將否定分為句間否定和句中否定,根據(jù)“否定候選集—對(duì)比刪除”流程確定否定詞的具體轄域。這些方法充分利用了上下文、情景和常識(shí)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 漢語(yǔ)口語(yǔ)對(duì)話系統(tǒng)中口語(yǔ)語(yǔ)言分析.pdf
- 可移植漢語(yǔ)口語(yǔ)對(duì)話系統(tǒng)的研究.pdf
- 限定領(lǐng)域口語(yǔ)對(duì)話系統(tǒng)中的言語(yǔ)行為分析.pdf
- 口語(yǔ)對(duì)話系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 口語(yǔ)對(duì)話系統(tǒng)的移植和評(píng)價(jià).pdf
- 面向服務(wù)機(jī)器人的口語(yǔ)對(duì)話系統(tǒng)和語(yǔ)言模型技術(shù)研究.pdf
- 中級(jí)漢語(yǔ)口語(yǔ)教材中語(yǔ)言點(diǎn)的練習(xí)考察.pdf
- 漢語(yǔ)初級(jí)口語(yǔ)課堂的會(huì)話分析.pdf
- 英語(yǔ)口語(yǔ)對(duì)話
- 英語(yǔ)口語(yǔ)常用21個(gè)場(chǎng)景對(duì)話(可對(duì)照漢語(yǔ)翻譯))
- 《漢語(yǔ)會(huì)話301句》和《初級(jí)漢語(yǔ)口語(yǔ)》兩本短期漢語(yǔ)口語(yǔ)教材的比較分析.pdf
- “組合漢語(yǔ)”視野下的漢語(yǔ)作為第二語(yǔ)言口語(yǔ)教學(xué)設(shè)計(jì)研究.pdf
- 護(hù)患對(duì)話的社會(huì)語(yǔ)言學(xué)分析.pdf
- 基于LDA模型的口語(yǔ)對(duì)話系統(tǒng)領(lǐng)域分類(lèi)研究.pdf
- 自然口語(yǔ)對(duì)話計(jì)算的經(jīng)驗(yàn)研究.pdf
- 初級(jí)漢語(yǔ)口語(yǔ)教材課文研究——以《漢語(yǔ)口語(yǔ)速成》、《漢語(yǔ)口語(yǔ)》和《發(fā)展?jié)h語(yǔ)》為例.pdf
- 任務(wù)型對(duì)外漢語(yǔ)口語(yǔ)教材的語(yǔ)言要素設(shè)置研究
- 淺談OPI口語(yǔ)測(cè)試及TSC漢語(yǔ)口語(yǔ)考試對(duì)漢語(yǔ)口語(yǔ)教學(xué)的啟示.pdf
- 親子英語(yǔ)日??谡Z(yǔ)對(duì)話
- 口語(yǔ)對(duì)話系統(tǒng)中文法規(guī)則自動(dòng)推導(dǎo)研究.pdf
評(píng)論
0/150
提交評(píng)論