漢語(yǔ)詞長(zhǎng)的計(jì)量研究.pdf_第1頁(yè)
已閱讀1頁(yè),還剩240頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、“詞”是構(gòu)成人類語(yǔ)言系統(tǒng)的基本單位,在詞的諸多特征中,“長(zhǎng)度”又是最基本且易于量化的詞匯結(jié)構(gòu)屬性特征之一。本文從共時(shí)和歷時(shí)兩個(gè)層面,運(yùn)用計(jì)量語(yǔ)言學(xué)的方法系統(tǒng)考察了漢語(yǔ)詞長(zhǎng)問題。
  本文第1、2章介紹了如何運(yùn)用計(jì)量語(yǔ)言學(xué)的理論和方法系統(tǒng)考察漢語(yǔ)詞長(zhǎng)問題。在計(jì)量語(yǔ)言學(xué)中,對(duì)于任一種語(yǔ)言結(jié)構(gòu)屬性特征,我們一般都假設(shè)其應(yīng)該滿足如下一些文本特性:“頻率分布”、“序列分布”、“協(xié)同關(guān)系”、“層級(jí)關(guān)系”、“歷時(shí)演化”。本文中,我們以詞長(zhǎng)本身所

2、具有的“頻率分布”和“序列分布”特性為基本考察面,兼具考察其系統(tǒng)特性“協(xié)同關(guān)系”和“層級(jí)關(guān)系”,并且結(jié)合漢語(yǔ)有大量歷時(shí)文本記載的優(yōu)勢(shì),考察了詞長(zhǎng)特性的“歷時(shí)演化”。
  對(duì)于漢語(yǔ)詞長(zhǎng)的“頻率分布”,我們?cè)诒疚牡?、4章進(jìn)行了考察。第3章從共時(shí)層面(現(xiàn)代漢語(yǔ))考察了漢語(yǔ)口語(yǔ)和書面語(yǔ)的詞長(zhǎng)分布問題。在這一部分中,我們主要考察了三個(gè)問題:漢語(yǔ)口語(yǔ)和書面語(yǔ)中的最佳詞長(zhǎng)測(cè)量單位、口語(yǔ)和書面語(yǔ)詞長(zhǎng)分布對(duì)比、詞長(zhǎng)與詞在語(yǔ)言單位層級(jí)中的位置的關(guān)系

3、??疾旖Y(jié)果顯示,“音節(jié)”是口語(yǔ)中最佳的詞長(zhǎng)測(cè)量單位。部件是書面語(yǔ)中最佳的詞長(zhǎng)測(cè)量單位;漢語(yǔ)口語(yǔ)和書面語(yǔ)在詞長(zhǎng)分布上存在一定差異,尤其是在短詞使用頻率上;在漢語(yǔ)書面語(yǔ)中,“詞-部件-筆畫”是符合“門策拉-阿爾特曼”定律的漢語(yǔ)語(yǔ)言單位層級(jí);漢語(yǔ)口語(yǔ)和書面語(yǔ)存在交互效應(yīng),現(xiàn)代漢語(yǔ)口語(yǔ)受到了書面語(yǔ)的較大影響。
  本文第4章從歷時(shí)層面考察了漢語(yǔ)詞長(zhǎng)分布問題。在這一部分中,我們運(yùn)用不同計(jì)量方法分別進(jìn)行了近一千年(分4個(gè)時(shí)段,大語(yǔ)料庫(kù))和近兩

4、千年(分6個(gè)時(shí)段,小語(yǔ)料庫(kù))漢語(yǔ)文本詞長(zhǎng)分布演化的考察。兩種不同考察的結(jié)果都顯示,漢語(yǔ)詞長(zhǎng)分布有著非常顯著的歷時(shí)演化規(guī)律,即詞長(zhǎng)分布越來(lái)越趨于“鐘形分布”,平均詞長(zhǎng)增加。進(jìn)一步,基于詞長(zhǎng)與其它語(yǔ)言結(jié)構(gòu)特性的“協(xié)同關(guān)系”考察顯示,漢語(yǔ)詞長(zhǎng)的演化不是孤立的,而是發(fā)生在一個(gè)自組織的語(yǔ)言系統(tǒng)中的:詞長(zhǎng)與詞頻相互依賴,協(xié)同演化;詞長(zhǎng)演化也引起了整個(gè)詞匯系統(tǒng)甚至語(yǔ)言系統(tǒng)的演化;詞長(zhǎng)的演化是在“省力原則”控制下的,詞長(zhǎng)的演化促進(jìn)了語(yǔ)言交流效率的提高。

5、
  對(duì)于漢語(yǔ)詞長(zhǎng)的“序列分布”,本文在第5章進(jìn)行了考察??疾旆止矔r(shí)和歷時(shí)兩部分。總起來(lái)說(shuō),考察結(jié)果顯示:漢語(yǔ)口語(yǔ)和書面語(yǔ)具有相同的詞長(zhǎng)動(dòng)鏈分布模型;從詞長(zhǎng)動(dòng)鏈長(zhǎng)度分布的總體分布趨勢(shì)來(lái)看,它與詞長(zhǎng)分布的情況非常相似,所以,詞長(zhǎng)動(dòng)鏈長(zhǎng)度分布確實(shí)繼承了詞長(zhǎng)分布的一些特性。為了進(jìn)一步考察漢語(yǔ)詞長(zhǎng)序列的歷時(shí)演化,我們又使用了N-gram詞長(zhǎng)熵的方法??疾祜@示,N-gram詞長(zhǎng)熵主要受到了詞長(zhǎng)分布的影響,且詞長(zhǎng)序列在越長(zhǎng)距離上會(huì)表現(xiàn)出越高的

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論