版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、語言文字信息處理教程第一章、概論,盛玉麒山東大學(xué)中文信息研究所,第一節(jié)、信息與信息處理,(一)什么是信息(二)信息的基本屬性(三)什么是信息處理(四)語言文字的信息屬性(五)語言文字信息處理的特點(diǎn),(一)什么是信息,信息是20世紀(jì)人類最偉大的發(fā)現(xiàn)之一。對(duì)信息屬性與功能的開發(fā)和利用成為“信息化社會(huì)”的基本生產(chǎn)方式和重要的支柱產(chǎn)業(yè)。信息的屬性可以從不同的角度來認(rèn)知和歸納。信息是關(guān)于事物運(yùn)動(dòng)的狀態(tài)和方式的廣義知識(shí)。信息是與物
2、質(zhì)、能量并列的世界組成的三大要素。,(一)信息的基本屬性,1、客觀性2、符號(hào)性3、可轉(zhuǎn)換性4、可復(fù)制性5、可傳遞性6、可共享性,1、客觀性,信息是客觀事物存在的方式和狀態(tài)的總和以及人們對(duì)客觀存在的認(rèn)識(shí)。無論是從信息來源看還是從人們對(duì)信息的認(rèn)知路線與描述方式看,都需要以客觀存在為基礎(chǔ),以事物的本質(zhì)屬性與客觀實(shí)踐為判斷標(biāo)準(zhǔn)。真實(shí)反映與正確描述客觀事物的本質(zhì)屬性才是有價(jià)值的信息。,2、符號(hào)性,信息既不是物質(zhì)、也不是能量,而是關(guān)于
3、物質(zhì)和能量的存在狀態(tài)與方式,即關(guān)于物質(zhì)和能量的屬性的符號(hào)。,3、可轉(zhuǎn)換性,同一信息可采用不同的載體和表現(xiàn)形式。不同載體形式之間可以進(jìn)行轉(zhuǎn)換。同一個(gè)語義信息既可以用實(shí)物表達(dá)、也可用手勢(shì)、形體或語言的形式;既可以用文字、圖像,也可以用聲音、動(dòng)畫,各種形式都可以轉(zhuǎn)換為數(shù)碼符號(hào)。多種表現(xiàn)形式和多種載體類型都屬于廣義的符號(hào)范疇。,4、可復(fù)制性,信息可以無限制地復(fù)制,復(fù)制后的結(jié)果和原型之間無論從形式、結(jié)構(gòu)還是功能等方面看都毫無二致。,5、
4、可傳遞性,信息可以在時(shí)間和空間的范圍內(nèi)進(jìn)行傳遞。在空間范圍中的傳遞是“通信”、在時(shí)間上的傳遞就是“記憶”。,6、共享性,因?yàn)榫哂辛松鲜龌緦傩裕藗兛梢酝ㄟ^對(duì)信息的采集和控制,實(shí)現(xiàn)對(duì)客觀物質(zhì)和能量的了解與控制;通過對(duì)信息的加工與處理實(shí)現(xiàn)對(duì)物質(zhì)的改造與優(yōu)化。因此,就使得信息具有了“間接資源”或“無形資源”的共享性特點(diǎn)。,(三)什么是信息處理,1、信息的采集2、信息的存儲(chǔ)3、信息的加工4、信息的傳遞5、信息科學(xué)的產(chǎn)生,1、信
5、息的采集,文字圖形音頻視頻數(shù)據(jù),2、信息的存儲(chǔ),1、存儲(chǔ)形式:原型加工2、存儲(chǔ)介質(zhì)磁介質(zhì)光介質(zhì),3、信息的加工,修改分類排序比較查詢檢索統(tǒng)計(jì)分析特征抽取,4、信息的傳遞,人——機(jī)——人系統(tǒng)機(jī)——人——機(jī)系統(tǒng)機(jī)——機(jī)——機(jī)系統(tǒng)方式:串行并行,5、信息科學(xué)的誕生,1948年,美國數(shù)學(xué)家申農(nóng)發(fā)表《通信的數(shù)學(xué)理論》標(biāo)志著信息論的創(chuàng)立。信息論發(fā)展的三個(gè)時(shí)期:1、20世紀(jì)50年代,新創(chuàng)立的信息論向各個(gè)學(xué)科
6、的沖擊。2、20世紀(jì)60年代,劃分出狹義信息論、一般信息論、廣義信息論。3、20世紀(jì)70年代形成信息科學(xué)。4、信息科學(xué)是與電子學(xué)、計(jì)算機(jī)、自動(dòng)化技術(shù)、生物學(xué)、心理學(xué)、管理學(xué)相互聯(lián)系而形成的綜合性科學(xué),語言文字自的信息屬性,邏輯思維的符號(hào)認(rèn)知交際的媒介智力開發(fā)的工具科技發(fā)展的基礎(chǔ)文化傳承的載體信息處理的重點(diǎn)民族心理的寄托國家主權(quán)的象征,屬性1:邏輯思維的符號(hào),馬克思說過,語言是思想的直接現(xiàn)實(shí)。人類的邏輯思維離不開語言
7、,人類社會(huì)離不開語言。如果沒有語言,就不成其為人類社會(huì)。,屬性2:認(rèn)知交流的媒介,語言哲學(xué)家認(rèn)為,語言是人類認(rèn)識(shí)世界的中介。人們只有憑借語言才能了解世界,也只有通過語言才能描述對(duì)世界的認(rèn)識(shí),從而使別人了解自己。如果沒有語言,思想、認(rèn)識(shí)和經(jīng)驗(yàn)等都失去了媒介。,屬性3:智力開發(fā)的工具,語言是和智能活動(dòng)聯(lián)系在一起的。語言能力的獲得是人類進(jìn)化的關(guān)鍵一步。智力和素質(zhì)在很大程度上表現(xiàn)為語言思維和表達(dá)上。毛澤東說過,感覺到的東西不能很好的
8、認(rèn)識(shí),只有理解了的東西才能更深刻地認(rèn)識(shí)。只有首先獲得語言能力,才有可能進(jìn)一步開發(fā)大腦的智力。語言能力差而具有較高智商的人是很少見的。,屬性4:科教發(fā)展的基礎(chǔ),科技和教育是人類社會(huì)進(jìn)步和發(fā)展的動(dòng)力。其基礎(chǔ)即要依靠語言文字的記錄、表達(dá)和傳遞。無論多么先進(jìn)的理論、或者科學(xué)技術(shù),都必須獲得正確的記錄和表達(dá),才能被更多的人學(xué)會(huì)和掌握,與更多的人共享。,屬性5:文化傳承的載體,語言文字又是文化的載體,由于有了語言文字的記錄,歷史才能夠得以傳
9、承和延續(xù)。也由于有了語言文字的記錄,民族特色的文化精華才能在共時(shí)的空間中廣泛地傳播。,屬性6:信息處理的重點(diǎn),在多媒體信息網(wǎng)絡(luò)時(shí)代,在圖、文、聲、像等所有的信息媒體中,語言文字仍是信息處理的重點(diǎn)。我們社會(huì)和生活中絕大多數(shù)信息都是以語言文字的形式出現(xiàn)的??梢哉f,進(jìn)入信息時(shí)代的根本標(biāo)志就是語言文字信息的數(shù)字化。,屬性7:民族心理的寄托,語言是民族的重要構(gòu)成部分。作為民族特征和標(biāo)志的語言文字在長期的使用過程中,被賦予了豐富而深厚的內(nèi)涵
10、,成為民族心理的寄托。所謂“他鄉(xiāng)遇故知”、“鄉(xiāng)音無限情”、“母語情結(jié)”等等,都是古今共同的感情表達(dá)。,屬性8:國家主權(quán)的標(biāo)志,都德的《最后一課》為什么打動(dòng)了億萬人的心,就是因?yàn)樗麑懗隽艘粋€(gè)國家和民族的語言“情結(jié)”。任何一個(gè)主權(quán)國家都有自己法定的語言文字。所有的外交官不管外語多好,在外交場合也要使用自己國家的語言講話,因?yàn)檫@涉及到一個(gè)主權(quán)國家的獨(dú)立和尊嚴(yán)。,(五)語言文字信息處理的特點(diǎn),西文1、字母文字2、小字符集3、鍵盤基礎(chǔ)
11、4、分詞5、硬件原創(chuàng)6、軟件原創(chuàng),中文1、圖形文字2、大字符集3、沒有鍵盤基礎(chǔ)4、不分詞5、硬件引進(jìn)6、軟件漢化,(五)語言文字信息處理的理論思考,1、重要的信息載體2、不是唯一的載體3、語義信息的多維性4、語言編碼的多重性,1、信息載體,語言是載負(fù)信息的符號(hào)系統(tǒng)。著名語言學(xué)家Saussure指出,語言是一種社會(huì)慣例,是表達(dá)概念的符號(hào)系統(tǒng)。從音義結(jié)合的關(guān)系上看,語言是音義結(jié)合的符號(hào)系統(tǒng)?!罢Z言是人類社會(huì)最
12、重要的交際符號(hào)系統(tǒng)”。人與人之間交際的本質(zhì)就是進(jìn)行信息的交流和交換,,2、語言不是唯一的信息載體,語言信息的載體并不僅僅限于語音。除了語音之外,表情、手勢(shì)、姿勢(shì)、環(huán)境、相互關(guān)系、話題等等都能夠參與交際、起到信息載體的功能。這些非聲音手段的參與就使得語言的交流和交際表現(xiàn)出多信道的特點(diǎn)。,3、語義信息的多維性,(1)語言能力是人的一般認(rèn)知能力的一部分,因此語言不是一個(gè)自足的系統(tǒng),其描寫和理解都必須參照認(rèn)知過程;(2)語言結(jié)構(gòu)與人類的概
13、念知識(shí)、實(shí)踐經(jīng)驗(yàn)以及話語的功能有關(guān),并以它們?yōu)槔頁?jù);,4、語言編碼的多重性,實(shí)物代碼語音代碼文字代碼副語言代碼,實(shí)物代碼,從信息傳遞和處理的角度看,所有的實(shí)物都可以傳遞信息。即使是現(xiàn)代人在現(xiàn)實(shí)生活中也經(jīng)常使用這些非語言代碼方式進(jìn)行相互間的信息溝通。即使在正常人群的交往和交際過程中實(shí)物充當(dāng)了十分重要的腳色;教學(xué)使用的圖畫、教具、實(shí)物等幫助學(xué)生加強(qiáng)對(duì)知識(shí)的理解。,語音代碼,語音是有聲語言的重要代碼系統(tǒng)。采用語音作代碼有很多好處
14、:成本低、干擾少、可控性強(qiáng)、區(qū)別性特征靈活多樣,等等。語音代碼的基本單位是音節(jié)。作為“語言”的基本單位都是“音義結(jié)合體” 。語言系統(tǒng)中意義的最小單位就是語素。任何語言中的語素幾乎沒有小于一個(gè)音節(jié)的。,文字代碼,文字是最重要的輔助語言交際的書寫符號(hào)系統(tǒng)。文字的最大功能是將聽覺符號(hào)的代碼系統(tǒng)轉(zhuǎn)換為視覺符號(hào)的代碼系統(tǒng)。突破了有聲語言在“時(shí)間”與“空間”上的局限性,可以使語言信息傳遞得更加久遠(yuǎn)。一切成熟的文字代碼幾乎都是與語音代碼
15、具有同等的效能。,副語言代碼,“副語言代碼”形式諸如手勢(shì)、姿勢(shì)、動(dòng)作、表情等等許多非語音的成分。這些非語音成分也同樣具有載負(fù)信息的功能,同樣能夠表情達(dá)意,因此,被稱為“形體語言”。有研究表明,在人們的生活中,副語言信息代碼所傳遞的信息占一個(gè)人所獲得的全部外界信息的80%以上。,語義是一種特別的符號(hào)關(guān)系,薩丕爾認(rèn)為,語義是“一種特別的符號(hào)關(guān)系”。對(duì)語義信息的習(xí)得、傳遞、表達(dá)和交流,就是建立、描述、理解和確定各種“符號(hào)關(guān)系”。薩丕爾
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 通用規(guī)范漢字表
- 通用規(guī)范漢字表,8105
- 漢字表意度的其它幾個(gè)制約因素
- 癌痛規(guī)范化治療中的幾個(gè)問題
- 公司治理的幾個(gè)問題
- 統(tǒng)計(jì)分析軟件研制中的幾個(gè)問題.pdf
- 酸堿失衡幾個(gè)問題
- 焊評(píng)的幾個(gè)問題
- 先秦易學(xué)的幾個(gè)問題
- 產(chǎn)業(yè)重組的幾個(gè)問題
- 乳腺癌病理診斷規(guī)范中的幾個(gè)問題
- 漢字表
- 《通用規(guī)范漢字表》表外字類推簡化問題研究.pdf
- 《通用規(guī)范漢字表》增減字研究.pdf
- 混凝土結(jié)構(gòu)設(shè)計(jì)規(guī)范幾個(gè)問題的理解
- 土力學(xué)幾個(gè)問題
- 通用規(guī)范漢字表2013年帶拼音
- 磁盤分區(qū)的幾個(gè)問題
- 協(xié)商民主的幾個(gè)問題(政協(xié))
- css診治中的幾個(gè)問題
評(píng)論
0/150
提交評(píng)論