版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、1.MIME1.MIME郵件的編碼方式郵件的編碼方式由于每個(gè)II碼字符只占用一個(gè)字節(jié)(8個(gè)bit位),且最高bit位總為0,即II碼字符中的有真正意義的信息只是后面的7個(gè)低bit位,而傳統(tǒng)的SMTP協(xié)議又是基于II碼字符設(shè)計(jì)的,因此,一些基于傳統(tǒng)SMTP協(xié)議設(shè)計(jì)的SMTP服務(wù)器在處理郵件內(nèi)容時(shí)只取出每個(gè)字節(jié)中的7個(gè)低bit位進(jìn)行處理,而將最高bit位忽略不計(jì)。顯然,這樣的SMTP服務(wù)器在處理包含有非II碼字符的郵件內(nèi)容時(shí),會(huì)出現(xiàn)嚴(yán)重的問
2、題,這就限制了郵件中只能出現(xiàn)英文的II碼字符,而不能出現(xiàn)中文字符或二進(jìn)制數(shù)據(jù)。為了能夠在郵件內(nèi)容中包含中文、圖像或聲音等非II字符的數(shù)據(jù),人們想到了采用某種編碼方式將非II字符的數(shù)據(jù)轉(zhuǎn)換成可打印的II字符后再發(fā)送,郵件閱讀程序則按照相應(yīng)的解碼方式從郵件中還原出原始數(shù)據(jù)即可,比較常用的兩種郵件編碼方式為BASE64和Quotedprintable。后來(lái)的擴(kuò)展SMTP協(xié)議允許直接在郵件中傳遞二進(jìn)制數(shù)據(jù),而不用對(duì)它們進(jìn)行郵件編碼,人們將這種沒
3、有進(jìn)行郵件編碼的二進(jìn)制數(shù)據(jù)的郵件內(nèi)容稱為8bit編碼,為了與此相區(qū)別,人們將沒有進(jìn)行郵件編碼的純II碼字符的郵件稱為7bit編碼。MIME消息體的郵件編碼方式通過MIME消息頭中的ContentTransferEncoding頭字段指定,每種郵件編碼方式的介紹如下:—7Bit7Bit指消息體內(nèi)容全部是沒有經(jīng)過編碼的II字符。—8Bit8Bit指消息體內(nèi)容是沒有經(jīng)過編碼的原始數(shù)據(jù),且其中包含有非II字符的數(shù)據(jù)?,F(xiàn)在的郵件服務(wù)器基本上都支持
4、8Bit編碼,使用支持8Bit編碼的郵件服務(wù)器可以簡(jiǎn)化郵件的處理過程?!狟ASE64BASE64Base64是將二進(jìn)制數(shù)據(jù)轉(zhuǎn)換成可打印的II字符的一種最常見的編碼方式,它的基本原理是將一組連續(xù)的字節(jié)數(shù)據(jù)按6個(gè)bit位進(jìn)行分組,然后對(duì)每組數(shù)據(jù)用一個(gè)II字符來(lái)表示。6個(gè)bit位最多能表示26=64個(gè)數(shù)值,因此可以使用64個(gè)II字符來(lái)對(duì)應(yīng)這64個(gè)數(shù)值,這64個(gè)II字符為:“ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghi
5、jklmnopqrstuvwxyz0123456789“其中每個(gè)字符表示的數(shù)值就是該字符在上面的排列中的索引號(hào),索引號(hào)從0開始編號(hào)。假設(shè)在內(nèi)存中有如下三個(gè)連續(xù)的字節(jié)數(shù)據(jù):[01100001][01100010][01100011]將它們按6個(gè)bit位進(jìn)行分組后的形式如下:[011000][010110][001001][100011]2.2.常用字符集編碼常用字符集編碼—IIIIII碼是7位編碼,編碼范圍是0x000x7F。II字符集包
6、括英文字母、阿拉伯?dāng)?shù)字和標(biāo)點(diǎn)符號(hào)等字符。其中0x000x20和0x7F共33個(gè)控制字符。只支持II碼的系統(tǒng)會(huì)忽略每個(gè)字節(jié)的最高位,只認(rèn)為低7位是有效位。HZ字符編碼就是早期為了在只支持7位II系統(tǒng)中傳輸中文而設(shè)計(jì)的編碼。早期很多郵件系統(tǒng)也只支持II編碼,為了傳輸中文郵件必須使用BASE64或者其他編碼方式?!狦B2312GB2312GB2312是基于區(qū)位碼設(shè)計(jì)的,區(qū)位碼把編碼表分為94個(gè)區(qū),每個(gè)區(qū)對(duì)應(yīng)94個(gè)位,每個(gè)字符的區(qū)號(hào)和位號(hào)組合起
7、來(lái)就是該漢字的區(qū)位碼。區(qū)位碼一般用10進(jìn)制數(shù)來(lái)表示,如1601就表示16區(qū)1位,對(duì)應(yīng)的字符是“啊”。在區(qū)位碼的區(qū)號(hào)和位號(hào)上分別加上0xA0就得到了GB2312編碼。區(qū)位碼中0109區(qū)是符號(hào)、數(shù)字區(qū),1687區(qū)是漢字區(qū),1015和8894是未定義的空白區(qū)。它將收錄的漢字分成兩級(jí):第一級(jí)是常用漢字計(jì)3755個(gè),置于1655區(qū),按漢語(yǔ)拼音字母筆形順序排列;第二級(jí)漢字是次常用漢字計(jì)3008個(gè),置于5687區(qū),按部首筆畫順序排列。一級(jí)漢字是按照拼
8、音排序的,這個(gè)就可以得到某個(gè)拼音在一級(jí)漢字區(qū)位中的范圍,很多根據(jù)漢字可以得到拼音的程序就是根據(jù)這個(gè)原理編寫的。GB2312字符集中除常用簡(jiǎn)體漢字字符外還包括希臘字母、日文平假名及片假名字母、俄語(yǔ)西里爾字母等字符,未收錄繁體中文漢字和一些生僻字??梢杂梅斌w漢字測(cè)試某些系統(tǒng)是不是只支持GB2312編碼。GB2312的編碼范圍是0xA1A10x7E7E,去掉未定義的區(qū)域之后可以理解為實(shí)際編碼范圍是0xA1A10xF7FE。EUCCN可以理解為
9、GB2312的別名,和GB2312完全相同。區(qū)位碼更應(yīng)該認(rèn)為是字符集的定義,定義了所收錄的字符和字符位置,而GB2312及EUCCN是實(shí)際計(jì)算機(jī)環(huán)境中支持這種字符集的編碼。HZ和ISO2022CN是對(duì)應(yīng)區(qū)位碼字符集的另外兩種編碼,都是用7位編碼空間來(lái)支持漢字。區(qū)位碼和GB2312編碼的關(guān)系有點(diǎn)像Unicode和UTF8。—GBKGBKGBK編碼是GB2312編碼的超集,向下完全兼容GB2312,同時(shí)GBK收錄了Unicode基本多文種平
溫馨提示
- 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 英文電子郵件常用句式
- 支持基數(shù)-91編碼的安全電子郵件系統(tǒng).pdf
- 電子郵件禮儀及郵件管理-課件
- 信息交換用漢字編碼字符集
- 實(shí)訓(xùn)四電子郵件推廣
- 電子郵件加密
- 電子郵件的申請(qǐng)及使用
- 電子郵件報(bào)名指南
- 一種基于Unicode字符集編碼的動(dòng)態(tài)口令身份認(rèn)證技術(shù).pdf
- 電子郵件外文翻譯
- 電子郵件外文翻譯
- 電子郵件系統(tǒng)
- 我發(fā)電子郵件
- 電子郵件終端.pdf
- 電子郵件溝通規(guī)范
- 《電子郵件》教學(xué)設(shè)計(jì)及反思
- 電子郵件的證據(jù)效力
- 發(fā)電子郵件的禮儀
- 英文電子郵件范例
- 電子郵件收發(fā)管理規(guī)定
評(píng)論
0/150
提交評(píng)論