版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、多語種域名及中文域名技術(shù)發(fā)展狀況報告,中國互聯(lián)網(wǎng)絡(luò)信息中心 毛偉China Internet Network Information Center (CNNIC)cdnwg@cnnic.net.cn,1,提 綱,多語種域名的需求多語種域名相關(guān)組織介紹多語種域名中的技術(shù)難點中文域名面臨的問題多語種域名的解決方案中文域名的解決方案ICANN相關(guān)工作介紹,多語種域名的需求,1. 網(wǎng)絡(luò)主機名管理的三個階段: (
2、1) IP 地址(一維) ? 主機表(二維) ? 域名系統(tǒng)(樹狀分層結(jié)構(gòu)) (2) 整個域名系統(tǒng)的高效性、健壯性、穩(wěn)定性、可靠性證明了該項技術(shù)的巨大成功,并且它在網(wǎng)絡(luò)中的基礎(chǔ)性地位,確立了它在互聯(lián)網(wǎng)中的重要性2. 多語種域名的需求 (1) 一個十分“簡單”的需求:在域名系統(tǒng)中支持多種語言、文字、字符。 (2) 起因:現(xiàn)行的域名系統(tǒng)只允許ASCII、數(shù)字和“-”連字符,而互聯(lián)網(wǎng)已經(jīng)發(fā)展成為全世界的共同財富
3、,各國語言文字和字符不斷涌現(xiàn)在網(wǎng)絡(luò)中,逐漸一些重要的互聯(lián)網(wǎng)絡(luò)協(xié)議開始支持多語言文字。一種聲音由弱到強:從互聯(lián)網(wǎng)的底層支持多語言,使互聯(lián)網(wǎng)成為真正的、沒有語言障礙的、全球共享的 Internet,3,多語種域名相關(guān)組織介紹,IETF IDN 工作組 1999.11 第46屆 IETF 會議成立 IDN BOF,開始討論多語種域名問題。CDNC (Chinese Domain Name Consortium)
4、 CNNIC、TWNIC、HKNIC、MONIC于2000年5月20日在北京共同倡議成立了中文域名協(xié)調(diào)小組(簡稱CDNC)JET (Joint engineer team) JET多語種域名技術(shù)小組于2000 年7月在日本成立,成員單位有中國CNNIC、日本JPNIC、中國臺灣TWNIC、韓國KRNIC。探討解決漢字域名的相關(guān)問題。ICANN (The Internet Corporation fo
5、r Assigned Names and Numbers),4,多語種域名中的技術(shù)難點(1),1. 多語種域名體系與ASCII域名系統(tǒng)的兼容性問題 (1) 在探討多語種域名的實現(xiàn)過程中,無法回避的一個重要問題是: 現(xiàn)行的、主機數(shù)量龐大的ASCII域名體系是整個互聯(lián)網(wǎng)的基礎(chǔ),并且它本身穩(wěn)定、高效、可靠地運行著。 (2) 對現(xiàn)行ASCII域名體系的任何損害,都可能導致多語種域名體系技術(shù)的徹底失敗2. 多語種域名的編碼
6、表示問題 (1) 全世界有幾百種語言和文字,同一種語言文字可能有多種不同的編碼方式 (如:漢字編碼 GB2312 GB18030 GB13000) (2) Unicode 成為唯一的一種可供選擇的全球統(tǒng)一編碼方式,但它是為了解決文字顯示問題而設(shè)計的,與多語種域名體系設(shè)計需求不完全統(tǒng)一,5,多語種域名中的技術(shù)難點(2),3. 多語種域名的技術(shù)實現(xiàn)問題 (1) 域名系統(tǒng)包括兩個分離的部分: resolver(解析器
7、), server(DNS服務(wù)器), 它們分別位于用戶操作系統(tǒng)和域名服務(wù)器上,問題的關(guān)鍵是:如何使它們能夠識別多語種域名? (2) 由于域名系統(tǒng)在網(wǎng)絡(luò)應(yīng)用中的基礎(chǔ)性地位,這決定了:讓resolver(解析器)能夠識別多語種域名 ? 意味著要求包括操作系統(tǒng)在內(nèi)的所有網(wǎng)絡(luò)應(yīng)用程序必須升級;讓server(DNS服務(wù)器)能夠識別多語種域名 ? 意味著要求所有域名服務(wù)器都必須升級4. 多語種域名的最終部署問題
8、域名系統(tǒng)在網(wǎng)絡(luò)中的巨大成功,成為多語種域名問題的重要障礙。對現(xiàn)行域名系統(tǒng)的任何一點修改,對整個互聯(lián)網(wǎng)絡(luò)來說都是巨大的、難以忽視的,甚至是致命的。,6,中文域名面臨的問題(1-1),1. 中文域名繁簡漢字等效問題(1) 問題的規(guī)?!逗喕挚偙怼罚▏艺Z委1986)中的繁簡體漢字對有2237對,它覆蓋了我們中文域名數(shù)據(jù)庫中 83.6% 的域名。(如果包括1:N,N:1的約238個高頻字以及部分未收入到總表中的字,它覆蓋中文域名數(shù)據(jù)庫
9、中90%以上的域名)(2) 注冊問題 – (用戶權(quán)益保護問題) 例如: 清華大學({清,淸}{華,華}{學,學}) -> [清華大學] [清華大學] [清華大學] [清華大學] [淸華大學] [淸華大學] [淸華大學] [淸華大學] -> 中文用戶必須注冊八個中文域名,才能真正保護自己的域名。 這不僅僅是用戶經(jīng)濟利益的問題,而且用戶可能將面臨無休止的域名爭議和法律糾紛。,7,(3) 兩岸
10、四地互聯(lián)網(wǎng)在中文域名體系下的互通問題 如果不處理中文域名中的繁體漢字和簡體漢字問題,中文域名互聯(lián)網(wǎng)將被分割為兩個無法通訊的部分:簡體中文域名區(qū)域(中國大陸),繁體中文域名區(qū)域(臺灣、香港、澳門及海外華人)(4) 中文域名授權(quán)問題 例如: “學.華.國.cn”, 它將產(chǎn)生 2*2*2=8 種變體中文域名。 如果不解決此問題,中文域名的授權(quán)管理中將存在嚴重的同步問題,勢必導致那些基于域名層次結(jié)構(gòu)的網(wǎng)絡(luò)應(yīng)用歸于失
11、敗。 (例如:學.華.國.cn) 解析結(jié)果不確定,將導致域名服務(wù)的失敗。,中文域名面臨的問題(1-2),8,中文域名面臨的問題(2),2. 中文句號“?!迸c英文句號“.” 在中文域名中的等效問題 “?!钡韧凇?”成為中文域名的分割符號,9,提 綱,多語種域名的需求多語種域名相關(guān)組織介紹多語種域名中的技術(shù)難點中文域名面臨的問題多語種域名的解決方案中文域名的解決方案ICANN相關(guān)工作介紹,解
12、決方案要求,不損害現(xiàn)行ASCII 域名體系、保障網(wǎng)絡(luò)整體安全多語種域名體系必須兼容現(xiàn)有的 ASCII 域名系統(tǒng),11,多語種域名相關(guān)技術(shù)比較,1. EDNS (1) 技術(shù)核心: 擴展DNS協(xié)議,以特定的數(shù)據(jù)包格式來區(qū)分ASCII域名和多語種域名 (2) 障礙: 要求全面升級現(xiàn)行的域名服務(wù)器和網(wǎng)絡(luò)應(yīng)用程序2. UTF-8 (1) 技術(shù)核心: 建立新的多語種域名協(xié)議,以支持多語種域名的使用 (2) 障
13、礙: 要求全面升級現(xiàn)行的域名服務(wù)器和網(wǎng)絡(luò)應(yīng)用程序3. ACE (1) 技術(shù)核心: 不改變現(xiàn)有ASCII域名協(xié)議,將多語種域名用ASCII來表示,在互聯(lián)網(wǎng)上傳播 (2) 障礙: 要求全面升級現(xiàn)行的網(wǎng)絡(luò)應(yīng)用程序,12,多語種域名解決方案,13,多語種域名技術(shù)解決方案,在第 51th IETF minneapolis 會議上,確立了將各國語言文字轉(zhuǎn)換為 ASCII碼的具體技術(shù)方案:IDNA 為多語種域名標準協(xié)議的框
14、架Nameprep 字符處理功能模塊選擇 AMC-Z-ACE(Punycode) 編碼算法,,Nameprep ( 依NFKC規(guī)則,規(guī)范化字符 ),AMC-Z-ACE ( Puny code 將Unicode字符轉(zhuǎn)換成 ASCII字符 ),,,IDNA,,本地化字符的 Unicode 編碼,Nameprep 字符處理功能模塊,,Mapping 字符映射,Normalization 字符歸一化,prohibited 字符禁止,N
15、ameprep,,,A a,0000-002C; 002E-002F; 003A-0040; 005B-0060; 007B-007F;,14,"a"+"^" ="â",通過CDNC的共同努力,其中規(guī)定禁止在多語種域名中出現(xiàn)“?!保埂??!庇成錇椤?”成為可能,AMC-Z-ACE (Punycode)編碼算法,“鋁鈣”的Unicode碼點:{U+94DD,
16、 U+9499}AMC-Z-ACE (Punycode) 編碼: “i74a5e”加上多語種域名前綴后的ACE字符串:“zq--i74a5e” DNS Server 存儲和用戶解析請求的都是這種ACE編碼表示的多語種域名。 (ASCII code encoding ),15,draft-guonian-idn-ace-eval-cn-00.txt,我們對IETF IDN工作組中提出的所有ACE編碼算法進行了壓縮效率
17、的評估,發(fā)現(xiàn)AMC-ACE-Z (Punycode)算法對中文漢字域名的編碼效率最高;日本/韓國的評估結(jié)果顯示AMC-ACE-W / AME-ACE-M對本國文字的編碼效率最高;經(jīng)過我們的努力和協(xié)調(diào),AMC-ACE-Z算法成為IDN 工作組的推薦ACE編碼技術(shù)方案。 [RACE], [BRACE], [LACE], [UTF6], [DUDE], [AMC-ACE-M],[AltDUDE], [AMC-ACE-O],
18、[AMC-ACE-R], [AMC-ACE-V], [AMC-ACE-W], [AMC-ACE-Z], [MACE], [LDUDE].,16,加載Punycode 數(shù)據(jù),,IDNA - 技術(shù)實現(xiàn)框架,17,17,用戶輸入多語種域名,將本地編碼轉(zhuǎn)換為 Unicode 編碼,,,IDNA,,Punycode 編碼,,應(yīng)用程序-支持多語種域名,DNS server,Application server如: Email server
19、 Web server,,,,,提 綱,多語種域名的需求多語種域名相關(guān)組織介紹多語種域名中的技術(shù)難點中文域名面臨的問題多語種域名的解決方案中文域名的解決方案ICANN相關(guān)工作介紹,中文域名技術(shù)解決方案,應(yīng)用層解決方案 (client solution)技術(shù)實現(xiàn)框架技術(shù)障礙和優(yōu)勢域名服務(wù)器解決方案 (server solution)技術(shù)實現(xiàn)框架技術(shù)障礙和優(yōu)勢注冊解決方案 (registration so
20、lution)技術(shù)實現(xiàn)框架技術(shù)障礙和優(yōu)勢示例,19,,應(yīng)用層解決方案 - 技術(shù)實現(xiàn)框架draft-deng-idn-icdn-00.txt,20,20,用戶輸入中文域名,將漢字編碼轉(zhuǎn)換為 Unicode 編碼,,,IDNA,,Punycode 編碼,中文域名繁簡轉(zhuǎn)換,,,應(yīng)用程序-支持中文域名,DNS server,Application server如: Email server Web server,,,加載
21、Punycode 數(shù)據(jù),,,應(yīng)用層解決方案 - 技術(shù)障礙和優(yōu)勢,1. 技術(shù)障礙 (1) 要求所有網(wǎng)絡(luò)應(yīng)用程序都進行升級以支持中文繁簡處理和未來的多語種域名協(xié)議 (2) 給操作系統(tǒng)開發(fā)商、中文應(yīng)用軟件開發(fā)商帶來較重的負擔2. 技術(shù)優(yōu)勢 不會影響到整個互聯(lián)網(wǎng)的基礎(chǔ)結(jié)構(gòu);使ASCII域名到中文域名的過渡,不損害目前網(wǎng)絡(luò)的穩(wěn)定性、可靠性、安全性,21,DNS server,,域名服務(wù)器解決方案- 技術(shù)實現(xiàn)框
22、架,22,22,用戶輸入中文域名,將漢字編碼轉(zhuǎn)換為 Unicode 編碼,,,IDNA,,Punycode 編碼,中文域名繁簡轉(zhuǎn)換,,應(yīng)用程序-支持中文域名,Application server如: Email server Web server,,,加載Punycode 數(shù)據(jù),,,域名服務(wù)器解決方案 - 技術(shù)障礙和優(yōu)勢,1. 技術(shù)障礙 (1) 要求中文域名服務(wù)器進行升級以支持中文繁簡處理和未來的多語種域名協(xié)議
23、 (2)要求所有網(wǎng)絡(luò)應(yīng)用程序都進行升級以支持未來的多語種域名協(xié)議 (3)影響到基礎(chǔ)網(wǎng)絡(luò)的域名解析服務(wù)2. 技術(shù)優(yōu)勢 中文域名的任何技術(shù)發(fā)展和升級都可以在服務(wù)器端實現(xiàn),不影響用戶操作系統(tǒng),23,注冊解決方案,draft-jseng-idn-admin-00.txt 三列字表:有效字、建議字、變體字 注冊記錄將保留:全繁、全簡、原型,加載Punycode 數(shù)據(jù),,注冊解決方案- 技術(shù)實現(xiàn)
24、框架,25,25,用戶輸入中文域名,將漢字編碼轉(zhuǎn)換為 Unicode 編碼,,,IDNA,,Punycode 編碼,中文域名繁簡冗余數(shù)據(jù),,應(yīng)用程序-支持中文域名,DNS server,Application server如: Email server Web server,,,,,注冊解決方案 - 技術(shù)障礙和優(yōu)勢,1. 技術(shù)障礙 (1) 由于一個中文域名可能含有多個繁體或簡體的中文域名,這導致中文域名出現(xiàn)嚴重的授
25、權(quán)問題,使中文域名的樹狀體系結(jié)構(gòu)變得“肥胖” (2) 使一些非常依賴中文域名層次結(jié)構(gòu)的網(wǎng)絡(luò)應(yīng)用程序,最終歸于失敗2. 技術(shù)優(yōu)勢 不會影響現(xiàn)行的域名服務(wù),26,注冊解決方案 – 示例,例如:用戶注冊中文域名: 清華大學 ({清,淸}{華,華}{學,學}) 產(chǎn)生的8個繁簡變體域名 [清華大學] [清華大學] [清華大學] [清華大學] [淸華大學] [淸華大學] [淸華大學] [淸
26、華大學]為注冊用戶保留所有8個變體域名,同時將 簡體 [清華大學] 繁體 [淸華大學] 加入中文域名解析數(shù)據(jù)庫, 用戶注冊的原型 [清華大學] 并提供域名解析服務(wù)上述三個變體中文域名將被同時授權(quán)給同一個用戶,如果用戶要用配置自己的中文域名服務(wù)器、中文郵件服務(wù)器,他必須同時配置三個一致的服務(wù)體系
27、。,27,,draft-ietf-idn-TSconv-00.txt,首次在IETF IDN工作組中,提出繁簡體漢字轉(zhuǎn)換問題,并就繁簡體漢字轉(zhuǎn)換問題的概念、范疇進行了具體闡述。 漢字繁簡體漢字的轉(zhuǎn)換,包括:1 1 (鋼鋼),1 n (圖圖図),1 n+1 (臺臺臺颱) 等多種復(fù)雜情況,29,draft-ietf-idn-tsconv-02.txt中提出的技術(shù)實現(xiàn)方案,,用戶輸入域名,Namep
28、rep (依NFKC規(guī)則,規(guī)范化字符),AMC-Z-ACE (將Unicode字符轉(zhuǎn)換成 ASCII字符),對本地化字符進行 Unicode 編碼,,,,,依據(jù)《簡化字總表》進行繁簡漢字等效轉(zhuǎn)換,,發(fā)向域名服務(wù)器,30,draft-ietf-idn-tsconv-03.txt中提出的技術(shù)實現(xiàn)方案,,用戶輸入域名,Nameprep (依NFKC規(guī)則,規(guī)范化字符),AMC-Z-ACE (將Unicode字符轉(zhuǎn)換成 ASCII字符),對本地
29、化字符進行 Unicode 編碼,,,,,Validation 校驗,,依據(jù)《簡化字總表》進行繁簡漢字等效轉(zhuǎn)換,,31,CDNC和CNNIC在多語種域名標準方面所作的工作,先后向 IETF 提交 7 項國際域名標準方面的技術(shù)建議:draft-guonian-idn-ace-eval-cn-00.txt (50th IETF 會議)draft-ietf-idn-TSconv-00.txt (50th IETF會議,CDNC合作提出)
30、draft-deng-idn-icdn-00.txtdraft-deng-idn-tsmodule-00.txtdraft-ietf-idn-tsconv-02.txt (51th IETF會議,CDNC合作提出)draft-ietf-idn-tsconv-03.txt (52th IETF會議,CDNC合作提出)draft-jseng-idn-admin-00.txt (JET合作提出),32,提 綱,多語種域名的
31、需求多語種域名相關(guān)組織介紹多語種域名中的技術(shù)難點中文域名面臨的問題多語種域名的解決方案中文域名的解決方案ICANN相關(guān)工作介紹,ICANN IDN工作的起源,2000年1月18日,CNNIC推出中文域名試驗系統(tǒng)。2000年8月22日 Verisign公司宣布引入多語種域名試驗平臺,宣布用戶可以.com, .net, .org等頂級域名下面使用其他語言字符注冊域名。 2000年8月25日,ICANN針對 Verisign
32、 的多語種域名試驗計劃發(fā)表聲明。2000年10月22日,CDNC關(guān)于Verisign提供中文域名服務(wù)發(fā)表聲明。2000年11月7日,信息產(chǎn)業(yè)部發(fā)布《關(guān)于互聯(lián)網(wǎng)中文域名管理的通告》2001年ICANN成立IDN委員會,CNNIC給ICANN關(guān)于IDN的管理建議,發(fā)展多語種域名不僅應(yīng)該保證當前域名系統(tǒng)的穩(wěn)定和兼容性,還應(yīng)當保證各種語言使用者的利益,尊重各地的政策機制,包括政治的、經(jīng)濟的、法律的和文化的等等;IDN不僅僅是一個技術(shù)問題
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- internet中各種域名后綴介紹
- 中文域名
- 多語種語音合成的韻律建模.pdf
- 多語種問答系統(tǒng)中中文問句處理的研究與實現(xiàn).pdf
- 中文域名簡介
- 口語伙伴多語種口語訓練數(shù)據(jù)庫
- 多語種語音合成中的關(guān)鍵技術(shù)研究.pdf
- 基于WEB多語種詞匯翻譯信息抽取技術(shù)的研究.pdf
- 多語種雙語對齊平臺的設(shè)計與實現(xiàn)
- 多語種同指消解系統(tǒng)的研究和實現(xiàn).pdf
- 多語種語音情感識別的研究與實現(xiàn).pdf
- 盧旺達多語種背景下的漢語推廣研究.pdf
- 畢業(yè)論文——多語種網(wǎng)絡(luò)硬盤系統(tǒng)的設(shè)計
- 畢業(yè)論文——多語種網(wǎng)絡(luò)硬盤系統(tǒng)的設(shè)計
- 基于LDA的文本多語種識別研究.pdf
- 多語種同義詞組的自動建立研究.pdf
- 多語種手機輸入系統(tǒng)的設(shè)計與實現(xiàn).pdf
- 多語種問答系統(tǒng)中答案抽取算法的研究.pdf
- cs應(yīng)用程序平臺多語種技術(shù)應(yīng)用研究——畢業(yè)論文
- 畢業(yè)論文——cs應(yīng)用程序平臺多語種技術(shù)應(yīng)用研究
評論
0/150
提交評論