版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、IMS故障處理案例分析,,2012年我省的IMS網(wǎng)絡有了較大規(guī)模的發(fā)展,用戶數(shù)從年初的3000左右,到12月底超過8萬,忙時話務量也從1月的2000Erl發(fā)展到12月的超過4萬Erl。隨著IMS商用化進程加快,由于對新組網(wǎng)、新設備、新業(yè)務的不熟悉,各市公司在日常的故障處理過程中遇到了許多的難題。省公司對近期發(fā)生的IMS核心網(wǎng)、接入設備的故障進行了匯總整理,對一些典型的故障處理進行了總結(jié),希望能對各市公司有所幫助。主要有幾下幾大類故障
2、:接入設備故障接入設備與核心網(wǎng)信令配合問題用戶權(quán)限密碼設置問題核心網(wǎng)(包括業(yè)務平臺)的問題,接入設備參數(shù)設置與核心網(wǎng)不一致導致通話異常,問題描述,聊城一中IMS終端主叫通話過程中出現(xiàn)自動掛斷情況。經(jīng)過現(xiàn)場撥測,發(fā)現(xiàn)有時通話10分鐘也不會掛斷,有時1-2分鐘就會中斷。,分析定位,經(jīng)信令跟蹤發(fā)現(xiàn),用戶側(cè)register請求消息中帶有Expires: 30參數(shù),核心網(wǎng)默認register請求消息中Min-Expires: 1800,因
3、此回復給終端側(cè)SIP 423(時間間隔過短),最終核心網(wǎng)下發(fā)BYE消息拆線,導致通話過程中自動掛斷。問題原因是會話更新請求消息中的expires參數(shù)不符合規(guī)范,核心網(wǎng)回SIP 423,終端側(cè)沒有及時回應這個消息,導致用戶掉線。,解決措施,按照中興核心網(wǎng)側(cè)register請求消息中Min-Expires: 1800的要求對IMS終端配置文件進行修改。在用戶側(cè)多次撥測,通話未再出現(xiàn)自動掛斷的情況。,接入設備參數(shù)設置與核心網(wǎng)不一致導致通話異
4、常,問題描述,淄博佳和IAD設備下的IMS用戶呼叫手機,接通后,能夠通話,但20秒左右,IMS用戶自動斷線,發(fā)出忙音。重復試驗多遍,情況基本相同。。,分析定位,PBX用戶發(fā)送報文采用傳輸層端口為5060,SIP消息內(nèi)端口為5061。華為的SBC中存在檢測呼叫CCB機制。當終端信令傳輸層與信令端口不一致并且該終端做主叫時,會導致出現(xiàn)認為呼叫用戶不存在的誤判,SBC進行主動拆線。,解決措施,SBC側(cè)加載補丁并關(guān)閉端口一致性檢查功能。IA
5、D側(cè)將終端注冊端口改為與呼叫時使用端口一致。(推薦),經(jīng)信令跟蹤,是SBC主動拆除了呼叫。繼續(xù)對IP包進行分析,發(fā)現(xiàn)終端發(fā)起呼叫(invite),contact頭域中攜帶的端口為5061,但是使用的傳輸層端口為5060。,接入設備參數(shù)設置與核心網(wǎng)不一致導致通話異常,問題描述,東營的IMS用戶在使用SIP終端一段時間后,如果長時間沒有來話或發(fā)起呼叫則SIP終端顯示離線,必須重新手動注冊才能繼續(xù)使用。,分析定位,現(xiàn)場組網(wǎng)方式為:SIP終端
6、NAT設備SBCIMS核心設備。 NAT設備里有張NAT MAP表,表中的記錄是NAT轉(zhuǎn)換的老化時間。如果NAT保持消息交互,表中記錄超時老化后,NAT設備會重新建立NAT MAP記錄。SIP終端有一個NAT keep的參數(shù)選項,如果關(guān)閉這個選項,則原先通過SIP消息建立的NAT MAP老化后,當NAT設備收到終端的SIP消息,就會重新建立NAT MAP,并通過新的端口往SBC轉(zhuǎn)發(fā)S
7、IP消息,而SBC也同樣用新的端口號往P-CSCF轉(zhuǎn)發(fā)SIP消息。而P-CSCF發(fā)現(xiàn)這個消息的源端口與原來的不一致,就會發(fā)403消息,拒絕掉請求。這樣SIP終端就離線了。,解決措施,在SIP終端上選中NAT KEEP項,經(jīng)測試注冊呼叫都正常。打開SBC上sbc sip register-reduce enable功能,SBC在轉(zhuǎn)發(fā)消息的時候,無論NAT設備使用哪個源端口,SBC都會對SIP消息進行分析判別
8、是否新新的注冊,來決定是否用新的轉(zhuǎn)口進行轉(zhuǎn)發(fā)。這樣對于已經(jīng)注冊的用戶,CSCF就不返回失敗消息了。,接入設備參數(shù)設置與核心網(wǎng)不一致導致通話異常,問題描述,中興SBC下的SIP用戶偶爾出現(xiàn)不能呼入和呼出故障,呼入時報“空號”;一段時間(最長1個小時左右)自動恢復。,分析定位,對現(xiàn)場的SBC數(shù)據(jù)配置進行檢查,SBC每60秒發(fā)OPTION消息檢查SIP終端用戶,當收不到SIP終端回應時,SBC判斷該SIP用戶掉線,會在數(shù)據(jù)區(qū)中刪除該用戶;同時
9、停止對該用戶再發(fā)OPTION檢查。 這時用戶呼入或呼出的INVITE消息送到SBC,SBC由于檢測到該用戶不在線,直接回404拒絕。對該用戶注冊涮新信令進行分析:Expires: 3600 ,表示終端約1個小時進行一次涮新注冊。SBC以1分鐘周期發(fā)OPTION檢查終端在線,如故障終端或網(wǎng)終異常無法收200OK消息,SBC會刪除該用戶;至終端發(fā)出涮新REGISTER前(Expires: 3600 )前,該用戶故障不會自動恢復;當接收到終
10、端涮新REGISTER后,SBC在數(shù)據(jù)區(qū)恢復該用戶,業(yè)務也自動恢復。所以會在涮新周期(1個小時左右)自動恢復。,解決措施,修改SBC設置,不主動發(fā)OPTON檢查SIP終端,改為由終端涮新REGISTER來檢查是否在線情況。這樣,既使出現(xiàn)偶爾承載網(wǎng)丟包,也不會出現(xiàn)1小時左右才自動恢復。在注冊涮新周內(nèi)(50或300S)收到終端發(fā)過來REGISTER即可自動恢復。,接入設備參數(shù)設置與核心網(wǎng)不一致導致通話異常,問題描述,中興SBC連接的HW E
11、PON(SIP)用戶通話30分鐘左右斷線??蛻舴答?,只有HW廠家EPON設備會出現(xiàn)該故障,中興及其他EPON終端無該故障。,分析定位,從IMS核心網(wǎng)、SBC、終端上同時進行信令抓包分析;從SIP信令來看,在通話達30分鐘時,SBC分別向IMS核心網(wǎng)、EPON終端發(fā)BYE消息,通話結(jié)束。檢查BYE消息包,X-ZTE-Cause字段的值為:SBC-4416,即SBC發(fā)送BYE的原因為:在會話檢測周期內(nèi)無信令檢測導致呼叫釋放。檢查SBC的
12、會話檢測周期設置,為1800秒,即要1800秒內(nèi)沒有會話信令檢測,SBC會釋放該呼叫。對華為終端呼叫信令分析,其INVITE信令中的Session-Expires設置為7200,即會話涮新周期為7200秒,遠遠大于SBC上設置的會話涮新周期。,解決措施,取消HW EPON終端側(cè)INVITE消息中的Session-Expires字段設置,由核心網(wǎng)網(wǎng)絡側(cè)下發(fā)會話確定刷新時長。修改HW EPON終端側(cè)INVITE消息參數(shù),將會話刷新時長改
13、成小于1800秒。,接入設備與核心網(wǎng)信令配合問題導致通話異常,問題描述,淄博公司使用佳和IAD接入IMS終端,有傳真終端,在使用過程中發(fā)現(xiàn)接收部分號碼的傳真失敗。,分析定位,傳真問題是IMS網(wǎng)絡中常見的問題,遇到此類問題時,主要進行以下三個方面的檢查:傳真流程是在通話建立以后,通過重新發(fā)起Reinvite消息進行傳真的編解碼協(xié)商,然后進行媒體更改,由語音通話媒體更改為傳真媒體。傳真不通時即檢查傳真流程中有無不正常之處。檢查傳真機的設
14、置,國內(nèi)使用T.30協(xié)議進行傳真協(xié)商,Reinvite消息中的SDP參數(shù)需為fax或modem,而不能為X-fax或X-modem或VBD,否則傳真無法成功。檢查IP通路的傳輸質(zhì)量。本案例中IMS終端沒有發(fā)起re-INVITE消息與MGCF進行媒體切換協(xié)商,因此導致傳真收發(fā)失敗。,解決措施,對接入設備的發(fā)送信令進行修改,問題得以解決。,,低速傳真流程(以IMS發(fā)給PSTN為例):,MGCF發(fā)送INVITE時,檢查其中的SDP的a行,
15、其中a=modem表明該次傳真為高速傳真。,,,高速傳真流程:,MGCF收到第二個INVITE時,檢查其中的SDP的a行,其中a=fax表明該次傳真為低速傳真。,,,接入設備與核心網(wǎng)信令配合問題導致通話異常,業(yè)務不規(guī)范導致的通話異常,問題描述,IMS用戶5385360416投訴做呼轉(zhuǎn)后,其他用戶撥打其電話不通。進行重復測試時聽到快忙音。,分析定位,根據(jù)信令消息分析:手機用戶A撥打做呼轉(zhuǎn)的IMS用戶B,話務先指向了IPPBX,IPPBX又
16、發(fā)起了接續(xù)至C用戶話務,導致IMS核心網(wǎng)側(cè)計時器超時釋放。 此問題是由于用戶在IPPBX側(cè)做呼叫轉(zhuǎn)移,話務需要先接續(xù)到IPPBX,IPPBX再發(fā)起到C號碼呼叫,由于接續(xù)時間較長導致IMS核心網(wǎng)側(cè)超時釋放。,解決措施,呼叫轉(zhuǎn)移業(yè)務屬于核心網(wǎng)業(yè)務,需在核心網(wǎng)CENTREX平臺實現(xiàn),不建議在接入側(cè)操作。建議用戶通過指令*57*指令操作呼轉(zhuǎn),這樣呼轉(zhuǎn)在CENTREX平臺實現(xiàn),核心網(wǎng)側(cè)直接發(fā)起到C號碼接續(xù)。,S-CSCF先向IPPBX發(fā)送IN
17、VITE(包含A、B號碼)消息,IPPBX又向S-CSCF發(fā)起INVITE(包含B、C號碼)消息,S-CSCF下發(fā)504 Server Time-out消息,話務接續(xù)中斷。,IMS電話惡意盜打分析,問題描述,10月中旬,賬務中心高額預警顯示德州某IMS集團固話出現(xiàn)高額國際話單。,分析定位,網(wǎng)絡部立即對該話單進行了核實,發(fā)現(xiàn)該號碼的通話詳單中通話時長和頻次明顯存在問題,懷疑該用戶被盜打。通過抓包分析,呼叫十分頻繁,一秒鐘發(fā)起多次呼叫:
18、查詢發(fā)起呼叫的IP地址,均來自巴勒斯坦 。通過對故障現(xiàn)象和報文的分析,該問題是由于不法份子獲取了用戶的帳號密碼之后,再由國外代理服務器遠程惡意訪問IMS網(wǎng)絡的違法行為。IPPBX使用了公網(wǎng)地址(218.201.174.77),通過公網(wǎng)接入SBC,對整個互聯(lián)網(wǎng)是開放的。不法分子可以通過入侵后抓包分析破解用戶的賬號密碼,或者其他途徑獲取用戶的密碼,然后就可以以合法的身份訪問IMS網(wǎng)絡,給用戶造成巨大的損失。,IMS電話惡意盜打
19、分析,解決措施,首先采取應急措施,更換用戶的密碼;在后臺暫時限制了用戶的國際長途權(quán)限。,后續(xù)措施,對SBC設置IP地址注冊限制,禁止中國以外的IP地址注冊到IMS;對現(xiàn)網(wǎng)進行話務監(jiān)控,當發(fā)現(xiàn)惡意呼叫國際長途電話達到一定的費用額度后,發(fā)出警告,并通知到客戶電話是否出現(xiàn)異常;限制公網(wǎng)地址對IAD/PBX地址的訪問;加強IMS賬戶密碼或者是IP-PBX的內(nèi)部賬號密碼的安全性防護工作,避免由于用戶、設備廠家等人員泄露而發(fā)起的惡意呼叫。
20、建議用戶在拿到密碼之后第一時間修改密碼。,更改IPPBX接入網(wǎng)絡的方式,通過私網(wǎng)方式接入。將IPPBX接入城域網(wǎng)的方式改為通過省公司分配的IMS專用地址段接入,該地址在全省移動網(wǎng)內(nèi)唯一,與公網(wǎng)地址的不同是省外、他網(wǎng)地址無法訪問。這段地址支持集客設備加入網(wǎng)管。通過IMS專用私網(wǎng)段接入可以增強網(wǎng)絡的安全性,降低被不法份子攻擊的風險。,業(yè)務平臺軟件問題引起的通話故障,問題描述,某地IMS集團用戶投訴,在撥打CS域電話時,正常撥號后聽不到任何音
21、,超時后提示:“你所撥打的號碼無人接聽,請稍后再撥”。,分析定位,同時在CENTREX平臺側(cè)進行信令跟蹤,發(fā)現(xiàn)as收到invite,號碼規(guī)整后給s-cscf下發(fā)invite,然后MFCG給AS發(fā)送183消息進行媒體協(xié)商,但由于某種原因,AS沒有回復,MGCF不斷給AS發(fā)送183消息,AS始終沒有響應,直到最后超時,ims送480消息,釋放此次通話。,在MGCF側(cè)進行信令跟蹤,發(fā)現(xiàn)AS收到invite,給s-cscf回100trying
22、,然后一直沒有給s-cscf下發(fā)invite,以至于超時,sbc返回cancle消息。,解決措施,根據(jù)失敗原因分析,定期進行setval消息跟蹤,確認spConID是否被正確釋放。一旦出現(xiàn)spConID未被正確釋放,則考慮重啟Centrex的SCF進程。完善平臺版本,進行平臺版本替換,從根本上杜絕此故障。,分析定位,繼續(xù)分析AS平臺上INVITE消息未被處理的日志,發(fā)現(xiàn)上報的invite是個初始invite, 但日志里卻提示spCo
23、nID已經(jīng)存在。,業(yè)務平臺軟件問題引起的通話故障,為了識別對話,IMS的協(xié)議棧里提供了一個spConID,通過它可以標示唯一的一次SIP會話。當AS從協(xié)議棧收到會話創(chuàng)建消息,就將spConID保存起來,當會話結(jié)束時,AS會將此spConID釋放。從日志上分析,初步分析結(jié)果可以定為AS在某些場景下,當會話結(jié)束時,未能將spConID釋放。因此,當一個新的呼叫上報,且重用了此spConID的情況下,該初始invite就會被認為spConI
24、D已存在,而未能被正確處理。,不同廠家對協(xié)議理解差異引起的異常,問題描述,在阿朗的P-CSCF設備上,經(jīng)常出現(xiàn)與中興的S-CSCF之間的鏈路切換告警,但是在中興S-CSCF設備上卻沒有任何與之對應的告警。,分析定位,正常注冊流程時,在初始REGISTER后,核心網(wǎng)回401消息攜帶鑒權(quán)信息算法給UE,UE通過鑒權(quán)信息算法生成鑒權(quán)結(jié)果,再次發(fā)送攜帶鑒權(quán)信息的REGISTER消息給核心網(wǎng),核心網(wǎng)回給終端200消息表示注冊成功。而此次注冊消息回
25、了503,所以重點檢查401消息后的REGISTER消息,發(fā)現(xiàn)該REGISTER消息沒有攜帶鑒權(quán)信息。一般出現(xiàn)第二次REGISTER消息仍不帶鑒權(quán)信息的原因,是因為終端沒有收到核心網(wǎng)回程的401消息,此時終端會再次初始注冊消息。如果是由于該用戶所用的專線有問題等原因?qū)е陆K端收不到回復消息,用戶會一直重復發(fā)起初始注冊。此時為了避免信令的頻繁發(fā)送,中興核心網(wǎng)會返回503消息攜帶Retry-After:30參數(shù)表示讓客戶端間隔30秒后進行重
26、試。,在阿朗設備上對產(chǎn)生告警的原因進行分析,發(fā)現(xiàn)發(fā)生鏈路切換的同時,會有某些用戶注冊時,中興ISCSF回給阿郎PCSCF 503(REGISTER)消息。,解決措施,阿朗設備認為在此種場景下回的503(REGISTER)消息不能攜帶Retry-After字段。我們通過配置開關(guān)的方式將中興設備REGISTER的503響應消息修改為不攜帶Retry-After字段參數(shù)。在阿郎P-CSCF設備上查看告警,鏈路并沒有發(fā)生切換現(xiàn)象,問題解決。
27、,分析定位,阿朗P-CSCF收到503消息中攜帶Retry-After:30參數(shù)后,認為在該場景下,不是終端做為客戶端,而是P-CSCF做為客戶端,停止30秒不給服務端(中興S-CSCF)發(fā)送消息,從而導致了鏈路切換。SIP的優(yōu)點即擴展性靈活性非常好,但另一方面也帶來了問題,即不同的廠家對SIP協(xié)議理解經(jīng)常有所不同。所以該問題即是由于兩種廠家對503(REGISTER)消息攜帶Retry-After:30的理解不一樣所致。,不同廠家對
28、協(xié)議理解差異引起的異常,錄音通知異常處理,(1)IMS用戶做主叫,撥打其他運營商固話,被叫忙,聽不到錄音通知(主要在日照發(fā)現(xiàn))按照集團公司的錄音通知規(guī)范,放音原則是“移動內(nèi)部場景及其它運營商用戶撥打移動用戶場景,由被叫叫端局放音移動用戶撥打其它運營商用戶場景,對端運營商放音時,透傳放音,對端運營商不放音時,優(yōu)選由移動關(guān)口局放音,也可由本端主叫交換機放音?!笔?nèi)其他市公司這種問題較少,可能是由于當?shù)氐穆?lián)通、電信對于忙都播放了錄音通
29、知,而日照電信、聯(lián)通沒有播放錄音通知。此時,應該由移動關(guān)口局播放。處理方法:華為關(guān)口局添加CV30(被叫長忙)放音配置,在聯(lián)通用戶忙而且不放音的情況,由關(guān)口局進行放音:ADD CFPRO: FCC=CV30, FSNAME="0", PT=SIG, TT=TID57, DCN="DEFAULT";經(jīng)測試,問題解決。(2)IMS用戶做主叫,撥打移動手機,手機無應答,聽靜音(正常應該是嘟嘟音)
30、。經(jīng)信令分析,端局回送的ACM消息中的帶內(nèi)放音指示(inband information)可能會被關(guān)口局修改為無指示(no indication),從而導致IMS用戶聽不到端局的回鈴音。處理方法:在關(guān)口局修改參數(shù)P116 BIT11和BIT10,以避免這種情況。MOD MSFP: ID=P116, MODTYPE=P1, BIT=10, BITVAL=0;MOD MSFP: ID=P116, MODTYPE=P1, BIT=11
31、, BITVAL=1;,(3)IMS用戶做主叫,撥打移動手機,手機無應答,若端局先拆線,聽“尚未登錄”錄音通知;若IMS先拆線,正常。這種情況產(chǎn)生的范圍非常廣,對全省端局的振鈴時長進行了檢查,省內(nèi)大部分端局設置的是45秒,濟南少數(shù)端局、威海設置的是60秒,濟寧、聊城少數(shù)端局設置的是40秒。60秒振鈴時長的端局下手機做被叫,無應答時錄音通知都沒有問題。經(jīng)信令跟蹤,發(fā)現(xiàn)是由于Centrex和MGCF的錄音通知播放標準不統(tǒng)一引起,當CS域
32、端局先拆線時,MGCF向Centrex發(fā)送480消息(攜帶原因值),指示Centrex平臺放音,但是Centrex平臺不區(qū)分原因值,見到480消息,全部播放“用戶未登錄”的錄音通知。處理方法:向集團公司提出申請,建議修改Centrex平臺錄音通知播放規(guī)范。作為臨時解決方案,修改Centrex平臺“用戶未登錄”的錄音通知內(nèi)容,改為“嘟嘟”音。向華為研發(fā)提出修改Centrex平臺錄音通知播放原則的需求,開發(fā)軟件補丁解決這個問題。(
33、4)IMS用戶做被叫時忙,主叫聽不到錄音通知,只聽到“嘟嘟”音。這個也是由于Centrex平臺與MGCF放音規(guī)范不一致引起。需要華為提交研發(fā)處理,開發(fā)軟件補丁解決。暫無臨時解決方法。,錄音通知異常處理,IMS用戶做主被叫存在問題,在終端上檢查用戶是否是注冊狀態(tài),聯(lián)系終端人員處理(重新注冊,重啟設備等),不正常,在BOSS或AS平臺以及HSS檢查用戶數(shù)據(jù),簽約了哪些業(yè)務,修改用戶數(shù)據(jù)或者重新開銷戶,在SBC上抓包觀察,呼叫是否到達核心網(wǎng)
34、消息內(nèi)容是否正確,核心網(wǎng)是否回了錯誤消息,檢查SBC和終端配置,在S-CSCF,P-CSCF上跟蹤消息,看信令流程是否到達是否正確,分析具體原因看是上層還是底層原因?qū)е?在AS上進行全消息跟蹤,分析具體原因,正常,正常,不正常,否,正確,不正常,是,IMS故障處理的一般步驟,經(jīng)驗總結(jié),了解和收集故障現(xiàn)象:通過手機向客戶或現(xiàn)場維護人員了解和收集故障的現(xiàn)象,通過故障特征,再結(jié)合用戶端常見故障列表,對故障進行定位。了解當前網(wǎng)絡拓撲結(jié)構(gòu):如果
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論