故障現象
某運營商反饋在定制網業務中,UPF為BM CAAS形態,UPF業務交換機為MCLAG組網。業務配置完成不久后出現兩個告警:
1. UPF Rosng協議棧xgei-2/0/4/2.7頻繁出現BFD會話閃斷現象。
2. 第二臺UPF業務交換機的BGP Loopback地址(192.168.100.18/FD00100:: 18)到UPF Rosng協議棧的BGP出現閃斷。
因此需要排查原因。
故障分析
面對此類問題,需要從故障現象中歸納總結幾個關鍵點:
一、由“業務配置完成后不久出現兩個告警”可以得出,告警大概率與現場新加的定制網業務配置有強相關。
二、出現的告警為Rosng與UPF業務交換機,可進一步縮小定界范圍。
因此排查過程如下:
1. 分析UPF告警:通過EM告警采集,可以看到存在“BFD會話down”告警,且告警特征為告警發生頻繁、可自動恢復,Rosng端口為xgei-2/0/X/2.7,如下圖所示。
2. 此外,還存在“BGP鄰居down”告警,告警可自動恢復,故障IP=192.168.100.18,如下圖所示。
3. 根據以上告警信息檢查UPF網元業務配置,發現IP=192.168.100.18地址為UPF的N6側BGP鄰居地址(鄰居為業務交換機),如下圖所示。
4. UPF告警所在的Rosng端口均為VPN為yghjb的端口,此VPN也是本次定制網新添加配置。VLAN ID為1061,VLAN網關在UPF業務交換機,因此在Rosng進行Ping測試,目的IP為VLAN1061網關,源地址取Rosng邏輯接口地址(192.168.30.1~4)。但Ping測試結果顯示均能Ping通(告警同時未復現);Rosng和交換機側VLAN1061相關的ND6 Cache結果均為正常,如下圖所示。
5. 檢查兩臺UPF業務交換機配置,發現兩臺業務交換機未配置anycast mac地址,如下圖所示。
6. 在交換機為MCLAG組網中,若VLAN網關的anycast mac不配置,將會導致NA單播報文無法命中三層mac,NA上送失敗后,交換機的MAC地址學習異常。
當Rosng模塊接口IP無法學習到VLAN1061網關時,將導致VLAN1061鏈路不通,而VLAN1061鏈路不通將會使Rosng所有以VLAN1061為BFD檢測的路由進行失效處理,配置如下圖所示。
當此默認路由失效使,Rosng與業務交換機的BGP鄰居則不通,這也解釋了產生“BGP鄰居down”告警的原因。
故障處理
1. 在UPF兩臺業務交換機的VLAN1061網關,執行如下命令:
interface mac-address 0000.5e00.2101 anycast
2. 命令執行成功后,BFD會話down的閃斷告警便不再出現,問題解決。
-
運營商
+關注
關注
4文章
2398瀏覽量
44425 -
交換機
+關注
關注
21文章
2638瀏覽量
99548 -
UPF
+關注
關注
0文章
50瀏覽量
13504
原文標題:ZXUN xGW-邊緣UPF BGP閃斷的問題處理
文章出處:【微信號:ztedoc,微信公眾號:中興文檔】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論