網絡功能,經歷了從各設備廠家物理機無統一標準的傳統設備(mips、x86、np)演進到物理設備基本統一x86服務器,上層應用虛擬化,繼續演進到云、云原生。短短十年間,4G演進到5G,5G在2020年走向成熟。
4G走向5G,電信設備從傳統設備演進到虛擬化、云化、時代,軟硬件架構都發生了翻天覆地的變化。電信業引入了很多IT的軟件架構、思維、方法等;開源、APP和基礎設施解耦等給電信應用帶來了很多好處、便利,同時也帶來了新的問題,其中對電信運維方式產生了較大的影響。
在2G/3G/4G傳統設備時,業務一旦出現問題,運維人員不需要太多區分是硬件故障還是軟件故障,設備本身先進行軟硬件一體的主備倒換,先恢復業務,再進行故障定位。
在當前云時代,基礎設施集中化,中心DC物理設備規模龐大(》1000),網絡功能分布式打散分布在不同的物理節點上,一旦出現故障,原有的軟硬件一體化主備倒換方式不再有效,需要更有效性自動化識別能力,識別故障根源是硬件原因、云平臺原因、還是上層VNF的原因,快速區別出故障的根本原因,才能快速對故障進行有效隔離和恢復。
實現自動化和智能化的網絡運維,是5G成熟關鍵技術。智能監控、故障分析等是自動化運維中關鍵技術。
一、智能監控
智能監控的目標是,軟件自動化發現系統運行異常,自動觸發下一步對異常的分析,從而定位出系統異常根源,快速修復故障。
實現智能監控有兩種方式:直接方式和間接方式。
直接方式:對環境、硬件(計算、存儲、網絡)、Cloud OS等關鍵設施進行指標監控,一旦出現異常數據,進行直接的故障告警、定位;
間接方式:對5G業務關鍵KPI進行監控和多維度的對比分析,通過分析發現KPI異常判斷故障是否發生,從而觸發故障進一步關聯分析定位。
多維度的對比分析可以從幾個方面進行。
歷史數據對比方式。歷史總是相似相近,歷史數據對比分析按天、周、月、年、節假日歷史數據綜合進行,通過AI算法預先給出下一階段(小時、天)KPI預測數據,再根據實時采集得到的數據,對比判斷系統是否異常;
同類對比方式。同類型的5G NF的同類KPI變化應該趨于一致,一旦出現較大(超過域值)波動,可以判斷系統異常;單一的NF內部,不同微服務的處理KPI同樣也應該趨同,如果不一致同樣也可以判斷系統異常。
二、故障分析
故障根源分析可以從兩個方面入手,告警、日志。在監控系統發現系統異常后,觸發縱向分層告警、分層日志關聯分析;橫向關聯NF內微服務間,NF-NF間進行關聯分析,定位故障根源。
1,縱向關聯
縱向關聯在垂直架構上,網絡構包括物理層、虛擬層、業務層三個層次,當底層出現故障時,將影響上層業務。如圖1:
圖1, 三層架構示意圖
縱向關聯解決的關鍵問題:底層硬件、虛擬層故障一旦發生時,上層業務KPI等指標會出現異常,垂直關聯把上層業務的異常和底層故障關聯起來,識別出根故障的根源是在哪個層次PIM層、VIM層還是VNF業務本身。
2,橫向關聯
在水平層次上,VNF內部的微服務間存在業務流程關聯,存在相互影響的關系,微服務間橫向關聯用作發現出問題根本原因的微服務,如圖2。
圖2,同一VNF內不同微服務集群示意圖
在VNF-VNF間業務流程在不同節點間流轉時,如果某個節點發生故障,也將影響到與其相關的其他節點,如圖3。比如:AMF、SMF、PCF、UDM等相互之間的關聯影響,是業務流程的不同節點。
圖3. 不同VNF互聯示意圖
綜上可知,橫向關聯能夠解決的關鍵問題在于,把一個網元的故障和另一個業務相關網元的故障關聯起來,把一個微服的故障和真正出問題的微服務關聯,在應用層這同一層次識別出真正出問題的微服務或組件。
3,常用技術
常用技術包括:數據采集、數據分類(清洗)、數據監控、數據關聯、定層定位等。
數據采集:業務告警、業務kpi、業務配置操作日志、網絡設備操作日志、存儲設備操作日志、虛擬設備操作日志、虛擬層平臺操作日志、虛擬層系統運行日志等;
數據分類:數據在清洗分類時主要有幾個標簽,如時間、位置、我影響誰(分類標簽)、誰影響我(分類標簽)。分類標簽有網絡、主機、存儲、配置;
數據監控:一般對上層KPI進行監控,KPI數據是統計數據,可以引入AI算法,對異常KPI進行判斷,一旦出現異常數據,判斷系統出現故障,觸發故障根源分析系統;
數據關聯:主要根據預置的模板進行,模板以標簽的形式進行關聯,其中位置、時間、我影響誰、誰影響我,是數據關聯主要依據;
定層定位:通過數據關聯,從上往下(業務、虛層、物理層)確定最終的關聯節點,水平關聯通過“分類標簽”最終找到故障起因的網元、微服務或組件。
自動化運維的關鍵技術,除了故障監控和故障根源分層關聯分析,故障自愈能力、全局透視、跨域全方位數據采集能力、全網網絡拓撲管理、一鍵自動化測試、一鍵自動化業務部署等,都是智能運維應具備的成熟商用能力。中興通訊智能運維方案,化繁為簡,降低5G云原生及服務化軟件架構帶來的系統維護復雜性,致力于聚焦5G業務本身,為客戶創造更大價值。
責任編輯:Ct
評論
查看更多