人工智能經歷了六十多年的浮浮沉沉,隨著計算算力的進步,算法的創新和互聯網發展下的海量數據積累,人工智能技術未來十年將煥發出新的活力,成為最具有沖擊力的科技發展趨勢之一。
電信網絡作為信息通信的基礎設施,具有應用人工智能技術的巨大空間和潛力。如何利用人工智能算法提供的強大分析、判斷、預測等能力,賦能網元、網絡和業務系統,并將其與電信網絡的規劃、建設、維護、運行和優化等工作內容結合起來,成為電信業關注的重要課題。
在HUAWEI CONNECT 2020期間,華為基于對電信領域的深刻理解和多年經驗沉淀,帶來了《云地協同加速網絡AI規模商用使能實現自動駕駛網絡》的分享,旨在結合電信領域應用場景,使能網絡達到自動、自愈、自優和自治的自動駕駛網絡,提升整個網絡的效率,降低OPEX。
電信行業面臨挑戰呼喚ADN
我們正進入一個跨界競爭的新時代,每個行業都面臨著結構性挑戰,電信行業尤其如此。新趨勢下,電信網絡正面臨以下三大挑戰:
業務復雜:網絡所聯接的業務越來越多,無人機、汽車、AR/VR…從B2C到B2C、B2X,網絡所支撐的業務越來越復雜;
運維復雜:從4G到5G,2-3-4-5四代同堂,十余種網絡協議,數千網絡特性,上萬配置參數,網絡運維復雜度激增;
聯接復雜:萬物智能,使得聯接密度增加了100倍,聯接移動性達到了150km/h,聯接的數據量增加1000倍,聯接復雜度前所未有;
要解決電信網絡面臨的挑戰,僅僅靠產品創新遠遠不夠,需要整個系統架構創新和商業模式創新,才能提升運營商的競爭力,解決結構性問題。從2018年開始,為實現網絡自動化和智能化,電信行業組織、運營商和設備商紛紛啟動技術探索。
華為在2018年即提出電信行業邁向ADN五級演進標準,為實現自動駕駛網絡提供了參考。另外,以中國聯通、中國移動、BT、法電、Telstra為代表的運營商,以及以華為、愛立信為代表的設備供應商均積極開展相關實踐,網絡智能化、自動化成為行業熱點。
近10年來,華為從ALL IP,ALL Cloud進入ALL Intelligence時代,在架構創新的道路上從未停止。2019年4月,華為正式發布iMaster NAIE網絡AI云服務,為華為網絡智能化戰略實施的的重要里程碑。
不僅如此,華為自動駕駛網絡(ADN)秉承“把復雜留給自己,把簡單帶給客戶”的思想,以網絡極簡和智能運維為核心理念規劃、設計和開發產品,通過云端+AI、網絡+AI和網元+AI的三層AI開放架構“給網絡以智能,給運維以平臺”,加速電信運營商數字化和智能化轉型。
云地協同加速AI特性規模應用
近年來,全球業界各方在網絡AI方面紛紛進行積極的探索和實踐,經過驗證在運維效率、能耗效率、網絡資源利用率以及用戶業務體驗提升等方面確實能夠帶來價值,電信產業走向智能化已經成為整個行業的共識。但在實踐中,也發現網絡AI在走向規模化工程應用的過程中存在很多挑戰,如模型重訓練占用資源多、模型版本升級管理難度大、本地樣本少、模型精度不夠等問題。
模型重訓練占用資源多:從實踐統計來看,一些場景都會發生因泛化、或數據偏移而導致的模型精度下降問題,如無線流量預測、DC PUE優化等,AI模型都需要進行重訓練。AI模型訓練一般會占用較多系統資源,如在網元或網管實施重訓練任務,訓練效率低,同時也可能會影響設備性能。
模型版本升級管理難度大:很多場景的AI模型都是一站一模型,如無線基站智能節能等,各站點的模型都根據本地化數據進行定制化訓練。各局點模型版本不同,升級頻度也不同,成千上萬的站點模型,管理難度很大。需要有一個統一的平臺,高效實現模型狀態的監控和版本升級策略等管理任務。
本地樣本少、模型精度不夠:部分場景單局點樣本量少,不足以支撐模型訓練,如核心網KPI異常檢測,單局點發生異常頻率很少,訓練需要的樣本量不夠。因此,需要能夠匯聚所有局點的全量樣本信息,可能還需輔以聯邦學習等技術,才能訓練得到滿足業務精度要求的AI模型。
云地協同實現架構
針對以上問題,華為提出云地協同創新方案,通過云地協同,可以加速AI特性的規模部署。
云地協同,是指云端和地端一起協作完成數據樣本上云,模型狀態管理,模型重訓練,模型/知識下發、擇優更新等一系列的閉環任務,同時把云端匯集的全局網絡知識經驗、全量數據訓練得到的高精度模型,持續注入地端,讓電信網絡能夠進行智能的迭代升級,變得越來越聰明。
云地協同有三個主要的特征:一是云端和地端要有通道;二是地端到云端,信息可以從運營商上傳到云端,包括數據樣本、模型狀態、以及重訓練請求等信息,三是云端到地端可以下發新的模型,同時網絡知識庫里的知識也可以注入到地端。
云地協同機制參見下圖:
云地協同三個階段
據介紹,云地協同在實際應用部署時有三個階段,針對不同場景可以選擇適合的階段,最終大幅提高網絡的資源效率。
階段1:云端進行初始模型的訓練,運行態由地端根據新增的樣本進行在線學習,持續保持模型的精度。這種模式主要是適用于模型相對簡單,算法結構比較穩定的場景,這種場景一般不需要對模型結構和算法本身進行更改,只需要根據本地數據進行在線學習,優化調整模型參數。比如像核心網變更在線機器值守等。
階段2:云端進行模型的分發,然后在地端根據新增樣本進行在線學習。具體講,就是云端會持續對模型進行優化,包括模型算法結構上的,優化后的模型會進行推送到地端,地端根據評估結果進行模型擇優更新。同時,地端也會根據本地數據樣本的學習進行模型參數的優化。這種一般適合于模型相對復雜,華為會持續進行模型算法結構優化的場景,比如無線KPI 異常檢測等。
階段3:云地實時協同,模型可以自動化演進,具體講就是本地樣本會實時上傳到云端,云端進行訓練和優化后的模型會自動推送到地端,地端進行模型評估擇優進行升級。這種主要是適用于模型復雜、需要用到華為云端高質量標注數據,知識圖譜以及仿真等知識能力進行模型優化的場景,比如IP RAN/PTN智能告警,DC PUE優化等。
云地協同關鍵價值
聯邦學習,即通過匯聚各個地端模型的參數,在云端采用匯聚算法,形成效果更好的共享模型,再下發給各個地端進行使用,其最大的特點,就是在地端數據不用出局的情況下,提升模型的精度。借助聯邦學習可以更好的實現云地協同,從而提升模型泛化能力和訓練效率。
借助知識圖譜,通過沉淀專家經驗和產品知識轉化形成故障傳播關系等,形成“網絡知識庫”,可用于故障運維輔助、知識問答等。
在云端仿真方面,通過在云端構建虛擬仿真環境,高效安全地進行模型或業務驗證,在避免現網性能或KPI受到影響的同時,支撐網絡問題的快速閉環。
模型因為需要進行更新,更新的方式如果采用傳統網管集成的這種模式,需要經過多層多次的人工動作,首先模型版本發布后,需要產品研發把模型通過代碼工作集成到網管軟件版本里,然后發布到華為Support網站。
如果采用自動升級模式,通過云地協同,讓AI模型市場跟地端網絡AI對接,模型發布后進行推送,讓地端局點啟動自動化的模型升級,當然升級前也會完成模型的評估,整個過程在1個小時即可完成。
總結來看,云地協同可以實現一點生效,全網復制,AI的特性在一個局點成功實施后,快速的形成知識和經驗,在其他局點進行復制,實現在全網規模應用。
華為iMaster NAIE讓網絡AI開發簡單高效
NAIE是自動駕駛網絡解決方案的網絡AI設計和開發平臺,由數據服務,訓練服務,AIOps使能服務,推理框架和生態服務五大部分組成。
網絡AI模型開發既要懂AI、又要懂網絡,技術門檻高。模型開發過程中,既需要懂AI知識,又需要熟悉網絡業務。電信領域專家AI積累少,可借鑒經驗少。而且由于AI算法多,選擇范圍廣,所以導致試錯成本高、開發效率低;算法科學家不懂電信業務,需要花大量時間了解學習。模型訓練依賴大量并且昂貴的計算資源,調參優化周期長,訓練耗時高、周期長。
NAIE訓練平臺,提供一站式高效模型訓練,集成業界通用的主流AI算法框架,包括Mindspore、Tensorflow、SParkML、Caffe2、MXNet等,內嵌華為在網絡領域30多年的知識和經驗沉淀,支持電信領域的特征處理,輔助快速識別等關鍵特征,內置電信領域AI典型算法,如異常檢測、根因分析、優化控制、業務預測等,支持模型快速驗證。目前主要包括三類服務:模型訓練服務、模型生成服務和通信模型服務(在線推理),可以滿足不同層次的人員對于模型開發的需求。
不僅如此,華為還提供了豐富的NAIE培訓服務,線上線下結合,助力運營商人才轉型。
總結
未來是智能化的時代,運營商網絡智能化不可能一蹴而就,而是一個長期實踐。華為自動駕駛網絡解決方案是華為All Intelligence戰略在電信領域的落地,而iMaster NAIE做為智能化部件,將使能自動駕駛網絡。核心的AI能力依托華為在All Intelligence中長期堅決的戰略投入而積累成長,和電信領域場景想結合,幫助運營商盡快實現數字化,智能化轉型。
責編AJX
-
華為
+關注
關注
216文章
34477瀏覽量
252137 -
電信
+關注
關注
2文章
732瀏覽量
61985 -
AI
+關注
關注
87文章
31133瀏覽量
269470 -
云平臺
+關注
關注
1文章
1314瀏覽量
39009
發布評論請先 登錄
相關推薦
評論