疫情等黑天鵝事件的頻發,使得企業更加意識到數字化轉型的重要性,也因此加速了數字化轉型的需求。數字化轉型不僅可以幫助企業適應新的商業環境和市場需求,還能夠提高運營效率、降低成本、改善客戶體驗,以及實現創新和增長。不過,在數字化轉型的道路上,大多數企業會面臨一個問題:對傳統企業或者是 IT 能力薄弱的團隊,如何快速的去完成數字化轉型?
基于云原生的輕量級框架在云上通過敏捷開發快速實現數字化轉型的業務,目前是比較流行的做法。但是享受云原生技術帶來的敏捷和便利的同時 ,技術團隊也會面臨一些新的挑戰,比如上層應用復雜度的增加,出現問題時,分析需要使用不同維度的工具,這意味著服務維持、維護運營會更加的困難。比如近期,英國空管系統故障,一條小小的飛行記錄導致航班中斷 4 小時,給企業預計造成了 1 億英鎊損失。這意味這一旦企業轉型,業務高度依賴數字化,系統的可運維性、連續性和可觀測性就變得非常的重要。近期,CSDN 專訪了國內性能監測領域頭部廠商基調聽云產品VP 陳靖華,他從系統性能監測的新手段——可觀測性核心技術思路,以及未來性能監測發展,給出了詳細的見解。
可觀測性:提升云原生復雜系統的監控能力
隨著企業數字化轉型的加速,傳統的基礎設施監控(ITIM)、應用性能監控(APM)、網絡性能監控(NPM)和日志監控技術已無法滿足云原生環境下的應用系統高度連續性的運維監控訴求。可觀測性(Observability)作為新興的技術和理念,近年來得到了廣泛關注。基調聽云作為國內可觀測性技術的探索者和實踐者,在產品矩陣中增加了可觀測性,并針對云原生環境進行了技術創新,以提升在復雜系統中的觀測能力。
基調聽云技術 VP 陳靖華在采訪中表示,可觀測性興起的原因在于云原生和微服務架構下,系統的復雜度大幅提升,傳統的監控手段效率下降,無法在復雜系統中快速定位問題。而基于CNCF OpenTelemetry標準的確立,可觀測性系統或平臺通過統一采集各維度監控數據,構建關聯性,在未來將有效提升復雜系統的可觀測能力。
具體來看,疫情期間遠程辦公和線上業務需求激增,促使許多企業加速了數字化轉型步伐,這使系統架構也向微服務和云原生演進。這給傳統的監控帶來了巨大挑戰。以往傳統的監控系統依賴人工構建的模板和經驗進行問題分析定位,但云原生系統復雜動態,許多問題并不在預判范圍內。傳統監控系統效率下降,無法快速定位復雜的未知的系統故障。而可觀測性正是通過采集更多維度監控數據,實現更全面的系統洞察,才得以應對云原生環境的監控難題。
可觀測性的核心能力是什么?
作為國內性能監測領域的重要廠商,基調聽云探索和總結了可觀測性的四大核心能力,具體來說:
1、采集即治理,構建一體化探針能力
基調聽云通過自主研發的一體化 Agent 探針,實現了從底層基礎設施到應用層、業務層和體驗層各維度監控數據的自動化采集。這套探針體系經過多年積累,支持國產操作系統和中間件,對云原生組件和信創組件都具有非常好的適配性。其中的關鍵創新在于“采集即治理”的理念,不再是傳統的分離采集和治理,而是在探針端就完成監控數據的標注、過濾等治理工作。這種一體化采集和即時治理的設計,大幅降低了后端的數據處理壓力,也提升了監控分析的效果。
2、用戶體驗至上,打造 DEM 能力
新冠疫情的影響,讓數字化轉型比以往更加注重用戶體驗,無論是最終用戶的辦事和購物體驗,還是公司員工和合作伙伴的遠程辦公體驗。基調聽云非常重視對終端用戶體驗的監測,這與可觀測性要以用戶和業務為中心的思想高度一致。基調聽云通過前端探針采集移動App,網站和各種小程序的用戶操作行為和體驗數據,再與后臺系統性能數據關聯,可以準確反映用戶視角下的體驗狀況。這套能力也稱為 DEM(Digital Experience Management)。未來基調聽云還會持續加強 DEM 建設,使得業務系統的監測更加用戶導向。
3、構建可擴展的數據湖倉
為了支持可觀測性的落地,基調聽云專門設計并搭建了一個可以并行存取多源異構數據的“數據湖倉”平臺。一方面如“數據湖”般可以低成本容納各類結構化和非結構化的數據;另一方面又具備“數據倉庫”的快速查詢與分析功能。可以作為可觀測性后端的數據交互引擎,充分支撐數據聚合、處理和分析等訴求。該存儲方案也具備良好的橫向擴展能力,可以適應未來數據量的拓展需要。
4、提供開放式的探索分析能力
基調聽云正在打造的新一代可觀測平臺,在保證數據采集完整性的前提下,將提供開放式的探索分析能力,支持客戶進行 Open-ended 的問題發現和根因追蹤,而不是僅僅依賴固化的分析流程或模板。這種“無邊界探索”的能力是可觀測性監控與傳統監控最核心的區別所在,也是基調聽云在產品設計上的一大創新點。
有了上面可觀測性的四大能力,在產品規劃上,基調聽云正致力打造一個開放、適應性強的新一代可觀測性平臺。該平臺預計會在 2023 年底正式發布,屆時將呈現基調聽云在可觀測性監控領域的系列創新。
具體來看,新平臺在數據采集端會提供業界領先的一體化探針能力,實現全面的監控數據自動收集,同時也將用戶體驗數據(DEM)有機納入;在數據處理端將具備可并行處理多源海量異構數據的可擴展“數據湖倉”方案;在分析和運維端將重點賦能開放式的探索分析能力,支持客戶自主、快速地進行問題發現和根因分析。
可以看出,新平臺在設計理念上更契合可觀測性的價值所在,既提供完備的監控數據,也讓客戶更自主地進行故障追蹤和定位,而不是依賴固定的模板或流程,可以更好應對云原生環境下的動態變化。這也使基調聽云的可觀測平臺方案在行業中能夠脫穎而出。
多年來,基調聽云始終是國內 APM 和可觀測性技術的引領者。這次新的可觀測平臺發布也將進一步鞏固基調聽云在行業中的技術優勢地位。目前基調聽云是國內唯一5次成功入選 Gartner APM 及可觀測性 “魔力象限”的國產可觀測性廠商,在未來的可觀測性賽道中,基調聽云也將保持持續領先的地位。
可觀測性監控的未來走向哪里
展望未來,陳靖華認為可觀測性監控將朝兩個方向發展:
一是構建可觀測性文化體系。可觀測性不僅僅是技術,需要貫穿整個軟件交付鏈。從產品設計到開發測試再到運維,每一個環節都要將可觀測性理念融入,逐步形成一整套可觀測性方法論。這套方法論將基于基本原理不斷迭代優化。
二是結合人工智能賦能自動化。在可觀測性方法論成熟后,可以嘗試使用人工智能技術進行自動化。未來可期待出現一個類似 ChatGPT 的 AI Agent,通過可交互的方式快速進行故障分析和定位。最終實現故障自愈,無需人工參與。但目前行業仍處在可觀測性方法論構建階段,完全自動化還需 5-10 年時間。
隨著 IT 系統向云原生架構演進,可觀測性必將成為監控體系的重要組成部分。陳靖華表示,基調聽云將繼續耕耘這個藍海技術領域,堅持以客戶需求為導向,持續進行技術創新與迭代。相信在不久的將來,基調聽云將會用自己的可觀測性實踐,幫助更多的企業實現數字化轉型,提升系統穩定性和運維效率,創造更大的商業價值。
審核編輯 黃宇
-
人工智能
+關注
關注
1791文章
47183瀏覽量
238253 -
觀測
+關注
關注
0文章
19瀏覽量
9606
發布評論請先 登錄
相關推薦
評論