本文對現有的基于經典機器學習和深度學習方法的日志異常檢測方法進行了實證研究,并提出了一種自動化日志異常檢測評估框架LightAD。
1. 日志異常檢測介紹
日志是AIOps領域需要處理的常見數據,是程序運行過程中由代碼打印出的一些非結構化的文本信息,日志通常由時間戳和文本信息組成。日志實時記錄了系統的運行狀態,包括正常運行狀態和故障發生時的狀態。因此通過收集和分析日志,可以快速檢測和定位出系統中存在的異常。
本文研究了深度學習方法在日志異常檢測中與更簡單技術相比的優越性,在五個公共的日志異常檢測數據集上對輕量級傳統機器學習方法(如KNN、SLFN)和深度學習方法(如CNN、NeuralLog)進行了全面的評估。
本文的研究結果表明,通過合適的數據處理方式,輕量級機器學習方法能夠在時間效率和準確性方面都優于深度學習方法。為了評估深度學習方法的必要性,本文提出了一種自動化的日志異常檢測模型評估框架LightAD。LightAD是一種基于貝葉斯優化器的優化訓練時間、推斷時間和性能得分的評估框架。通過自動化超參數調優,LightAD可以實現在日志異常檢測模型之間進行公正的比較,使運維工程師能夠針對不同的在線異常檢測目標來選擇合適的異常檢測模型。
2. 對現有方法的全面評估
深度學習方法除了本身擁有更多的參數量外,其使用的數據處理方式通常也比較耗時。例如,CNN方法需要使用日志解析工具對日志進行解析,NeuralLog需要用深度語言模型BERT來對日志進行處理。本文對輕量級傳統機器學習方法采用了更高效的日志處理方式。
具體而言,本文在處理以日志塊來聚合的數據集(如HDFS)時,從每個文本日志消息中提取標記,以空格分隔,并刪除包含數字的標記。本文使用每個塊的ID將日志消息分組成日志序列,并用事件頻率對其進行編碼。整個預處理工作流程如下圖所示。
3. 全新的日志異常檢測評估框架:LightAD
為全面綜合評估日志異常檢測算法,本文提出了基于貝葉斯優化起的自動化算法優化和評估框架LightAD,LightAD結構如下圖所示。本文首先準備了一組簡單的基準模型及其初始的超參數空間,對于每個模型,本文會自動化的優化模型的超參數。通過綜合考慮三個維度的模型收益打分:
(1)準確性
(2)每個日志序列的訓練時間
(3)每個日志序列的推斷時間
最終抉擇出模型收益分數最高的異常檢測算法。
模型收益的多目標優化公式如下:
下圖是在去除重復數據的HDFS數據集上使用LightAD進行異常檢測方法優化和評估的結果,最高模型收益的分數由黑色加粗標識。從圖中可以看出,LightAD挑選出的模型都是輕量級的機器學習方法。
4.總結
本文來自華為云PaaS技術創新Lab和香港中文大學(深圳)賀品嘉助理教授團隊合作項目成果產出,相關研究成果已被軟件工程領域頂會ICSE 2024(CCF A類)正式錄用,文章詳細內容即將公開,敬請關注。
文章來自 PaaS技術創新Lab,PaaS技術創新Lab隸屬于華為云,致力于綜合利用軟件分析、數據挖掘、機器學習等技術,為軟件研發人員提供下一代智能研發工具服務的核心引擎和智慧大腦。我們將聚焦軟件工程領域硬核能力,不斷構筑研發利器,持續交付高價值商業特性!加入我們,一起開創研發新“境界”!
詳情歡迎聯系:
mayuchi1@huawei.com;bianpan@huawei.com
原文標題:【AIOps】一種全新的日志異常檢測評估框架:LightAD,相關成果已被軟工頂會ICSE 2024錄用
文章出處:【微信公眾號:華為DevCloud】歡迎添加關注!文章轉載請注明出處。
-
華為
+關注
關注
216文章
34411瀏覽量
251506
原文標題:【AIOps】一種全新的日志異常檢測評估框架:LightAD,相關成果已被軟工頂會ICSE 2024錄用
文章出處:【微信號:華為DevCloud,微信公眾號:華為DevCloud】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論