TECS OpenStack資源池主機磁盤分區使用率過高的問題處理

故障現象

某運營商TECS資源池上報“主機磁盤分區使用率過高”的告警，如下圖所示。

故障分析

查看“主機磁盤分區使用率過高”告警詳情，通過處理當前告警的節點和對應的磁盤分區能夠快速的處理和恢復告警。

告警處理完成后需要進一步排查分區增長的原因，有如下4種情況：

空間分配不足，規劃的分區空間不滿足現場集群和規模的要求。

出現大量crash和異常debug日志短時間沖擊磁盤分區，可能是人為或者進程死循環導致。

日志文件或者定期輪詢文件未生效，導致歷史文件超限。

后端存儲異常或者后端存儲復用，導致磁盤使用率過高。

具體分析過程如下：

1. 根據告警詳細信息，使用SSH方式登錄相應節點。

2. 在異常節點中執行df -h命令，檢查輸出和操作系統運行情況，查看是否有系統只讀不可寫等系統內核崩潰情況，如下圖所示。

3. 檢查/var目錄下是否有過大問題。通過在每級目錄中執行du -sh * 命令，檢查文件大小，從而排查最大異常問題，按照經驗var下異常大小文件一般是/var/log下的日志，如下圖所示。

4. 檢查日志存儲文件大小，如下圖所示。

5. 根據檢查結果發現，logrotate機制未生效，日志文件未按照設定參數被壓縮，轉儲不成功，導致日志文件過大，占用磁盤空間。

故障處理

1. 執行如下命令，清理磁盤。

a. 執行> /var/lib/logrotate/logrotate.status命令，清空轉儲記錄。

b. 執行logrotate -d /etc/logrotate.conf命令，手動進行日志轉儲。

c. 執行echo > /var/log/tecs/access/neutron/neutron-api.log命令，寫入空，覆蓋到日志文件內，如下圖所示。

2. 清理完成后重新檢查文件大小和磁盤占用情況，問題解決。

3. 總結：對于磁盤分區使用率高問題，如果使用率達到100%就會導致節點不可用，系統自動備份失敗，數據庫定時備份失敗，無法登錄root用戶，等相關問題，存在很大的隱患，發現問題需要盡快定位對象主機上磁盤占用高的文件，進行處理。

本次是由于logrotate機制未生效，日志文件未按照設定參數被壓縮、轉儲，從而使日志文件不停增大，占用全部磁盤空間導致。

清理文件，觸發轉儲服務后，磁盤占用恢復正常。

建議定期檢查系統磁盤空間占用，預防此類事件發生。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

主機

主機

+關注

關注
0

文章
1024

瀏覽量
35611
磁盤

磁盤

+關注

關注
1

文章
386

瀏覽量
25457
命令

命令

+關注

關注
5

文章
712

瀏覽量
22400

原文標題：TECS OpenStack-資源池主機磁盤分區使用率過高的問題處理

文章出處：【微信號：ztedoc，微信公眾號：中興文檔】歡迎添加關注！文章轉載請注明出處。

【雨林木風系統下載教程】利用XP系統磁盤分區來提升讀寫...

XP中，利用圖形界面和人性化的操作方式，可對硬盤進行更加高效靈活的分區操作。不僅如此，借用電腦常用軟件下載的Windows XP強大的磁盤分區管理功能，還可增強磁盤分區的合理使用，并有效提升

發表于 07-19 10:44

linux的三種磁盤分區

硬盤分區有三種，主磁盤分區（83）、擴展磁盤分區（5）、邏輯分區（包括swap交換分區82）。一個硬盤主

發表于 07-12 06:56

Linux系統教程之磁盤分區和LVM系統的詳細資料概述

本文檔的主要內容詳細介紹的是Linux系統教程之磁盤分區和LVM系統的詳細資料概述主要內容包括了：1.磁盤相關概念2.磁盤分區工具3.創建 LVM 系統4.維護 LVM 系統

發表于 10-30 16:11 ?14次下載

Windows 10 2004版或解決CPU和磁盤使用率過高的問題

相信不少人在等待Windows 10的重要更新版本，事實上微軟也在努力推進，其會在新系統中加入一種新的算法，該算法使整體系統性能有了相當大的提升，特別是在CPU和磁盤使用率方面讓系統的運轉更加高效。

發表于 01-06 08:49 ?3172次閱讀

微軟Windows 10研究新的方法管理現代磁盤分區

如果要刪除舊磁盤并創建新分區或擴展特定磁盤的空間，則需要依賴Windows 10的磁盤管理工具。在Windows 10上管理磁盤分區的最簡單

發表于 03-19 15:06 ?2207次閱讀

微軟Win10搜索磁盤和CPU使用率過高的問題修復

Windows 10 20H1更新將于今年4月份發布，其中包含針對Windows搜索索引器導致的磁盤和CPU使用率過高的修復程序。今天，微軟確認正在開發另一個Windows 10更新，其中將包括Windows Search更多更

發表于 03-26 14:39 ?3559次閱讀

cpu使用率過高怎么解決_cpu使用率過高是什么原因

本文主要闡述了cpu使用率過高的原因及解決方法。

發表于 04-29 09:34 ?1767次閱讀

預裝Win7系統劃分更多的磁盤分區的方法

　　硬盤分區有三種：主磁盤分區、擴展磁盤分區、邏輯分區。一個硬盤主分區至少有1個，最多4個，擴展分區

發表于 07-08 10:50 ?0次下載

獲取磁盤分區UUID的方法介紹

UUID（通用唯一標識符，Universally Unique Identifiers）是磁盤分區的屬性，在管理具有數百個驅動器的服務器時至關重要。

發表于 01-31 17:45 ?1.3w次閱讀

TECS資源池上報網絡流程異常告警的問題處理

某資源池TECS上報網絡流程異常告警，告警單次持續15秒-4分鐘之間。

發表于 06-07 09:41 ?1094次閱讀

linux系統如何進行磁盤分區？

linux系統如何進行磁盤分區？ 磁盤分區是在Linux系統中進行硬盤劃分的一種方法，它可以將一個物理硬盤劃分為多個邏輯分區，每個分區可獨立使用，使得儲存數據更加有序和靈活。 1. 為

發表于 12-19 11:35 ?1248次閱讀

磁盤分區工具parted的使用方法

傳統的MBR分區表格式，僅支持最大四個主分區，而且不可以格式化2TB以上的磁盤，因此，大磁盤更適合使用parted工具進行GPT的分區格式。

發表于 03-03 09:39 ?313次閱讀

TECS OpenStack資源池虛機殘留導致網元異常的問題處理

某運營商TECS資源池的一臺主機內存故障，進行關機、內存更換操作，虛機自動遷移到其他主機上，同時做了其他虛擬機的手動遷移操作。后續在

發表于 03-03 09:42 ?189次閱讀

TECS OpenStack資源池時間同步失敗的故障分析

某運營商TECS OpenStack資源池，在當前告警中顯示“時鐘同步失敗”，以10分鐘整數倍為間隔上報“時間同步失敗”告警，持續時間30秒-1分鐘不等。

發表于 03-03 10:09 ?220次閱讀

TECS OpenStack資源池虛機寫磁盤時延高告警的問題處理

某運營商TECS資源池，在當前告警中顯示“虛機寫磁盤時延高告警”，如下圖所示。告警統計總體平均10分鐘左右自動恢復。

發表于 03-21 09:36 ?191次閱讀

中興文檔
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 中興FTTR常用業務配置指導
Hot 服務器RAID陣列開啟cache緩存的解決方案

New MPLS和SR傳輸技術的區別
New 異常零流量小區檢測功能介紹

发布文章

精選推薦
更多

文章

資料

帖子

Arm+AWS實現AI定義汽車基于Arm KleidiAI優化并由AWS提供支持

Arm社區
1天前

401 閱讀

使用OpenVINO優化并部署飛槳PP-OCRv4模型

jf_23871869
1天前

266 閱讀

ADC的五大架構及其工作原理

MPS芯源系統
1天前

370 閱讀

智多晶XSTC_8B10B IP介紹

智多晶
1天前

231 閱讀

必易微級聯混合式準諧振雙管反激全套方案

必易微
1天前

267 閱讀

巨星MTV2002OK字幕制作視頻教程

七上八下
28 MB

10積分

84下載

pycom-micropython ESP32的MicroPython

韓剛龍
8.80 MB

2積分

8下載

Yii2 ExtJs5 RBAC網站管理擴展工具

劉杰
0.76 MB

2積分

1下載

Apache Camel K輕量級集成框架

vinww特煩惱
5.79 MB

免費

0下載

vim-matlab neovim的MATLAB插件

呂珠峰
0.27 MB

2積分

5下載

【「芯片通識課：一本書讀懂芯片技術」閱讀體驗】芯片的封裝和測試

jf_87445960
23小時前

136 閱讀

CS32G020用戶區配置問題求助

1天前

416 閱讀

小功率開關電源的經濟效益提升方案（RCC 電路的徹底解析）

yuu_cool
1天前

607 閱讀

華為柔性印制電路板(FPC)設計規范

yuu_cool
1天前

616 閱讀

關于7805穩壓電路一直無法穩壓的問題?

jf_06470635
1天前

1161 閱讀

推薦專欄
更多