電源、機房環境集中監控系統的出現,將原來相對分散的各個機房的電源、空調設備的運行狀態和環境數據進行了集中,方便了監控。然而隨著我國通信事業的發展,通信布局從原來的大型母局式轉變到接入設備更靠近用戶的模塊局方式,模塊局的數量逐年遞增,監控中心通信服務器及數據庫服務器的負載能力基本上已經達到了滿負荷。另外,隨著電源技術的發展,智能化的設備也要求接入到系統中,這就帶來了系統響應緩慢,查詢歷史數據時間太長以及頻繁告警等問題。因而,對電源、機房環境集中監控系統進行系統優化和升級勢在必行。
現有系統分析
通信電源、機房環境集中監控系統主要存在以下問題:
首先,系統運行以數據庫為核心,要求中心數據庫實時更新,這就造成了對中心數據庫的訪問過于頻繁,壓力過大。
其次,數據庫服務器是下端前置設備和上端管理節點的連接通道,如果它出現問題,會引起系統的癱瘓。
最后,現有的通信服務器數量雖多,但它們之間不能進行靈活的切換。這樣造成了兩方面問題,一是系統的中心通信服務器主備用功能不強;二是可能出現中心通信服務器的負載不均衡現象,當大多數端局都連在一個通信服務器上時,就會出現問題。
系統優化和升級的具體操作
改造系統結構
目前的集中監控系統(以下簡稱:監控系統)多采用兩級結構,數據監控量越來越大。
圖1 目前監控系統結構圖
因此,我們采用三層結構(見圖2),即市中心(SC)層、區域中心(SS)層和監控單元(SU)層,各層的軟件通過數據交換協同工作,共同實現電源、機房環境集中監控的要求。區域中心(SS)設在集中監控中心(SC)下,它所監控的范圍是所在工作區域系統內的動力設備及環境。在此層,設置主備兩臺服務器,提高系統可靠性和穩定性,并能任意增加區域監控終端和統計管理終端。同時,它還負責處理各通信局(站)監控單元(SU)采集來的數據,并將處理過的數據上傳到監控中心,以緩解監控中心的壓力,提高了系統查詢、下發數據的運行速度。
圖2 改造后的結構圖
這種結構的優點是:
組網方便、靈活,大大減輕了中心的負荷壓力,解決了系統瓶頸問題。
物理區域分布,使一個區域節點故障不會影響其他區域節點,提高了系統的可用性和可靠性。
系統接入能力強,理論上可以無限接入,并可組成多級結構,可在監控網內任意地點安裝監控終端。
優化數據庫,修改表結構
數據庫開銷中的90%以上都是重復信息。系統升級后,對這些信息進行了過濾,減輕了系統的負荷。
另外,由于監控規模不斷擴大,形成了數量龐大的數據庫表,不易于管理。針對這個問題,我們采用了更先進的數據庫結構。具體操作是:取消端局分表結構,將端局表合并為一個表,包括主機表、機房表、設備表、設備狀態表等。修改后的數據庫表增加了表的檢索能力和檢索速度。
修改告警數據傳輸方式
目前監控系統告警查詢采取查告警表的方式,導致告警表的任務異常繁忙,嚴重時會影響監控系統正常運行。
升級后,通過軟件與監控模塊建立的通信協議機制,不斷的輪詢,判斷接收數據的合理性或將接到的控制數據轉換為監控模塊能識別的控制命令。通信服務器到監控中心主機的告警采用通知方式,告警反應時間比原來更快。具體操作是:
監控工作站增加服務端口(3388),負責接收告警、門禁及操作記錄等信息。告警信息由通信服務程序直接傳送到監控工作站,不再通過報警表傳遞。
通信服務器程序服務端口(8300)增加功能,提供告警、門禁及操作記錄等信息。監控工作站的更具情況可直接向通信服務程序查詢。
歷史數據傳輸
目前的歷史數據傳輸時間太過集中,造成整點時刻網絡及數據庫繁忙,并存在歷史數據丟失現象。
升級后,每個局的歷史數據在不同時刻傳輸,傳送時刻由系統采用隨機數方法產生。此外,在監控前置機中給每一個歷史數據塊增加上傳標志,標明該歷史數據塊是否已經成功上傳;如上傳失敗,則繼續將歷史數據上傳到通信服務器。
同樣,電池曲線也增加上傳標志,以保證電池曲線在上傳失敗后能繼續上傳到通信服務器。
配置表同步
現運行的監控系統各個監控部分之間缺乏配置同步機制,維持系統配置一致比較麻煩。
針對這一問題,我們建立了配置表同步機制。配置同步的邏輯采用自頂向下的方式,首先由監控工作站或管理工作站開始,先將配置更改信息寫入數據庫操作記錄表,然后由通信服務器讀入配置更改信息,再由通信服務器將此信息發送給監控前置機。監控工作站采取查操作記錄表方式更新本機配置。
自動配置更新可按如下層次更新,包括:端局層、機房層、監控器層、設備層、變量層。
遠程控制
本系統采用TCP/IP作為基本的通信協議,但現有遠程控制都通過通信服務器和數據庫中轉,過于依賴中心服務器,導致系統出現以下問題:
1、控制信息回饋不及時,不能準確提示控制成敗標志。
2、延長了控制操作的時間,存在控制不及時的隱患。
3、數據庫或通信服務器出現問題時,不能執行遠程控制操作。
升級后,改變遠程控制邏輯,由監控工作站直接控制監控前置機。這樣帶來了以下好處:
1、控制操作執行速度快,不存在延時問題。
2、信息回饋準確及時。
3、在通信服務器或數據庫出現問題時,不影響遠程控制操作。
系統時間
監控前置機對時系統存在問題,有時會出現錯誤時間。針對這一問題,我們修改了系統對時邏輯。當連續對時三次以上,不出現較大間隔時間誤差時,視為正確時間,否則視為錯誤時間。最大誤差間隔時間可調,一般設為對時周期的2~5倍。
告警過濾
產生誤告警的幾種主要原因見表1。
表1 產生誤告警原因列表
系統某些誤告警不能屏蔽,會產生頻繁告警。通過以下操作,可減少系統誤告警數量。
告警次數過濾:以超過告警線的次數來判斷是否產生告警/解除,當連續n次以上超過告警線才產生告警/解除,否則視為誤告警處理。次數n可以設定為0~10;次數設為0時,視為告警次數過濾無效。
告警延時過濾:以超過告警線的時間來判斷是否產生告警/解除,超過最大告警延時時間才產生告警/解除,否則視為誤告警處理。延時時間有效數據為0.5~60秒,超出此范圍視為告警延時無效;當不使用告警延時功能時,應設為0。
告警死區過濾:當監控量超過告警線產生告警后,如果監控量在告警線上下波動,沒有超過死區上下線,不產生重復告警及告警解除。告警死區設為0時,視為告警死區過濾無效。告警死區值根據具體情況指定,一般設為量程的2%左右。
同時,系統只將對用戶有用的報警和事件記錄放入信息欄。
復位控制
針對目前監控前置機在系統通信中斷時復位頻繁,造成硬盤等故障發生率提高的問題,我們在監控前置機增加系統通信斷復位次數限制,避免系統頻繁重啟。次數可指定,默認為3。
智能化設備的接入
升級后的監控系統可實現對任意智能設備的接入,但相對于通信接口間的硬件轉換,通信協議的轉換相對要復雜一些。其實現方式一是局方智能設備智能接口直接連接到監控系統嵌入式監控設備上,由其將轉換過的標準協議傳送到上位機;二是直接將局方智能設備智能接口接到上位機上,通過軟件實現協議轉換。無論是嵌入式監控設備還是上位機,都可以根據智能設備及智能協議不同插入不同的協議模塊。
監控系統使用的軟件協議轉化器是在局站中心的計算機中運行的,只占有很少的資源。它是一個小的轉換程序,在編寫時就能根據智能設備廠家提供的通信協議,將廠家提供的所有設備數據接入到監控系統,可以方便我們詳細全面地了解智能設備的運行狀況。
但是,監控系統不建議使用硬件協議轉換器,因為這樣增加了成本,并且在通信鏈路上增加了一個環節,影響了系統的安全性。此外,由于這種硬件協議轉換器是各個監控廠家自己生產的,當局端有新增設備時,會產生一系列問題。
增加圖像監控
國家相關部門已下達機房改造的規定,一些大型的機房已慢慢成為無人職守型。為了保證上述機房的安全運行要求,升級后的系統增加了圖像監控功能,能夠隨時觀察到機房的運行情況,并能得到相關的錄像資料。升級后的系統狀況如下。
系統結構:采用三級系統結構,包括遠程現場、監控區域和監控中心三級。
傳輸方式:PCM-2M通信線路連接或采用E1抽時隙復用數據方式。
監控現場:每個現場可接若干臺攝像機,攝像機的鏡頭和云臺可控。
告警聯動:可以任意監視各個現場,并接收各現場的報警信息,及時切換至告警現場,并可將現場情況錄像。
改進圖形界面
改進后的監控系統圖形監控界面具有組態功能,并提供了多種圖形控件,包括所需的組件和畫面制作向導等。界面中每一簡單的控件(線條、文本、按鈕等)均有影響其外觀的屬性。其中靜態屬性在系統投入運行后保持不變;動態屬性則隨系統運行過程中I/O設備數據的變化而變化。動態屬性的組態過程即完成動畫連接,如果用戶對自動生成的監控系統的圖形界面不滿意,還可以進行任意修改和編輯。在圖形界面上還根據用戶需要安置這些組件,如報警信息顯示,報表組態及打印,查詢和顯示等組件模塊。
無線的人機界面
針對當前移動領域的發展及應用情況,監控系統具備了手機短信息模塊,可將各類型的報警信息即時傳送到相關維護人員,并可進行簡單的交互控制。
增加基于B/S結構的遠程WEB實時監控
B/S結構,即Browser/Server(瀏覽器/服務器)結構,在傳統的C/S結構中間加上一層WEB服務層,把原來客戶機所的功能交給WEB服務層來實現。它有三層結構:表示層(用戶界面),功能層(WEB服務器)和數據層(數據庫服務器)。與C/S結構相比,B/S結構有以下優點:
(1) 用戶端只需安裝單一的瀏覽器軟件(如IE),界面統一,使用簡單。
(2) 由于客戶端無須安裝專用軟件,系統升級時只需更新WEB服務端的軟件,使系統易于維護。
(3) 采用標準的TCP/IP協議,HTTP協議,有良好的廣域網支持,擴展性好,易于實現多用戶監控,信息共享程度高。
采用B/S結構開發的實時遠程WEB監控系統提供了完整清晰的動態監控過程。頁面以秒為單位自動刷新。刷新時,整個文件重新執行一次到數據庫的連接、查詢和顯示,能將數據的變化及時反映給用戶。通過屏幕流程圖數據和數據表格的配合使用,完成了對設備從整體到細節的監控。
優化和升級后系統的性能
響應速度
升級后,監控中心對監控數據的響應速度有了明顯的提高,報警數據從現場發生到監控中心的反應時間在10秒以內。
通信的主備路由功能
系統升級后,增加了系統通信的主備路由功能,主服務器運行主通信服務程序,備用服務器運行備用通信服務程序。當主服務器失效時,系統自動切換到備用服務器上,使用備用數據庫和備用通信服務程序。端局可以動態的接入任意一個中心通信服務器,由此在中心實現動態的負載均衡和通信備份功能,再不會因為某一臺通信服務器的故障而使中心和端局的通信中斷。
當前通過97網接入的局向,可以配置一個撥號解調器,當97網出現故障時,自動啟用撥號備用路由進行通信。
系統的擴容能力
當前使用的系統,監控中心的承載能力是有限的。系統升級后,系統構架是專網,通過以太網絡設備組成三級網絡系統,提供可擴展光端口,而且是點對點樹狀結構,有極強擴展能力,不會產生傳輸瓶頸。
區域中心可以隨時接入新的通信服務器分擔通信及數據處理的任務。這樣,整個系統的實際擴容能力將不再受網絡結構的限制。
監控中心的兼容性
系統升級后的通信服務器支持Unix、Redhat Linux平臺,因此不必再選用昂貴的Alpha服務器;甚至在規模較小時,可采用性能良好的PC做同心服務器。在規模較大的監控系統中,可采用多通信服務器協同處理數據,這樣并不需要配置太高的服務器也能達到很高的處理能力和接入能力。
數據庫的壓力減小
系統升級后,監控站和通信服務器對數據庫的連接數量和訪問次數減少,從而減輕數據庫的壓力,使系統接入能力大大增強。同時,數據表的數量的減少,方便了數據庫表的維護。
結論
通過對監控系統的優化和升級,監控軟硬件更加趨于模塊化、組態化,使監控系統在運行速度、系統的容錯能力和可擴容能力都有很大提高,人機界面更加好友。實現了無人值守,節省運行費用,保證被監控設備運行正常,達到提高效率、減員增效的目的。
參考文獻
1、郵電部電信總局 《通信電源、機房空調集中監控管理系統技術要求》郵電部電信總局 ydn023-1996
2、計算機軟件質量保證計劃規范.GB/T12504-90
3、電網綜《1997》472號文. 通信電源、機房空調集中監控管理系統暫行規定
-
監控系統
+關注
關注
21文章
3904瀏覽量
174424 -
通信電源
+關注
關注
1文章
146瀏覽量
25522
發布評論請先 登錄
相關推薦
評論