色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

從阿里云盤崩潰談起,云平臺穩定性如何保證?

白犀牛通信 ? 來源:白犀牛通信 ? 2023-02-09 10:42 ? 次閱讀

近日,阿里云盤爆發故障,停服了近5小時,隨后官方發了道歉信,也明確了賠償方案,但故障原因至今未公布。坊間傳言是因為用戶集中下載某電視劇資源所致,具體情況不明。

阿里云盤和阿里云有沒有關系呢?雖然這是兩個獨立的品牌,但阿里云盤應該算是阿里云主要的SaaS產品之一,其資源肯定也是承載在阿里云的平臺上的,所以這個故障算到阿里云頭上應該不冤。

這是繼阿里云香港區故障后,又一次引發社會輿論關注的故障事件。當然,發生故障并不可怕,IT系統發生故障太正常不過了,但一個機房出問題就全局宕機了?一個系統故障就導致服務中斷5個小時?說好的可用區隔離,跨區高可用,自動恢復自動切換,這些寫進SLA里的保障措施全部失效!這就有點不同尋常了。

從這個角度看,這兩次故障事件正在折射出阿里云一些內部的問題,甚至直接暴露出包括阿里云在內的云廠商巨頭在前些年野蠻生長、快速擴張過程中遺留下來的很多bug還有待修補。這些bug的構成非常復雜,有技術的因素,也有機制流程的因素,還有人的責任意識的因素,如果這些bug不能在短時間內得到有效解決,可以預料,這樣級別的故障可能還將發生,這對阿里云等巨頭們的品牌形象、客戶信任度都是嚴重的傷害。

更關鍵的是,當前國內云計算應用已從互聯網拓展至政務、金融、工業、醫療、交通等傳統行業,在這個過程中,云上系統的復雜度極大提升,給云廠商帶來的挑戰將會更大!

其一,云上系統深度應用微服務等云原生技術架構,應用之間存在錯綜復雜的依賴關系,服務性能瓶頸難以分析,故障影響范圍難以評估,故障根因難以定位,給平臺的運維保障工作帶來了諸多困難;

其二,云上系統的故障率會隨設備的增加而呈指數級增長,單一節點問題可能會被無限放大,日常運行過程中不可避免的伴隨異常發生,如何解決這些偶發、突發的問題,仍是一個技術難題;

其三,云上系統節點分布范圍更廣、數量更多,高度依賴網絡質量,給日常運維過程中的日志采集、變更升級等都帶來了新的挑戰。

與此同時,由于產業互聯網核心業務上云進程加速,而核心業務系統作為支撐用戶服務的關鍵,往往具備業務連續性要求高、并發請求量大、業務激增隨機性強的特點,一旦發生故障,其影響范圍更大,后果更嚴重。為什么阿里云香港區事件直接導致阿里云換帥,正是因為事件影響的范圍極廣,對阿里云的品牌形象造成了極大的損害。

那該怎么辦呢?

從阿里云近期接連的兩次故障來看,云服務商亟需加深對云上系統穩定性的認知,構建安全生產和穩定性保障雙體系,推動云上系統的穩定性持續提升。

第一、建設云上業務安全生產體系,完善流程管理機制

一是事前的主動防御,通過完備的故障分析、風險檢測、全局管控等事前風險防護治理手段,變被動為主動,盡量減少故障風險發生的概率;

二是事中的全局監控,通過深度應用大數據、人工智能等技術,對信息系統進行全局監測和預警,實現實時風險態勢感知;

三是事后的應急保障,將信息化手段與傳統方式相融合,多種應急方式,最大程度降低業務系統故障導致的損失和影響,有效保障業務系統的穩定性和連續性。

在這個過程中還有一個關鍵點在于人的責任意識的培養,所有管理機制流程到最后還是需要人來執行落地。在這方面,運營商云或許更有優勢,畢竟電信運營商刻在DNA里的就是對“保障通信生命線”的追求,電信級服務對他們來說是一種信仰,也是一種職業習慣。

第二、構筑全流程穩定性保障體系,提升技術保障能力

事前做好規劃工作,設計高度韌性系統。在軟件設計階段,重點關注系統架構和容量規劃的設計,同時配合混沌工程實驗持續保持、提升系統韌性。

事中全方位檢測,提高系統故障逃逸能力。通過對鏈路中各環節運行數據的整合及聯動,在故障發生時幫助運維人員迅速定位故障原因,最大化利用系統的觀測數據輔助進行根因分析,實現高效的故障修繕與恢復。此外,要確保“應用多活”成為保障業務連續性的關鍵抓手,而并非是一句宣傳口號。當災難(含基礎設施故障)發生時,多活系統在分鐘級內實現業務流量切換,有效保障業務系統持續穩定運行,提升系統故障逃逸能力。

事后構建故障閉環,降低故障復現率。完善故障管理機制,故障管理機制包括規范管理故障響應流程、故障升級機制、故障復盤機制,規范技術人員在應對突發故障時的操作流程,明確職責邊界,提升溝通效率,推動故障解決,提升故障處理效率。

在以上這些方面,一些正在崛起的新興云廠商可能比老牌巨頭走得更快更前,比如,移動云一直聚焦云服務穩定性領域涉及的關鍵技術,從混沌工程、全鏈路壓測建設、可觀測性平臺建設、應用多活架構等多方面提升移動云穩定性。同時加速運維系統的“平臺化”、“數據化”、“智能化”建設,持續加強移動云穩定性。在去年8月工信部召開的“云服務穩定安全運行應急演練專項活動”中,移動云榮獲“十佳優秀報告”榮譽稱號。

最后,張勇在就任阿里云總裁后又發了一封內部信,里面有一段話——

“唯有日積月累的客戶信任,才可以讓我們真正在市場中保持領先優勢,才能讓我們擁有持久的核心競爭力。任何故障的發生,對阿里是萬分之一、百萬分之一的概率,一旦發生在每個客戶身上就是百分之百。我們必須急客戶所急,想客戶所想,既主動解決客戶看得到的問題,更要把客戶尚未感知到的風險防患于未然。”

望行業共勉吧。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 云計算
    +關注

    關注

    39

    文章

    7837

    瀏覽量

    137540
  • 智能化
    +關注

    關注

    15

    文章

    4899

    瀏覽量

    55493
  • 阿里云
    +關注

    關注

    3

    文章

    965

    瀏覽量

    43117

原文標題:從阿里云盤崩潰談起,云平臺穩定性如何保證?

文章出處:【微信號:baixiniu2018,微信公眾號:白犀牛通信】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    電源濾波器的頻率響應穩定性如何保證

    電源濾波器清除電源無用頻率,保障后端設備電能穩定。頻率響應穩定性至關重要,受元件性能、拓撲結構、阻抗匹配、環境干擾影響。需選用高性能元件、優化結構等保證穩定性,未來趨勢為高頻、寬頻帶、
    的頭像 發表于 12-19 15:01 ?148次閱讀
    電源濾波器的頻率響應<b class='flag-5'>穩定性</b>如何<b class='flag-5'>保證</b>?

    探究阿里代理商的奧秘

    在數字化時代,阿里服務器以其卓越的性能和可靠的穩定性,成為了眾多企業首選的服務提供商。然而,你是否曾好奇,為何選擇阿里
    的頭像 發表于 12-12 14:24 ?95次閱讀

    庫存平臺穩定性建設實踐

    作者:京東物流 尹昊喆 前言 本文總結庫存平臺穩定性建設中遇到的問題以及解決方案。感謝【金鵬】、【孫靜】、【陳瑞】同學在本文撰寫中提供的內容及幫助! 庫存平臺面臨的穩定性挑戰 庫存
    的頭像 發表于 12-11 09:50 ?198次閱讀
    庫存<b class='flag-5'>平臺</b><b class='flag-5'>穩定性</b>建設實踐

    esp8266連接阿里平臺時mqtt連接超時

    esp8266nodemcu在使用arduino.ide連接阿里平臺的時候,wifi配置正常但連接不上mqtt,顯示報錯如下: Attempting MQTT connection...失敗, rc=-4 5秒! 這是我所
    發表于 10-26 21:39

    如何保證備自投裝置可靠性和穩定性

    備用電源自動投入裝置(簡稱備自投)是一種保證配電系統可靠、連續供電的安全設備,因此它的可靠性和穩定性直接決定了系統的供電質量,那么該如何保證備自投裝置的可靠性和穩定性呢?今天
    的頭像 發表于 10-17 17:44 ?238次閱讀
    如何<b class='flag-5'>保證</b>備自投裝置可靠性和<b class='flag-5'>穩定性</b>

    海外大帶寬服務器穩定性如何

    隨著互聯網技術的飛速發展,越來越多的企業和個人開始選擇海外大帶寬服務器來滿足其在線業務的需求。相比傳統的物理服務器托管模式,服務器提供了更高的靈活性、可擴展性和安全性。然而,對于那些依賴穩定網絡連接來進行關鍵業務操作的用戶而
    的頭像 發表于 10-14 09:24 ?193次閱讀

    使用API Post測試阿里物聯網平臺動態注冊

    使用API Post測試阿里物聯網平臺動態注冊
    的頭像 發表于 10-05 19:08 ?323次閱讀
    使用API Post測試<b class='flag-5'>阿里</b><b class='flag-5'>云</b>物聯網<b class='flag-5'>平臺</b>動態注冊

    海外大帶寬服務器是什么?穩定性如何

    海外大帶寬服務器是一種提供高速網絡連接和強大計算能力的服務器,它因其高帶寬和快速響應速度,在視頻直播、在線游戲、大數據分析等領域有廣泛應用。關于其穩定性,由于擁有高性能的硬件設施和專業的維護服務,能夠提供穩定可靠的運行環境,這
    的頭像 發表于 08-20 11:12 ?371次閱讀

    高并發物聯網平臺是什么

    高并發物聯網平臺是一種能夠處理大量設備同時連接并進行數據交換的計算平臺。這種平臺通常被設計用來應對來自數以萬計甚至數十億計的物聯網設備的
    的頭像 發表于 08-13 13:50 ?271次閱讀

    阿里設備的物模型數據里面始終沒有值是為什么?

    如上圖,不知道講清楚沒有。 IG502自定義TOPIC 上發到阿里沒問題。采用阿里物模型的格式來上發就不行。請大佬指教!
    發表于 07-24 07:49

    晶振頻率穩定性:關鍵指標與影響因素

    ,從而影響晶振的頻率。一般來說,溫度升高,晶體振動頻率會降低;溫度降低,振動頻率會升高。因此,在實際應用中,我們需要確保晶振在工作在合適的溫度范圍內,以保證其頻率穩定性。2. 負載變化:晶振輸出頻率會受
    發表于 05-17 15:34

    運放穩定性的判斷原理的補償原理?

    有反饋的運放是輸出端到輸入端的反饋支路,但是在電路上輸入和輸出也是通過反饋支路直接電氣連接的,為什么不考慮輸入經反饋支路到輸出端的電路作用? 由反饋之路的數學關系可得知反饋運放的穩定性數學關系,1
    發表于 05-06 22:09

    Rokid聯手阿里,AR設備與服務深度整合

     對于用戶而言,阿里將向新注冊用戶提供100GB的永久存儲空間,同時對購買Rokid新品的用戶提供額外存儲空間以及會員權益包。此外,Rokid新品預計將于4月20日在杭州舉行的Rokid Open Day 2024上正式亮相
    的頭像 發表于 04-16 10:03 ?531次閱讀

    什么是熱電偶穩定性?影響熱電偶穩定性的主要因素

    什么是熱電偶穩定性?影響熱電偶穩定性的主要因素 熱電偶熱穩定性怎樣檢測? 熱電偶穩定性是指熱電偶在一定時間范圍內的溫度測量值的穩定程度。在實
    的頭像 發表于 03-08 15:32 ?1713次閱讀

    什么是晶振的頻率穩定性?如何確保晶振的穩定性呢?

    什么是晶振的頻率穩定性?如何確保晶振的穩定性呢? 晶振的頻率穩定性是指晶振在工作過程中頻率的變化程度。對于許多電子設備和系統而言,晶振頻率的穩定性是非常重要的,因為它直接影響到設備的精
    的頭像 發表于 01-24 16:11 ?1375次閱讀
    主站蜘蛛池模板: 亚洲99精品A片久久久久久| 国产精品婷婷久青青原| 欧美丰满熟妇无码XOXOXO| 国产毛多水多高潮高清| 父亲猜女儿在线观看| 24小时日本在线观看片免费| 亚洲看片无码免费视频| 亚洲 天堂 国产在线播放| 1区2区3区4区产品不卡码网站| 亚洲精品天堂无码中文字幕影院| 伊人久久艹| 大桥未久与黑人中出视频| 老司机午夜影院味味| 蜜芽一二三区| 黄色毛片a| 欧美日韩无套内射另类| 亚洲2023无矿砖码砖区| 99久免费精品视频在线观看2| 国产精品亚洲AV毛片一区二区三区| 久久婷婷五月综合色情| 日日噜噜噜噜夜夜爽亚洲精品| 亚洲一区成人| 大稥焦伊人一本dao| 久久水蜜桃亚洲AV无码精品偷窥| 色尼玛亚洲综合| 嘟嘟嘟WWW在线观看视频高清| 久久草香蕉频线观| 少女亚洲free| 97无码欧美熟妇人妻蜜| 韩国女主播内部vip自带氏巾| 日本人六九视频| 自慰弄湿白丝袜| 国产亚洲美女在线视频视频| 妙玉被肉干高H潮文| 亚洲国产精麻豆| 年轻的搜子8中字在线观看| 青青草国产精品久久| 亚洲国产在线精品国自产拍五月| 野花韩国高清完整版在线观看5| 99久久爱看免费观看| av天堂电影网|