電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)1月4日,西安“一碼通”又發(fā)生故障了,直到當(dāng)天下午才逐漸恢復(fù)正常,根據(jù)陜西發(fā)布的消息,一碼通首頁顯示正常,但點(diǎn)擊不能順利進(jìn)入。有市民接到通知:全市核酸檢測(cè)應(yīng)急平臺(tái)因當(dāng)前流量過大,網(wǎng)絡(luò)目前繁忙無法登陸,正在搶修。
這不是西安“一碼通”第一次發(fā)生故障,2021年12月20日,西安“一碼通”就曾因訪問量過大導(dǎo)致系統(tǒng)崩潰,無法掃碼,導(dǎo)致許多西安市民,難以進(jìn)行核酸檢測(cè)。
“一碼通”宕機(jī)對(duì)市民日常生活影響有多大?西安市民出行、上班、出入小區(qū)都需要出示“一碼通”,同時(shí)持48小時(shí)核酸檢測(cè)。一碼通故障,使得西安交通出現(xiàn)擁堵,核酸檢測(cè)也需要耗時(shí)更長(zhǎng),這不僅影響市民正常生活,還可能增加交叉感染的風(fēng)險(xiǎn)。
西安需要盡快解決“一碼通”接二連三崩潰的問題,而這就需要找到“一碼通”崩潰的真實(shí)原因是什么?
真的只是網(wǎng)絡(luò)擁堵導(dǎo)致崩潰嗎
根據(jù)官方的說法,是因?yàn)榫W(wǎng)絡(luò)擁堵。上一次系統(tǒng)崩潰的時(shí)候,即2021年12月20日,在西安疫情防控記者會(huì)上,彼時(shí)西安市大數(shù)據(jù)局局長(zhǎng)劉軍表示,12月20日早7時(shí)40分左右,西安“一碼通”用戶訪問量激增,每秒訪問量達(dá)到以往峰值的10倍以上,造成網(wǎng)絡(luò)擁塞,致使包括“一碼通”在內(nèi)的部分應(yīng)用系統(tǒng)無法正常使用。
“對(duì)于‘一碼通’平臺(tái)中斷對(duì)市民造成的不便,我們深表歉意,我們將持續(xù)加強(qiáng)對(duì)平臺(tái)的監(jiān)控,‘一碼通’平臺(tái)技術(shù)團(tuán)隊(duì)將24小時(shí)不間斷駐場(chǎng)運(yùn)維,加強(qiáng)網(wǎng)絡(luò)及系統(tǒng)資源保障,確?!淮a通’平臺(tái)良好運(yùn)行?!眲④娬f,在全員核酸檢測(cè)的特殊時(shí)期,為減輕系統(tǒng)***非必要不展碼、亮碼,在出現(xiàn)系統(tǒng)卡頓時(shí),請(qǐng)耐心等待,盡量避免反復(fù)刷新。
因?yàn)槲靼病耙淮a通”多次崩潰,1月5日凌晨,西安市大數(shù)據(jù)資源管理局黨組書記、局長(zhǎng)劉軍因履職不力,停職檢查。
那么如何解決網(wǎng)絡(luò)擁堵帶來的系統(tǒng)崩潰呢,最直接的辦法是,限流和擴(kuò)容。在2021年12月30日,工信部總工程師韓夏曾到西安調(diào)研,他就強(qiáng)調(diào),要持續(xù)做好大數(shù)據(jù)和信息化支撐,西安“一碼通”要加強(qiáng)技術(shù)改進(jìn)和網(wǎng)絡(luò)擴(kuò)容,確保平臺(tái)安全穩(wěn)定運(yùn)行。
然而真的是網(wǎng)絡(luò)擁堵造成系統(tǒng)崩潰,此前武漢疫情的時(shí)候,為什么沒有宕機(jī)的情況,武漢的長(zhǎng)住人口,比西安更多哦,資料顯示,2021年西安市常住人口數(shù)為1295.29萬人,武漢市常住人口達(dá)到1351.5萬。
有熟知網(wǎng)絡(luò)系統(tǒng)的人士認(rèn)為,網(wǎng)絡(luò)擁堵可能只是表象原因。據(jù)他分析,西安“一碼通”已經(jīng)上線很長(zhǎng)時(shí)間,大多數(shù)時(shí)候是穩(wěn)定的,西安的上班高峰期,也就是說掃碼高峰期,大概是在8點(diǎn)到9點(diǎn)之間,而幾次崩潰卻都發(fā)生在7點(diǎn)多,這個(gè)時(shí)候,網(wǎng)絡(luò)應(yīng)該是不擁堵的。
而且即使真是網(wǎng)絡(luò)擁堵導(dǎo)致系統(tǒng)崩潰,其實(shí)很容易解決,就如上文說的,限流、擴(kuò)容,這個(gè)操作并不難,而且耗時(shí)不長(zhǎng)。比如說限流,只需要把一部分網(wǎng)絡(luò)請(qǐng)求阻攔住,讓另外部分網(wǎng)絡(luò)請(qǐng)求通過就可以,擴(kuò)容就是增加服務(wù)器的硬件,比如內(nèi)存、CPU,或者如果服務(wù)器有集群,可以增加更多服務(wù)器。
如今計(jì)算機(jī)系統(tǒng),基本都是部署在云上,西安“一碼通”聽說是部署在阿里云上,在云計(jì)算平臺(tái)上限流、擴(kuò)容,可能并不需要花費(fèi)大半天時(shí)間,而西安“一碼通”上一次崩潰,到恢復(fù)耗費(fèi)了一整天時(shí)間,這次也花費(fèi)大半天。
另外還有一個(gè)很奇怪的現(xiàn)象,就是在12月20日當(dāng)天,“一碼通”的樣式回滾到了幾個(gè)月前,據(jù)描述,從10月底開始,“一碼通”二維碼就有了邊框注明***接種的狀態(tài),而在12月20日上午這個(gè)樣式里是有邊框的,到下午系統(tǒng)恢復(fù)之后,卻沒有邊框,顯示的是幾個(gè)月前的樣式,據(jù)該人士分析,如果是流量太大,直接優(yōu)化網(wǎng)絡(luò)和硬件就可以,程序怎么會(huì)回滾到幾個(gè)月前,真正的原因可能是,程序出了問題,一時(shí)改不好,所以直接找到以前的版本運(yùn)行。
再次崩潰的真實(shí)原因是什么
另一位技術(shù)工作人員就“一碼通”再次崩潰原因也進(jìn)行了分析,他認(rèn)為,是因?yàn)楦卟l(fā)下緩存被擊穿,且未用時(shí)序數(shù)據(jù)庫(kù),要解決這個(gè)問題,只有幾天時(shí)間是來不及的。
該工作人員表示,集群擴(kuò)容、性能調(diào)優(yōu),這些快速見效的方法肯定都已經(jīng)做了,還是會(huì)瞬間宕機(jī),而最深層的原因是,“一碼通”平臺(tái)自身系統(tǒng)設(shè)計(jì)的問題,系統(tǒng)性能不夠,短時(shí)間很難解決,現(xiàn)在只能是做好限流熔斷,避免全面崩潰。
針對(duì)“一碼通”崩潰的問題,有10余位來自騰訊、華為、中興等企業(yè)人士,從前端、后端、測(cè)試等多個(gè)方面進(jìn)行過分析,也談到系統(tǒng)設(shè)計(jì)的不足。
比如說,市民因?yàn)殚L(zhǎng)時(shí)間無法刷出健康嗎,多次退出刷新,導(dǎo)致更多新流量送達(dá)服務(wù)器,給服務(wù)器帶來壓力,這其實(shí)也說明西安“一碼通”的系統(tǒng)在限流措施上沒有做好。
再比如,“一碼通”平臺(tái)在設(shè)計(jì)的時(shí)候,可能并沒有考慮到高流量、高負(fù)載的情況,產(chǎn)品設(shè)計(jì)未考慮千萬級(jí)的并發(fā)訪問,而且交付前未進(jìn)行同等級(jí)的壓力測(cè)試。
為什么會(huì)出現(xiàn)這些情況,或許與項(xiàng)目實(shí)施過程中的一些不妥舉措有關(guān)。據(jù)了解,現(xiàn)在正在運(yùn)行的“一碼通”,是由市大數(shù)據(jù)資源管理局牽頭,中國(guó)電信西安分公司開發(fā)部署,作為總承包方,中國(guó)電信將該項(xiàng)目全部外包招標(biāo),而采購(gòu)來源單一。
這里列出部分采購(gòu)信息:
“一碼通”系統(tǒng)建設(shè)單一來源:西安東軟
“一碼通”安全配套單一來源:杭州安恒
可視化工程單一來源:中譯語通
200W的短信服務(wù)單一來源:阿里云
并不是說單一來源就一定會(huì)出問題,讓人疑惑的是,這么大的項(xiàng)目,為何不可以進(jìn)行多渠道采購(gòu),比如說,配套安全項(xiàng)目,全部采購(gòu)自杭州安恒,估計(jì)這么大的項(xiàng)目,金額都是百萬以上,因?yàn)槎际菢?biāo)準(zhǔn)設(shè)備,其實(shí)市面上可供選擇的產(chǎn)品很多,為什么只選擇一家。
另外還有一個(gè)很奇怪的情況,在2020年上線的時(shí)候,由西安市大數(shù)據(jù)管理局為主單位籌建的西安“一碼通”系統(tǒng),因?yàn)榻ǔ尚Ч浅:?,曾獲得表彰。然而在2021年11月26日,以西安科技局為甲方牽頭單位的西安“一碼通”系統(tǒng)開發(fā)項(xiàng)目公開采購(gòu)結(jié)果。
也就是說,西安已經(jīng)計(jì)劃不再使用由西安市大數(shù)據(jù)管理局為主籌建的“一碼通”系統(tǒng),而將更換為由西安科技局牽頭的“一碼通”,這不猶讓人猜測(cè),是不是在2021年12月20日之前,現(xiàn)行的西安“一碼通”系統(tǒng)已經(jīng)顯現(xiàn)出問題,因此更換牽頭方。
總結(jié)
截至1月4日,西安現(xiàn)有確診病例1741例,新增確診病例95例,幾乎成為繼2020年武漢以來疫情非常嚴(yán)重的城市。因此,保證“一碼通”系統(tǒng)的穩(wěn)定性,攻克上述提到的問題,是目前的當(dāng)務(wù)之急。
然而就如上文所言,如果是系統(tǒng)本身架構(gòu)設(shè)計(jì)的問題,短期內(nèi)只能做到讓系統(tǒng)恢復(fù)運(yùn)行,未來崩潰宕機(jī)的情況可能還是會(huì)時(shí)而發(fā)生,或許當(dāng)前也只能期待由西安科技局牽頭的“一碼通”新系統(tǒng)項(xiàng)目早日完成,而且期望它在系統(tǒng)設(shè)計(jì)上做到更好。
-
電信
+關(guān)注
關(guān)注
2文章
732瀏覽量
61986
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論