應(yīng)用背景
Quartet最初使用Sumo Logic和Slack來(lái)提供實(shí)時(shí)的IT見(jiàn)解。工程師們將他們的事件警報(bào)通知直接發(fā)送到Slack中的一個(gè)特定頻道,使他們能夠在手機(jī)和桌面上接收警報(bào)。由于沒(méi)有輪流值班的時(shí)間表,所以當(dāng)出現(xiàn)問(wèn)題時(shí),大家都會(huì)在同一時(shí)間蜂擁而上解決問(wèn)題。最終,經(jīng)過(guò)討論后,一個(gè)人就會(huì)采取行動(dòng)--這種群發(fā)過(guò)程意味著服務(wù)中斷會(huì)持續(xù)下去,導(dǎo)致平均確認(rèn)時(shí)間(MTTA)和平均解決時(shí)間(MTTR)增加。Sumo Logic和Slack通知并沒(méi)有在團(tuán)隊(duì)內(nèi)部提供一種緊迫感。
隨著公司的發(fā)展,缺乏事故管理解決方案對(duì)提供客戶和患者所期望的始終在線的平臺(tái)造成了影響。
Quartet
Quartet開(kāi)發(fā)并提供了一個(gè)基于云的平臺(tái),該平臺(tái)能夠促進(jìn)醫(yī)療提供商和行為健康提供商在患者護(hù)理方面的溝通與協(xié)作。Quartet依靠先進(jìn)的分析,和經(jīng)過(guò)驗(yàn)證的治療程序,致力于推動(dòng)醫(yī)療保健服務(wù)適在提供者,患者和保險(xiǎn)公司之間的連貫性。Quartet重點(diǎn)關(guān)注的是那些24/7的醫(yī)療保健提供者,并在最大程度上確保數(shù)據(jù)安全性和隱私性,所以密切關(guān)注內(nèi)部的系統(tǒng)行為,并確保業(yè)務(wù)高效,安全地運(yùn)行是一件很重要的事。
公司目標(biāo)
改善他們的運(yùn)營(yíng)指標(biāo),降低平均確認(rèn)時(shí)間(MTTA)和平均解決時(shí)間(MTTR)。
虹科PagerDuty方案
隨著Quartet工程團(tuán)隊(duì)的發(fā)展,部署一個(gè)解決方案來(lái)協(xié)助維護(hù)他們的關(guān)鍵服務(wù)和系統(tǒng)成為一個(gè)迫切的問(wèn)題。PagerDuty被精心挑選出來(lái),幫助公司克服快速解決事故的挑戰(zhàn),同時(shí)也支持他們降低MTTA、MTTR和整體事故發(fā)生數(shù)量的目標(biāo)。Quartet看了一些其他的解決方案,但發(fā)現(xiàn)PagerDuty更成熟,總體上在行業(yè)內(nèi)有更好的聲譽(yù)。
Quartet的整個(gè)基礎(chǔ)設(shè)施都建立在AWS中,他們利用CloudWatch進(jìn)行系統(tǒng)級(jí)的資源報(bào)警和監(jiān)控。這些報(bào)警是通過(guò)網(wǎng)絡(luò)主機(jī)PagerDuty觸發(fā)的,外部則是他們的第三方云端日志管理和分析服務(wù)Sumo Logic。他們的所有主機(jī)上都運(yùn)行著代理,這些代理將日志推送到Sumo Logic,并每分鐘創(chuàng)建預(yù)定查詢,這將觸發(fā)PagerDuty的事件警報(bào)。
Shabib指出,有一個(gè)解決方案可以在問(wèn)題解決之前發(fā)出警報(bào)和提醒,這有助于在團(tuán)隊(duì)內(nèi)部建立一種責(zé)任感。這最終有助于強(qiáng)制生成高質(zhì)量的日志,同時(shí)允許個(gè)人在問(wèn)題發(fā)生時(shí)更迅速地調(diào)試這些問(wèn)題。該團(tuán)隊(duì)還有一個(gè)升級(jí)政策,當(dāng)主要聯(lián)系人無(wú)法確認(rèn)事件時(shí),該政策就會(huì)啟動(dòng),讓次要的待命聯(lián)系人采取行動(dòng)。
評(píng)價(jià):
"我認(rèn)為PagerDuty有助于將所有權(quán)交到工程師手中。讓他們離事件更近,所以當(dāng)事件發(fā)生時(shí),真正構(gòu)建該軟件的正確人員會(huì)得到通知,并能解決和改進(jìn)問(wèn)題。"Shabib表示。這比 "蜂群技術(shù) "要好得多,因?yàn)楹笳哂锌赡軐⑹录诺經(jīng)]有適當(dāng)背景或知識(shí)的人手中解決,更不用說(shuō)當(dāng)問(wèn)題本來(lái)只需一個(gè)人處理時(shí),整個(gè)團(tuán)隊(duì)都參與其中的低效率過(guò)程。
編輯:jq
-
IT
+關(guān)注
關(guān)注
2文章
862瀏覽量
63504 -
Logic
+關(guān)注
關(guān)注
1文章
97瀏覽量
46675 -
AWS
+關(guān)注
關(guān)注
0文章
432瀏覽量
24355 -
slack
+關(guān)注
關(guān)注
0文章
18瀏覽量
11078
原文標(biāo)題:虹科方案 | Quartet使用虹科PagerDuty協(xié)助維護(hù)關(guān)鍵服務(wù)和系統(tǒng)
文章出處:【微信號(hào):Hongketeam,微信公眾號(hào):廣州虹科電子科技有限公司】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論