QQ億級日活躍業務SNG后臺架構的概覽
大小:0.4 MB 人氣: 2017-10-10 需要積分:1
作為本次技術開放日后臺架構專場的出品人我今天給大家帶來《構造高可靠海量用戶服務-SNG數億級日活躍業務后臺核心技術揭秘》,一起探討怎么 從可用性的維度提升海量服務的可靠性及海量服務的故障處理方式,包括:
SNG后臺架構的概覽;面向海量服務的設計原則。騰訊海量服務的后臺設計一般通用的解決方案是什么,包括如何提升海量服務的高可用性,如何從架構層、產品層、運維層提升服務的合理性;后臺服務故障解決思路。
SNG業務情況
SNG是騰訊基于社交的業務群,包括QQ、QZone、QQ音樂、騰訊云、K歌、企鵝MV、全民影帝、天天P圖等眾多業務。根據SNG后臺架構從業務邏輯、數據層面、運維包括整個可用性方面的星級評定:
QQ是騰訊持續了16年的業務,它的業務非常復雜,從通訊角度主要是消息存儲和轉發,QQ團隊致力于打造一個永不宕機的服務。QZone一直是中國社交產品的領航者,是騰訊第一個博士Ross總在負責的業務,前端需要高性能的接入服務器,它的移動端通過框架WNS逐漸開放到騰訊云上,第三方開發商也可以用到 QZone高性能的基礎框架。QQ音樂主要涉及流媒體點播、MV體系、海量正版知識庫建設等,目前已經DAU對外我們已經宣布過億,是國內人氣最旺的領先互聯網音樂平臺。騰訊云有著騰訊最優秀的海量服務解決能力,給各種2B運營商提供運營化平臺,可以節省創業公司特別是中小型初創公司大量研發成本,在做的應該有不少是創業者,歡迎來用騰訊云產品。全民K歌,兩年前Ross總從空間過來兼任數字音樂部后開始啟動團隊做的,在推出不到兩年的時間目前注冊用戶已遠超競品,在業務邏輯方面主要涉及大量的UGC流媒體上傳存儲和分發、feeds管理和互動、知識庫管理等,大家沒安裝的可以回去盡快安裝一個,里面也有優質的用戶在唱歌。
如何定義可用性
從大家都熟知的案例入手,12306剛上線的時候經常會出現掛機的情況然后顯示一條公告“正在進行故障維修”,特別是春節、節假日等搶票高峰期,嚴重影響用戶的使用。
作為互聯網架構師,要怎么提升12306的可用性?故障明顯影響可用性的指標,那么到底怎樣定義大型互聯網服務的可用性?怎樣定義一個合理的團隊可用性能指標?如何提升可用性?
1. 怎樣定義大型互聯網服務的可用性?
可用性是系統或服務的健壯性和可靠性。每個服務包括QQ、QZone發生故障我們都會評估,是一級故障還是二級故障還是三級故障。
在業務場景里,最核心的是用戶價值的體現,我們把可用性更合理定義為:
P=(總用戶價值-因事故損失的用戶價值)/總用戶價值*100%
2. 怎樣定義可用性指標?
無論是用QQ、QQ音樂還是QQ空間,如果中斷1分鐘,用戶自查問題;中斷5分鐘以上用戶開始有疑問;中斷30分鐘的時候論壇等地方開始有投訴出現,而中斷數個小時的時候,用戶有可能會放棄這個軟件投奔競品。
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%