一直以來,在信息技術(shù)最核心的三大件“芯片、操作系統(tǒng)、數(shù)據(jù)庫”上,市場(chǎng)格局穩(wěn)定,由英特爾、微軟、甲骨文等科技巨頭推動(dòng)行業(yè)和技術(shù)發(fā)展。
老牌巨頭優(yōu)勢(shì)巨大,但在中國這個(gè)爆發(fā)式增長(zhǎng)需求的市場(chǎng),技術(shù)亟待更新突破。于是,以阿里為代表的科技公司,開始從零研發(fā),走上這條極其艱辛的自研技術(shù)創(chuàng)新之路。這其中,數(shù)據(jù)庫領(lǐng)域尤為艱難,技術(shù)挑戰(zhàn)大,研發(fā)成本和不確定性風(fēng)險(xiǎn)高,面臨太多的困難挑戰(zhàn)。
專注分布式關(guān)系數(shù)據(jù)庫的OceanBase團(tuán)隊(duì),甚至一度瀕臨解散。
而在2020年5月20日這天,作為支付寶完全自主研發(fā)的金融級(jí)分布式關(guān)系數(shù)據(jù)庫,OceanBase把名字赫然刻在了TPC組織的官網(wǎng)上,而緊隨其后的記錄還是自己(2019年10月創(chuàng)造過新紀(jì)錄)。
這一次,OceanBase再破世界記錄,性能分?jǐn)?shù)首次突破億級(jí)大關(guān)達(dá)到7.07億tpmC,相比去年提升近11倍。注:tpmC值在國內(nèi)外被廣泛用于衡量計(jì)算機(jī)系統(tǒng)的事務(wù)處理能力,為“每分鐘內(nèi)系統(tǒng)處理的新訂單個(gè)數(shù)”的英文縮寫)
這標(biāo)志著OceanBase成為全球最快數(shù)據(jù)庫,實(shí)現(xiàn)了數(shù)據(jù)庫這一基礎(chǔ)技術(shù)的革命性突破,也是自研技術(shù)對(duì)世界IT技術(shù)作出的重要貢獻(xiàn)。
OceanBase突破背后,一路艱辛,沒有捷徑。
一年二刷TPC-C榜單,OceanBase顛覆了什么?
首先認(rèn)識(shí)TPC。TPC 是由數(shù)十家會(huì)員公司創(chuàng)建的非盈利組織,成立于1988年,總部設(shè)在美國,圖靈獎(jiǎng)得主 Jim Gray 是奠基人。
TPC-C是全球最具公信力的聯(lián)機(jī)交易處理數(shù)據(jù)庫的功能與性能結(jié)合的測(cè)試標(biāo)準(zhǔn),金融、電信、政府等關(guān)鍵領(lǐng)域的客戶一般參照 TPC-C 結(jié)果來衡量各個(gè)數(shù)據(jù)庫廠商的事務(wù)處理能力。通俗來講,TPC-C測(cè)試是對(duì)于商業(yè)數(shù)據(jù)庫想要證明自身實(shí)力的一個(gè)硬性門檻,被譽(yù)為“數(shù)據(jù)庫領(lǐng)域的世界杯”。
但是一直以來,TPC-C榜單都是老牌巨頭在競(jìng)爭(zhēng),尤其是Oracle、微軟和IBM為首的數(shù)據(jù)庫廠商和硬件廠商長(zhǎng)期霸榜。
因?yàn)橥ㄟ^測(cè)試,確實(shí)太難了。無論是數(shù)據(jù)庫從業(yè)者還是高校教師,都?jí)粝胫胚M(jìn)這個(gè)榜單。
誕生于2010年的OceanBase最初是用在支付寶上,它又被稱為“超級(jí)會(huì)計(jì)師”,可以在一秒內(nèi)同時(shí)記數(shù)萬筆帳,并且不出一點(diǎn)錯(cuò)。經(jīng)過長(zhǎng)時(shí)間積累,2019年10月,OceanBase一舉打破Oracle“壟斷”9年之久的TPC-C評(píng)測(cè)的世界紀(jì)錄,tpmC高達(dá)6088萬之后,自研數(shù)據(jù)庫首次在世界舞臺(tái)上有了自己的聲量。
支付寶OceanBase再次登頂TPC-C榜單
而此次通過最新測(cè)試,OceanBase成為唯一超千個(gè)節(jié)點(diǎn)并通過TPC-C測(cè)試的分布式數(shù)據(jù)庫,成績(jī)較去年更勝一籌。更重磅的是,其性能分?jǐn)?shù)首次突破億級(jí)大關(guān)達(dá)到7.07億tpmC,相比去年提升近11倍。
從關(guān)系數(shù)據(jù)庫的角度看,在這么大體量下,通過測(cè)試已經(jīng)非常困難,保持系統(tǒng)性能更加困難。1500多個(gè)數(shù)據(jù)庫節(jié)點(diǎn),5000多萬個(gè)倉庫以及對(duì)應(yīng)數(shù)量的客戶端,并進(jìn)行8個(gè)多小時(shí)的持續(xù)壓測(cè),對(duì)整個(gè)系統(tǒng)是極大的考驗(yàn)。
而我們之所以說OceanBase實(shí)現(xiàn)了突破和顛覆,關(guān)鍵就在于其采用了新一代分布式設(shè)計(jì)技術(shù),顛覆了傳統(tǒng)數(shù)據(jù)庫集中式處理技術(shù)架構(gòu)。
如何理解?
一般而言,傳統(tǒng)數(shù)據(jù)庫只能通過提升單機(jī)性能來提升整體性能,難以滿足市場(chǎng)持續(xù)擴(kuò)張的數(shù)據(jù)處理需求。OceanBase通過分布式擴(kuò)展集群實(shí)現(xiàn)擴(kuò)展能力的大幅提升,并通過分布式選舉技術(shù)、事務(wù)技術(shù)充分保證業(yè)務(wù)場(chǎng)景的一致性,實(shí)現(xiàn)整體性能的數(shù)量級(jí)提升。
在本次測(cè)試時(shí),數(shù)據(jù)庫機(jī)器規(guī)模擴(kuò)大到1557臺(tái)且單機(jī)倉庫數(shù)增長(zhǎng)到3.6萬,總數(shù)據(jù)規(guī)模達(dá)到了近6PB,最大單表掃描數(shù)據(jù)總行數(shù)超過20萬億行(TPC-H最大的測(cè)試是100TB)。
除了性能優(yōu)勢(shì),在兼容性上,OceanBase較傳統(tǒng)數(shù)據(jù)庫也有創(chuàng)新,其可高度兼容Oracle和Mysql,支持一鍵快速遷移,并提供云上的完整生態(tài)服務(wù),解決了授權(quán)費(fèi)用貴、硬件成本高、架構(gòu)與運(yùn)維復(fù)雜、遷移難度大等傳統(tǒng)數(shù)據(jù)庫難題。
用10年,OceanBase做到別人做不到的事
螞蟻金服高級(jí)研究員、OceanBase 創(chuàng)始人陽振坤始終認(rèn)為:
“直到今天,生產(chǎn)系統(tǒng)中沒有一個(gè)商業(yè)數(shù)據(jù)庫有分布式,除了OceanBase,這是我們做到了別人做不到的事。”
縱觀當(dāng)今全球數(shù)據(jù)庫應(yīng)用情況,關(guān)系數(shù)據(jù)庫依然是主流,而集中式系統(tǒng)依然大行其道,甲骨文、IBM、微軟源源不斷從中獲得收入。
此前,分布式數(shù)據(jù)庫長(zhǎng)期存在于理論中并沒有在生產(chǎn)中實(shí)現(xiàn),雖然成本可以降低,但缺點(diǎn)亦十分突出:普通PC機(jī)單個(gè)來看都達(dá)不到金融級(jí)別的穩(wěn)定性,如果其中一臺(tái)機(jī)器罷工,容易產(chǎn)生多米諾骨牌效應(yīng)般的坍塌效應(yīng)(這個(gè)短板被視為世界級(jí)難題)。
而OceanBase解決分布式數(shù)據(jù)庫穩(wěn)定性的方式之一,是將每一份數(shù)據(jù)同時(shí)備份三份,存放在三臺(tái)不同的機(jī)器上。其原理是,一臺(tái)PC機(jī)出故障的概率如果是千分之一,兩臺(tái)同時(shí)壞的概率可能就是百萬分之一,三臺(tái)同時(shí)壞的概率則是十億分之一。
早年,在阿里的眾多業(yè)務(wù)中,無論是淘寶還是支付寶,集中式的關(guān)系數(shù)據(jù)庫都扮演著十分關(guān)鍵的角色,不可能擺脫它。但是,市面上的商業(yè)數(shù)據(jù)庫在高擴(kuò)展、高并發(fā)和低成本上遠(yuǎn)遠(yuǎn)無法滿足淘寶和支付寶的高成長(zhǎng)速度,且遇到業(yè)務(wù)激增時(shí)IOE投資要放大幾百倍甚至幾千倍。
“誰都買不起了”。阿里勢(shì)必需要考慮切換軌道——在2009年啟動(dòng)“去IOE”。“去IOE”工程的戰(zhàn)略價(jià)值何在?一般被認(rèn)為有三點(diǎn):架構(gòu)靈活支撐業(yè)務(wù)飛速發(fā)展;基礎(chǔ)工程技術(shù)和人才的積累;大幅降低成本。
在數(shù)據(jù)庫領(lǐng)域,盡管彼時(shí)市面上非關(guān)系數(shù)據(jù)庫競(jìng)相涌入,開源數(shù)據(jù)庫局限性比較大,兩者對(duì)巨頭的關(guān)系數(shù)據(jù)庫的沖擊可以用蚍蜉撼樹來形容——阿里決定走自研關(guān)系數(shù)據(jù)庫的道路。
盡管“自研”策略備受爭(zhēng)議,遇到各種反對(duì),但一旦江河解凍,就會(huì)勢(shì)如劈竹,無法阻擋。OceanBase沖在了最前面,做起了先鋒。2010年5月,阿里邀請(qǐng)陽振坤加盟淘寶,由此拉開了 OceanBase的自主研發(fā)之路。
2010 年:創(chuàng)始人陽振坤加入阿里巴巴,OceanBase 正式立項(xiàng);
2014 年:OceanBase 0.5 版本發(fā)布,替代 Oracle 在支付寶交易系統(tǒng)上線,負(fù)擔(dān)“雙十一”10% 流量;
2015 年:網(wǎng)商銀行成立,OceanBase 成為全球首個(gè)應(yīng)用于金融核心業(yè)務(wù)系統(tǒng)的分布式關(guān)系數(shù)據(jù)庫;
2016 年:OceanBase 1.0 版本在支付寶賬務(wù)系統(tǒng)上線,支撐 12 萬筆 / 秒支付峰值;
2017 年:支付寶首次把所有核心數(shù)據(jù)鏈路搬到 OceanBase 上。同年,OceanBase在多家商業(yè)銀行上線;
2019 年:OceanBase 獲得 TPC-C 基準(zhǔn)測(cè)試排名榜首;
2020 年:OceanBase以7.07億tpmC的成績(jī)打破去年TPC-C基準(zhǔn)測(cè)試紀(jì)錄。
據(jù)了解,OceanBase早年第一個(gè)客戶是淘寶收藏夾。
當(dāng)時(shí)的淘寶收藏夾業(yè)務(wù)高速發(fā)展,數(shù)據(jù)庫訪問量飛快增長(zhǎng),服務(wù)器數(shù)量需要翻一倍甚至幾倍才能應(yīng)對(duì)業(yè)務(wù)需求。陽振坤主動(dòng)提出可以用OceanBase,把服務(wù)器的數(shù)量降低一個(gè)數(shù)量級(jí)。
在淘寶收藏夾吃完OceanBase這只螃蟹后,確實(shí)取得了不錯(cuò)的效果,也由此,OceanBase在內(nèi)部獲得了更多信任。但由于找不到更多愿意使用的業(yè)務(wù),陽振坤和他的伙伴們經(jīng)歷了一段低谷期,用高德總裁劉振飛(2009年組建淘寶技術(shù)保障部)的話來說,回想起來當(dāng)時(shí)都是折磨、痛苦和眼淚,今天說起來可以算是傳奇和笑話了。
OceanBase團(tuán)隊(duì)在2012年走到了最困難的時(shí)候,數(shù)度瀕臨解散。
2012 年底,集團(tuán)把 OceanBase 整個(gè)團(tuán)隊(duì)調(diào)到了支付寶。支付寶屬于金融領(lǐng)域,面臨的數(shù)據(jù)庫挑戰(zhàn)會(huì)比其他業(yè)務(wù)更大,這相當(dāng)于給了 OceanBase 團(tuán)隊(duì)一次從頭開始的機(jī)會(huì)。
2013年夏天,支付寶開始“去IOE”,希望能夠把Oracle數(shù)據(jù)庫換掉。陽振坤主動(dòng)向當(dāng)時(shí)的螞蟻金服CTO程立推薦了OceanBase,并得到了認(rèn)可。此后OceanBase在阿里內(nèi)部得到更多場(chǎng)景試煉,并逐步做到核心系統(tǒng)。
從“小我”到融入“海洋”
從瀕臨解散到浴火重生,OceanBase 走了快十年,它用了漫長(zhǎng)的旅途進(jìn)入了“無主之地”(自研分布式關(guān)系數(shù)據(jù)庫),沒有前人走過;它解決了自研信息技術(shù)三大軟肋(芯片、操作系統(tǒng)、數(shù)據(jù)庫)之一的數(shù)據(jù)庫難題,完全自主研發(fā)、安全可控。
它已經(jīng)向所有人證明了通用的分布式關(guān)系數(shù)據(jù)庫是能夠做成的,而且能真正應(yīng)用在生產(chǎn)系統(tǒng)中。
當(dāng)我們從頭來看陽振坤跟OceanBase團(tuán)隊(duì)定下的策略,不得不感嘆想法的“超前”:走標(biāo)準(zhǔn)化!做一個(gè)通用的關(guān)系數(shù)據(jù)庫產(chǎn)品!他們不僅僅要在公司內(nèi)部使用它,還要實(shí)現(xiàn)外部商用——這帶來的挑戰(zhàn)就是投入更多人力和時(shí)間,以滿足市面上所有功能需求。
這就像“OceanBase”這個(gè)名字的寓意一樣:從一開始就立志做一個(gè)像海洋一樣的海量數(shù)據(jù)庫,征途就是星辰大海。
大音希聲大象無形,走向通用走向標(biāo)準(zhǔn)化,這件酷酷的事,支付寶做到了,而且把整個(gè)TPC-C測(cè)試變成了一種普惠的測(cè)試,為今后更廣泛應(yīng)用打下基礎(chǔ)。
當(dāng)然,OceanBase早已經(jīng)走出淘寶和支付寶的處女地,更多企業(yè)愿意擁抱它。
目前OceanBase已服務(wù)大量金融、電信等行業(yè)企業(yè),如建設(shè)銀行、南京銀行、西安銀行、人保健康險(xiǎn)、蘇州銀行、廣東農(nóng)信、網(wǎng)商銀行等多家商業(yè)銀行和保險(xiǎn)機(jī)構(gòu)。全球前四名的支付平臺(tái),兩家的核心系統(tǒng)都在使用OceanBase數(shù)據(jù)庫。
回首過往,之所以O(shè)ceanBase能做成,能從當(dāng)年的淘寶收藏夾走到支付寶,走進(jìn)今天金融場(chǎng)景甚至更多領(lǐng)域,不僅是阿里,也是時(shí)代給了它一個(gè)好的發(fā)展機(jī)會(huì)。可以說,其高光有著行業(yè)和時(shí)代的必然性。
今天,阿里巴巴/支付寶內(nèi)部有數(shù)以萬計(jì)的數(shù)據(jù)庫,總有一些業(yè)務(wù)由于數(shù)據(jù)量和自身業(yè)務(wù)需求等因素,可以先試用自研技術(shù),再一步步地將數(shù)據(jù)庫做到關(guān)鍵系統(tǒng)。就是遵循這樣的邏輯,加之敢冒風(fēng)險(xiǎn)的勇氣,OceanBase乃至阿里的云計(jì)算業(yè)務(wù)都能在阿里自然而然“長(zhǎng)出來”,造就一段經(jīng)典商業(yè)案例。
踩在過去的肩膀上,迎接未來的數(shù)據(jù)爆發(fā),OceanBase會(huì)摘到更豐盛的果實(shí)。讓中國數(shù)據(jù)庫技術(shù)服務(wù)全球,是OceanBase的初心,相信OceanBase未來會(huì)在更大海洋中發(fā)揮價(jià)值,與人類共享科技成果。
責(zé)任編輯:pj
-
微軟
+關(guān)注
關(guān)注
4文章
6600瀏覽量
104134 -
數(shù)據(jù)
+關(guān)注
關(guān)注
8文章
7067瀏覽量
89127 -
PC機(jī)
+關(guān)注
關(guān)注
2文章
201瀏覽量
28595
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論