風(fēng)險控制是金融領(lǐng)域必不可少的一環(huán)。近些年,為了實現(xiàn)更精準(zhǔn)、更高效的風(fēng)控,金融機構(gòu)紛紛引進了大數(shù)據(jù)技術(shù)。然而,大數(shù)據(jù)風(fēng)控并非十全十美,其尚存數(shù)據(jù)孤島、數(shù)據(jù)低質(zhì)和數(shù)據(jù)泄露等有效性不足問題,由此引發(fā)的風(fēng)險事件層出不窮。區(qū)塊鏈技術(shù)的橫空出世,為大數(shù)據(jù)風(fēng)控帶來了些許曙光。那么,大數(shù)據(jù)+區(qū)塊鏈,是否真的能在風(fēng)險控制領(lǐng)域擦出不一樣的火花?
金融業(yè)的核心在于風(fēng)險控制(以下簡稱風(fēng)控)。隨著金融業(yè)的快速發(fā)展,其風(fēng)險問題也愈發(fā)嚴(yán)峻。用個人經(jīng)驗預(yù)判風(fēng)險的傳統(tǒng)風(fēng)控模式,已經(jīng)不能完全滿足新時代的風(fēng)險管理需求。伴隨著大數(shù)據(jù)技術(shù)的日益普及和風(fēng)險管理中對數(shù)據(jù)資產(chǎn)的重視,大數(shù)據(jù)風(fēng)控應(yīng)運而生。然而,大數(shù)據(jù)風(fēng)控真的有效嗎?
大數(shù)據(jù)風(fēng)控美中不足
眾所周知,大數(shù)據(jù)風(fēng)控是指利用大數(shù)據(jù)技術(shù)對交易過程中的海量數(shù)據(jù)進行量化分析,進而更好地進行風(fēng)險識別和風(fēng)險管理。大數(shù)據(jù)風(fēng)控的核心原則是小額和分散,即預(yù)防資金相關(guān)者過度集中。小額的設(shè)計原則主要是針對海量數(shù)據(jù)構(gòu)成的統(tǒng)計樣本,盡量避免出現(xiàn)統(tǒng)計學(xué)中的“小樣本偏差”。分散的設(shè)計原則主要是通過分析借款主體的人口屬性、商業(yè)屬性、行為屬性和社交屬性等數(shù)據(jù)來建立大數(shù)據(jù)風(fēng)控模型。
基于大數(shù)據(jù)的風(fēng)險控制,突破了傳統(tǒng)風(fēng)險控制模式的局限,在利用更充分的數(shù)據(jù)的同時降低了人為偏差,是金融機構(gòu)創(chuàng)新傳統(tǒng)金融風(fēng)控模式的變革利器。應(yīng)用大數(shù)據(jù)技術(shù)不僅可以提高風(fēng)險控制的效率,還能節(jié)約風(fēng)控過程中的管理成本。然而,大數(shù)據(jù)風(fēng)控并不完美,首先,大數(shù)據(jù)風(fēng)控技術(shù)無法解決數(shù)據(jù)孤島問題,即數(shù)據(jù)的開放和共享問題。目前,政府、銀行、券商、互聯(lián)網(wǎng)企業(yè)和第三方征信公司掌握的信息難以在短時間內(nèi)互聯(lián)互通,從而形成一個個信息孤島。當(dāng)交易在不同金融機構(gòu)之間進行時,數(shù)據(jù)孤島導(dǎo)致了信息的不對稱、不透明,帶來了大量的多頭債務(wù)風(fēng)險和欺詐風(fēng)險。金融信貸行業(yè)若想利用大數(shù)據(jù)風(fēng)控技術(shù)提升風(fēng)控水平,就必須打破數(shù)據(jù)孤島,解決信息不對稱和信息獲取不及時的問題。
其次,數(shù)據(jù)低質(zhì)的問題也從一定程度上影響了大數(shù)據(jù)風(fēng)控的質(zhì)量,特別是來源于互聯(lián)網(wǎng)的半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),其真實性和利用價值很低。舉例來說,在美國,Lending club和Facebook曾經(jīng)合作獲取并利用社交數(shù)據(jù);在中國,宜信也曾大費周章地采集借款人的社交數(shù)據(jù),以期實現(xiàn)對借款人信用的全面評定。但是兩者得出的結(jié)論如出一轍,由于社交網(wǎng)絡(luò)中的數(shù)據(jù)主觀隨意性很強,這些在網(wǎng)上提取的社交數(shù)據(jù)根本不具有利用價值或者利用價值十分低,錯誤率高達(dá)50%。電商平臺上的交易數(shù)據(jù)也由于一些刷單現(xiàn)象而失真。這些信息的收集與利用就如同垃圾的運進運出,幾乎沒有任何意義。基于這些低質(zhì)數(shù)據(jù)的風(fēng)控效果也會大打折扣。
最后,大數(shù)據(jù)風(fēng)控過程中存在數(shù)據(jù)泄漏問題。近年來,數(shù)據(jù)泄漏風(fēng)險事件屢見報端。2015年2月12日,匯豐銀行大量秘密銀行賬戶文件被曝光,顯示其瑞士分支幫助富有客戶逃稅,隱瞞數(shù)百萬美元資產(chǎn),提取難以追蹤的現(xiàn)金,并向客戶提供如何在本國避稅的建議等。這些文件覆蓋的時間為2005年至2007年,涉及約3萬個賬戶,這些賬戶總計持有約1200億美元資產(chǎn),堪稱史上最大規(guī)模銀行泄密。Verizon發(fā)布的全球調(diào)研報告《Data Breach Investigations Report 2015》顯示,2015年網(wǎng)絡(luò)安全事件共有79790起,確認(rèn)的數(shù)據(jù)泄露事件超過2千個(2122個)。這些都降低了大數(shù)據(jù)風(fēng)控的有效性和應(yīng)用價值。
2008年11月,一位名叫中本聰(Satoshi Nakamoto)的加密愛好者首次提出了區(qū)塊鏈概念。區(qū)塊鏈本質(zhì)是一個去中心化的分布式數(shù)據(jù)庫,這種去中心化、開放自治、匿名不可篡改的數(shù)據(jù)結(jié)構(gòu)特性使其一出現(xiàn)就迅速取得大量關(guān)注。區(qū)塊鏈的出現(xiàn),也在一定程度上解決了大數(shù)據(jù)風(fēng)控有效性不足的問題。
區(qū)塊鏈誕生于比特幣體系中,比特幣是一種數(shù)字貨幣,而區(qū)塊鏈?zhǔn)怯涗涍@種貨幣發(fā)行與交易的“賬本”。為了不涉及被信任的第三方,這個“賬本”需要保證交易雙方能夠相互信任,且保證全部交易信息公開透明,自動傳達(dá)給交易雙方。因此,這個“賬本”必須是共享、自治和不可隨意更改的。用專業(yè)的說法就是,要有去中心化、開放自治和匿名不可篡改的特性。區(qū)塊鏈的四大核心技術(shù)實現(xiàn)了這些特性:(1)分布式記賬、分布式傳播、分布式存儲,保證了系統(tǒng)內(nèi)的數(shù)據(jù)存儲、交易驗證、信息傳輸全部都是去中心化的;(2)通過時間戳(區(qū)塊(完整歷史)+鏈(完全驗證)=時間戳)來記賬,形成了一個不可篡改、不可偽造的數(shù)據(jù)庫;(3)所有權(quán)的信任是“算法式信任”,非對稱加密算法保障交易數(shù)據(jù)的可信;(4)實現(xiàn)了可編程的智能合約,使系統(tǒng)可能去處理一些無法預(yù)見到的交易模式。
區(qū)塊鏈去中心化、開放自治、匿名不可篡改的特性使其應(yīng)用場景迅速擴張,從最初的數(shù)字貨幣,到證券交易結(jié)算、會計審計等涉及合約審核的金融領(lǐng)域,再到政府、醫(yī)療等公共領(lǐng)域,區(qū)塊鏈技術(shù)解決了現(xiàn)實世界中存在的諸多技術(shù)壁壘。具體來說,京東白條近兩年構(gòu)建了稱之為“四大發(fā)明”的大數(shù)據(jù)模型體系:司南-風(fēng)險管理模型系統(tǒng)、火藥-量化運營模型體系、活字-用戶畫像模型體系、造紙-大數(shù)據(jù)征信模型體系。毋庸置疑,與傳統(tǒng)風(fēng)控體系比較,依托于大數(shù)據(jù)技術(shù)的“四大發(fā)明”的風(fēng)控體系能夠更加精準(zhǔn)識別及遏制套現(xiàn)行為,目前為止已經(jīng)為1億用戶完成了信用評估。然而,大數(shù)據(jù)風(fēng)控體系仍然無法解決其數(shù)據(jù)源上存在的問題。無獨有偶,將區(qū)塊鏈技術(shù)應(yīng)用于大數(shù)據(jù)風(fēng)控體系,可以有效解決大數(shù)據(jù)風(fēng)控數(shù)據(jù)孤島、數(shù)據(jù)低質(zhì)和數(shù)據(jù)泄露等數(shù)據(jù)源問題。
影響大數(shù)據(jù)風(fēng)控有效性的關(guān)鍵因素,是數(shù)據(jù)庫的維護成本和信息傳遞效率。而單從數(shù)據(jù)的角度來看,區(qū)塊鏈?zhǔn)且粋€由所有參與者共同記錄(而不是中心化機構(gòu)單獨記錄)信息、由所有參與記錄的節(jié)點共同存儲(而不是存儲在中心化機構(gòu)中)并且不可隨意篡改的數(shù)據(jù)庫。在這個區(qū)塊鏈數(shù)據(jù)庫中,每個用戶節(jié)點都擁有整個數(shù)據(jù)庫的完整拷貝,并且當(dāng)某個用戶節(jié)點要對數(shù)據(jù)庫寫入數(shù)據(jù)時,它需要向區(qū)塊鏈網(wǎng)絡(luò)廣播這些數(shù)據(jù),以便其余用戶節(jié)點對這些數(shù)據(jù)進行驗證審核操作。只有全網(wǎng)共同驗證和認(rèn)可后,數(shù)據(jù)才能寫入?yún)^(qū)塊鏈,并且一旦數(shù)據(jù)寫入?yún)^(qū)塊鏈后,就不能隨意修改或刪除。這樣一個用區(qū)塊鏈技術(shù)構(gòu)建的數(shù)據(jù)庫,對于大數(shù)據(jù)風(fēng)控有效性的提高有重要意義。
首先,區(qū)塊鏈去中心化、開放自治的特征可有效解決大數(shù)據(jù)風(fēng)控的數(shù)據(jù)孤島問題,使得信息公開透明地傳遞給所有金融市場參與者。設(shè)想以下情況:一位客戶同時向A銀行和B銀行各申請一百萬的房屋抵押貸款,但其房屋價值只有一百萬。如果兩家銀行加入了同一區(qū)塊鏈,就能即時辨別出客戶的交易行為和風(fēng)險,避免放貸總額超過抵押值。除了交易主體外,監(jiān)管部門也可以作為一個用戶節(jié)點加入?yún)^(qū)塊鏈,實時監(jiān)控其他用戶節(jié)點的交易信息,防范風(fēng)險事件的發(fā)生,無需再等到事后申報。利用區(qū)塊鏈中全部數(shù)據(jù)鏈條進行預(yù)測和分析,監(jiān)管部門可以及時發(fā)現(xiàn)和預(yù)防可能存在的系統(tǒng)性風(fēng)險,從而更好地維護金融市場秩序和提高金融市場效率。可見,區(qū)塊鏈去中心化的特征,可以消除大數(shù)據(jù)風(fēng)控中的信息孤島,通過信息共享完善風(fēng)險控制。
其次,區(qū)塊鏈的分布式數(shù)據(jù)庫可改善大數(shù)據(jù)風(fēng)控數(shù)據(jù)質(zhì)量不佳的問題。使得數(shù)據(jù)格式多樣化、數(shù)據(jù)形式碎片化、有效數(shù)據(jù)缺失和數(shù)據(jù)內(nèi)容不完整等問題得到解決。在區(qū)塊鏈中,數(shù)據(jù)由每個交易節(jié)點共同記錄和存儲,每個節(jié)點都可以參與數(shù)據(jù)檢查并共同為數(shù)據(jù)作證,這提高了數(shù)據(jù)的真實性。而由于沒有中心機構(gòu),單個節(jié)點不能隨意進行數(shù)據(jù)增減或更改,從而降低了單一節(jié)點制造錯誤數(shù)據(jù)的可能性。舉例來說,在銀行或交易平臺內(nèi)部建立私有鏈,一位客戶構(gòu)成一個節(jié)點,一方面可以避免大量數(shù)據(jù)由單一信息中心集中錄入和存儲,降低操作風(fēng)險;另一方面,賣方單方面的刷單行為可以通過買方的驗證得到遏制,從而保證數(shù)據(jù)的真實有效。偽造的數(shù)據(jù)若想通過區(qū)塊鏈網(wǎng)絡(luò)的驗證,必須掌握該私有鏈中超過50%的計算能力,當(dāng)節(jié)點足夠多的時候,該私有鏈的控制成本急劇上升。另外,區(qū)塊鏈中每個節(jié)點都有完整的數(shù)據(jù)副本,只有當(dāng)整個區(qū)塊鏈系統(tǒng)發(fā)生宕機時數(shù)據(jù)才會丟失,并且數(shù)據(jù)記錄一旦寫入就不能修改。因此,區(qū)塊鏈具備公開、透明和安全的特點,可以從源頭上提高數(shù)據(jù)質(zhì)量,增強數(shù)據(jù)的檢驗?zāi)芰Α?/p>
最后,區(qū)塊鏈可以防范數(shù)據(jù)泄漏問題。由于區(qū)塊鏈數(shù)據(jù)庫是一個去中心化的數(shù)據(jù)庫,任何節(jié)點對數(shù)據(jù)的操作都會被其他節(jié)點發(fā)現(xiàn),,從而加強了對數(shù)據(jù)泄漏的監(jiān)控。另外,區(qū)塊鏈中節(jié)點的關(guān)鍵身份信息以私鑰形式存在,用于交易過程中的簽名確認(rèn)。私鑰只有信息擁有者才知道,就算其他信息被泄漏出去,只要私鑰沒有泄漏,這些被泄漏的信息就無法與節(jié)點身份進行匹配,從而失去利用價值。對于來自數(shù)據(jù)庫外部的攻擊,黑客必須要掌握50%以上的算力才能確保攻破區(qū)塊鏈,節(jié)點數(shù)量越多,所需的算力也就越大,當(dāng)節(jié)點數(shù)達(dá)到一定規(guī)模時,進行一次這樣的攻擊所花費的成本是巨大的。因此,通過區(qū)塊鏈對信息存儲進行加密,保證數(shù)據(jù)安全,防范大數(shù)據(jù)風(fēng)控中可能出現(xiàn)的數(shù)據(jù)泄露問題,是區(qū)塊鏈的重要應(yīng)用之一。 大數(shù)據(jù)風(fēng)控+區(qū)塊鏈,未來在哪里?
BI Intelligence在最近剛發(fā)布的一份Fintech行業(yè)報告中預(yù)測,區(qū)塊鏈的應(yīng)用和普及將成為2016年金融業(yè)的最大趨勢。那么,區(qū)塊鏈會成為大數(shù)據(jù)風(fēng)控的助推器嗎?筆者認(rèn)為,“區(qū)塊鏈+大數(shù)據(jù)風(fēng)控”的發(fā)展前景是廣闊的,但不是一蹴而就的。隨著金融科技的發(fā)展以及資金和人力的持續(xù)投入,區(qū)塊鏈會與大數(shù)據(jù)技術(shù)跨界融合,對風(fēng)控領(lǐng)域現(xiàn)存問題提出更合理更高效的解決方案。
區(qū)塊鏈的身份驗證和加密技術(shù)也將在大數(shù)據(jù)風(fēng)控中發(fā)揮作用。區(qū)塊鏈采用非對稱加密,在信息傳遞過程中,用公鑰(公開全網(wǎng)可見)對交易信息加密,被加密過的信息只有擁有相應(yīng)私鑰(只有交易發(fā)起者才知道)的人才能夠解密;在身份驗證時,用私鑰對信息簽名,用公鑰驗證簽名者的身份(公鑰不能解出私鑰,但能驗證私鑰)。與此同時,利用大數(shù)據(jù)技術(shù)從數(shù)據(jù)端對引流的客戶進行身份驗證、特征篩選等,以此提高反套現(xiàn)、反欺詐和反作弊的準(zhǔn)確度。
過去幾年,在金融活動的合約審查及執(zhí)行過程中,人為的操作風(fēng)險和道德風(fēng)險一直是大數(shù)據(jù)風(fēng)控難以解決的問題之一。大數(shù)據(jù)風(fēng)控主要針對客戶端,對于金融機構(gòu)的員工操作風(fēng)險和道德風(fēng)險層面,大數(shù)據(jù)風(fēng)控技術(shù)顯得捉襟見肘。2009年初,區(qū)塊鏈技術(shù)的出現(xiàn),使智能合約系統(tǒng)成為可能。基于區(qū)塊鏈可編程的特點,可將合約指令嵌入到區(qū)塊鏈中,有效弱化中心系統(tǒng)在數(shù)據(jù)監(jiān)控和驗證中的作用,并消除人為操作因素可能引發(fā)的風(fēng)險。金融機構(gòu)逐漸開始布局構(gòu)建區(qū)塊鏈技術(shù)的智能合約系統(tǒng),使合約的合規(guī)檢查自動化。
區(qū)塊鏈技術(shù)作為一種特定的數(shù)據(jù)庫技術(shù),將與大數(shù)據(jù)風(fēng)控技術(shù)實現(xiàn)優(yōu)勢互補,進而構(gòu)建全新的數(shù)據(jù)組織方式。筆者相信,在不久的將來,兩項技術(shù)的跨界融合將會上升到公司級和國家層的治理層面,從而帶領(lǐng)我們進入強信任背書的大數(shù)據(jù)時代。
評論
查看更多