導讀:自從阿里巴巴提出“中臺”的概念之后,這個詞匯就成為各領域企業關注的焦點,很多人在考慮建設自己的中臺。然而,構建中臺是否真有必要?是否所有的企業都要建設中臺?如何構建中臺等問題還是讓他們疑惑。近日,宜信科技中心 AI 中臺團隊負責人王東在一篇技術專訪中,從大數據和 AI 賦能金融業務的角度,分享了中臺、大數據、AI 等軟件研發趨勢為業務賦能的經驗與思路。
本文為王東的采訪實錄整理,從技術視角到業務視角,在中臺的落地契機、AI與大數據關系、AI和大數據技術的落地等方面提出了他的看法。
以下為采訪實錄:
1、很多人將金融行業的發展劃分為三個階段:信息金融時代,主要指銀行卡的出現,銀行開始做集中的數據管理;互聯網金融時代,互聯網的發展,使得用戶可以通過 PC 和 APP 辦理金融業務,這一階段金融機構通過數據平臺管理和使用數據;智慧金融時代,也就是現在,金融機構通過大數據和 AI 技術讓金融服務智能化。
作為有多年金融行業經驗的大數據專家,您認為在這 3 個階段里,數據為金融服務賦能的方式出現了哪些變化?分別有哪些典型的產品化表現?
王東:按照 DIKW 體系, 這三個階段對應的是數據電子化、數據信息化、數據知識化和數據智能化的過程。
信息金融時代,金融機構都在進行金融基礎設施建設,數據被集中化管理,金融機構從手工勞動和紙質單據中解放出來,提高效率,本質上這是電子化、信息化的過程,金融機構的數據進行結構化和梳理,并被分析和使用。
這個階段數據倉庫和數據集市的理論體系誕生并得到完善,基于數倉理論體系的軟件工具發布,數據的 BI 分析(使用 ETL、建立數據倉庫、OLAP 分析和可視化報表)在金融機構中最先開始落地并產生價值,基于數據的早期信用卡風控模型開始建立并投入使用。
互聯網金融時代,是數據爆炸的時代,云計算和大數據技術興起,金融機構面臨業務變化快、大數據量、高并發量等各種不同需求的沖擊,前端業務系統進行大規模改造以適應大數據的沖擊。數據層面上,企業的數據量已經變得非常龐大,業務變化也非???,傳統的報表迭代速度慢,需要排期,無法滿足金融機構的數據分析需求。
大數據理論和大數據分布式平臺蓬勃發展,基于大數據平臺的相關技術讓敏捷式報表的概念逐漸成為可能,數據實時化、自助化深入人心。BI 的流程已經大幅縮短,在金融機構的決策中被廣泛使用。大數據技術、機器學習等技術在金融領域的引用,催生了大數據風控技術、反欺詐分析、精準營銷和個性化推薦、銷售渠道優化&產品服務優化、輿情分析等智能應用。
智慧金融時代,是數據知識化和智能化的高級階段,大數據和 AI 能力重塑和改造金融服務,創造業務,降低成本,提高效率。金融機構業務部門的數據分析需求進一步增加,商業智能分析產品被業務專家廣泛使用在輔助分析、協助決策、智能助理等各個領域。
BI 分析更加自動化,增強型分析(是數據準備和洞察過程自動化、使用自然語言或語音交互、根據 AI 分析給出決策建議、利用機器學習和 AI 管理數據)逐步成為可能?;诖髷祿?AI 提供的各項能力,客服機器人、外呼機器人、智能投顧、智能投研、客戶流失預測、績優銷售預測、千人千面的金融產品等變為現實。
2、智慧金融時代,AI 技術在金融服務的落地場景也越來越多。您能否介紹 AI 在金融服務業務場景中的落地實踐。
王東:這里我以宜信的智能聊天機器人平臺為例說明。該平臺是結合自然語言處理、搜索引擎、會話領域場景的一站式人機對話解決方案,只需簡單導入自己的業務問答數據知識,系統的智能模型就會快速學習并生成相應的機器人,創建出定制化的業務咨詢專家。
智能聊天機器人平臺包含 QA 聊天機器人、任務機器人、閑聊機器人、人工后臺、文檔管理、模型管理、會話管理、統計報表等諸多功能。平臺支持多租戶,對算力、數據和資源進行隔離。對接公司 LDAP、SMP、SSO 等認證系統,支持功能角色和數據角色,對業務系統無侵入,可以內嵌到公司 PC 端業務系統中或手機 APP 中。
以 CSC(Cloud Service Container,輕量級服務容器) 場景為例:CSC 的一線同事在日常工作中,每天都會產生大量業務問題需要咨詢。此前這些問題通過蜜蜂等 IM 軟件在工作群內進行詢問,由 CSC 客服管理部相關同事支持。但由于問題數量大、涉及業務線多,這些業務咨詢往往不能得到迅速解決,影響業務的順利開展。另一方面,通過人工進行業務問題支持的工作還存在著響應緩慢、效率不高、成本高昂等問題。最終從客戶角度來看,業務問題的無法解決或解決流程不規范,將嚴重影響客戶體驗和品牌認知。
使用了智能問答機器人后, 門店客服可以通過智能機器人快速得到一致性答案,通過搜索引擎快速檢索到業務文檔相關資料,當遇到機器人無法解答問題,可以將問題轉入人工后臺。讓大部分常見問題由機器人代勞,少部分復雜的問題轉后臺人工處理。通過智能機器人+人工后臺的方式,共同提供完整的快捷的一體化用戶體驗。目前已經成為客服管理重要的日常工具,實現了運營管理智能化從0到1的過程,幫助運營人員減輕壓力,提升運營效率。
由于智能聊天機器人平臺是按照平臺化方式來建設的,因此很容易推廣到公司其他需要智能聊天的場景中,除了 CSC 客服問答機器人以外,目前已經在公司車貸客服問答、催收業務咨詢、財富智能問答、指尖金融家 APP 和信審業務咨詢等領域中上線和使用。
金融領域正掀起一場智能化的變革,智能聊天機器人在這場變革中將扮演重要角色。眾多分析師認為,聊天機器人的商業化應用,其真正潛力正是在金融領域。除了對于企業內部業務的智能化支持,更加令人興奮的是聊天機器人與金融的結合將徹底顛覆個人金融服務的形式,相信在不遠的將來,智能金融機器人將在客服、咨詢、理財、支付等各種場景下提供更加科學而自然、理性兼具人性的服務,這也是我們平臺的最終發展目標。
3、智能化的 AI 產品可以解決復雜多樣的業務問題,但面對眾多的需求,需要進行優先級排列,您和團隊是如何判斷業務問題優先級的呢?
王東:就能力分層來說,我們認為智慧化 AI 產品可以分為三層:
最底層——AI 平臺層:提供在線訓練、在線標注、特征工程、自助訓練、算法庫、訓練環境等AI基礎設施。服務的對象是 AI 科學家和數據科學家,為他們提供平臺和工具支撐。
中間層——AI 服務層:提供語言合成、詞法分析、相似度比較、觀點抽取、卡證票據類識別等通用AI服務,以及與業務方合作的智能服務項目。服務的對象是我們各個業務系統,為各個業務系統提供 AI 能力支持,助力業務發展。
最上層——AI 產品層:提供類似智能聊天機器人平臺這樣的端到端解決方案。服務的對象是我們的一線業務同事、甚至可能是我們的客戶。
從技術難度來說,最具有挑戰性的是最底層-AI 平臺層,打造一套自己的在線訓練平臺一直是很多 AI 科學家和數據科學家所期待的,但打造一套非常好用的在線訓練平臺并不容易,需要投入大量人力和時間,維護成本也很高,需要增加最新算法庫等,對使用的用戶要求也比較高,一般都是算法工程師和科學家。我們的業務方對這個一般沒有什么感知。
從業務影響力和優先級來說,最上層和中間層的優先級會更高一些,這兩層主要是為公司一線業務系統服務,會直接或間接觸達到一線業務同事或客戶,直接產生商業價值和降低成本。
作為 AI 中臺來說,在有限的人力情況下,我們會更優先支持最上層和中間層的 AI 服務,例如:聊天機器人平臺、語音合成、主題提取、卡證類識別等通用類 AI 服務以及與業務方合作的智能服務項目。而對于最底層 AI 平臺,我們也會在日常工作中,通過積累和沉淀可以復用的工具集,逐步形成相應平臺能力。
4、據悉,宜信的智能聊天機器人平臺是基于 AI 中臺研發的,那么 AI 中臺為智能聊天機器人平臺的研發提供了哪些優勢呢?相比 AI 中臺建設之前,有哪些地方得到了改善?
王東:從 AI 中臺的使命來說,AI 中臺承擔一些跨領域的、平臺級的服務研發和推廣,避免煙囪式的開發,強調開發合作、通用性和可復用性。智能聊天機器人平臺就是這樣一款產品,它具有平臺的通用性,可以內嵌到公司各個業務系統中,以自然語言的方式提供問題咨詢、任務執行、業務解答等支持,最終達到節省人力,降本增效的目標。
智能聊天機器人在 AI 中臺開發是有諸多好處的:
從人員方面來說,智能聊天機器人涉及到自然語言處理、語音轉換等技術,這需要在 NLP 和語音識別等專業領域深耕的 AI 科學家來支持。一方面機器人平臺可以借助 AI 中臺的 AI 科學家通過更好的算法讓聊天機器人更加智能,更加多樣化,另外一方面機器人平臺也為 AI 中臺的專業 AI 人員找到了合適的用武之地和實踐場景。
從平臺層面來說,智能聊天機器人所需要的模型服務是可以向下沉淀的,通用化后成為 AI 中臺的 AIHub 模型服務平臺。這樣聊天機器人平臺不必關心模型管理,只需要關注自己聊天機器人領域的事情,例如模型服務、模型編排、模型監控預警等這些模型通用能力的事情交給AI中臺的AIHub模型服務平臺來解決。實現產品模塊邊界清晰,并提高復用性和專業度,減少重復建設。
5、現在,越來越多的人提到數據中臺需要向 AI 中臺演進,您對此怎么看?宜信的數據中臺和 AI 中臺之間是什么樣的關系?二者之間是如何支持協作的?
王東:數據中臺除了提供數據平臺本身的兩大能力(數據存儲和數據計算)以外,還提供了更高級的能力,就是把數據變成一種基礎服務提供給業務方,業務方可以以自助的方式在數據中臺上獲取數據,進行數據處理、數據探索、數據挖掘、分析鉆取、多維分析、自助化報表、數據分享等,以快速的實現自己的商業價值。
隨著業務的發展,越來越多的智能化數據需求被提出,這些智能化需求涉及到模型訓練、數據標注、特征工程、模型部署、性能監控等,需要使用機器學習、深度學習等算法支持。數據中臺的主要目標還是服務數據,對于智能化和模型并不能很好地支持,因此 AI 中臺應運而生。
我們把智能服務的需求抽象出來,形成一個獨立的 AI 中臺層。AI 中臺是一個用來構建智能服務的基礎設施平臺,對公司所需的模型提供了分布分層的構建能力和全生命周期管理的服務,鼓勵各個業務領域基礎性、場景性、通用性的 AI 能力沉淀到平臺中,加強模型復用、組合創新、規?;罱K實現降本增效和快速響應業務方。
數據中臺和 AI 中臺兩者是相互依存,承前啟后的關系。
數據中臺和 AI 中臺兩者都對外提供服務,只是側重點不同:數據中臺提供各種數據服務(BI 報表應用、數據探索等),AI 中臺提供各種智能服務(模型預測、智能推薦等);
AI 中臺依托數據中臺提供的數據能力和工具集,加速 AI 相關服務的開發和復用,來應對前臺智能業務需求。有了數據中臺清洗好的數據,搭建智能項目事半功倍;
數據中臺也需要使用 AI 中臺的智能化能力使得數據使用更加平民化和智能化。例如增強型BI 分析:通用自然語言交互方式,降低 BI 使用門檻;通過 AI 分析給出參與建議,幫助普通用戶在沒有數據專家的情況下有效訪問數據;增強型數據管理:利用機器學習來管理數據,包括數據質量、元數據管理;主數據管理等。
6、從去年開始,似乎每個公司都在談中臺,但其實很多人對中臺的具體價值還不是很理解,您覺得中臺在賦能業務方面有哪些優勢?請您舉幾個例子具體介紹。
王東:在“以用戶為中心”的思想指導下,企業需要快速響應、挖掘、引領?戶的需求,借助平臺化的力量可以事半功倍。后臺并不為前臺而生,要么不好用,要么變更速度跟不上前臺的節奏。就算是新建的后臺系統,因為其后臺管理的屬性(考慮到企業安全、審計、合規、法律等限制)導致不能適應前臺快速開發的需求。前臺和后臺就像是兩個不同轉速的?輪,前臺要快速響應,后臺則要求越穩定越好。
因此中臺應運而生,中臺存在的目的就是更好地服務前臺,進而更好地響應服務。在宜信,數據中臺和 AI 中臺也同樣是為了更好更快地服務前臺而存在:
以數據中臺為例:業務領域組數據團隊需要緊急制作一批報表,不希望排期,部分報表需要T+0 時效性。數據來源是異構數據庫,對數據時效性要求很高,需要對數據處理后并展示報表。使用數據中臺,業務方不需要關心數據的異構性,無論是實時數據還是批量數據,只需要懂 SQL,業務方都可以在數據中臺上申請數據,自助地寫 SQL 進行處理數據清洗、數據處理,最后,通過配置和寫 SQL 生成自己需要報表,不用等排期,完全自助快速完成。
以 AI 中臺為例:AI 中臺的智能聊天機器人平臺,對接第一個業務方是從零開始,從研發平臺、模型研發、數據對接、到使用上線第一期,花了 6 個月的時間,第二個業務方享受到平臺的優勢,直接導入數據,進行驗證和對接后,4 個月實現上線第一期,之后的業務方更快,2 個月上線,最近的一個業務方達到 3 周就上線的速度,體現了平臺的復用性帶來的便捷和快速響應業務方需求的能力。
中臺將前臺業務中相對穩定的能力固化和沉淀下來,并共享給有需要的其他業務方使用,從而實現快速響應業務需求、降低成本和支持業務方進行規?;瘎撔隆?/p>
7、以您的經驗來看,什么樣的企業需要建設數據或者 AI 中臺?或者說企業在什么時候應該要建設中臺,是否有什么明顯的信號?比如說企業到了什么樣的階段或者遇到什么樣的問題。
王東:企業啟動自己的數據中臺和 AI 中臺建設,是與企業當時的業務發展階段相關的。
很多企業在早期業務發展過程中,為了解決一些當時的業務問題,快速上線了很多功能,要么垂直的、個性化的業務邏輯與基礎系統耦合太深,橫向系統之間、上下游系統之間交叉邏輯錯綜復雜。要么缺乏統一規劃,建設了許多高度相似的系統,大量重復建設,但又不通用,用戶體驗不統一。這樣導致在新業務、新市場的拓展過程中,系統沒法直接復用,甚至沒法快速迭代。
我們稱為 “重復造輪子”和“煙囪式架構”,本質上是企業在早期高速發展過程當中,為了快速解決當時的業務問題,而欠下了許多技術債務。這些歷史技術債務積重難返,當企業進入成熟期之后,發現這些問題的存在,嚴重影響了企業的運行效率和運營成本。大多數提出中臺戰略或是建設大中臺的企業,都面臨過類似的困境。
中臺化建設作為一種產品設計思想或者系統架構思想,對于任何一家即將或者正在面臨業務高速增長的企業來說,都值得借鑒,對目前業務當中大量可復用的功能和場景進行梳理,為業務的高速增長做好準備,同時也起到了降本增效的目的。
這個過程很像是在飛行過程中修發動機。一方面,知道飛機發動機已經存在一些問題,需要修理;另外一方面,還在飛行過程中,飛機還要飛,還要支持業務發展,不可能將發動機停了。這個過程是有一定難度,還要搶時間,為下一次業務發展做好準備。
通過機制化、產品化等方式,將企業內部具有通用性的數據、功能、產品進行統一規劃和開發,從而更好地幫助前臺業務部門更多地關注業務,提高業務運營效率,進而提升企業競爭力,是企業中臺化建設的目標。
8、前面您也講到,智能聊天機器人平臺的研發要基于數據中臺所提供的數據挖掘和處理能力,可以說 AI 產品的研發和應用離不開大數據技術的支撐。那您認為大數據技術與 AI 應用落地之間是一種什么樣的關系?
王東:縱觀這次人工智能的浪潮,可以說是算法、大數據等技術和硬件多方面的因素促成的。一方面算法層面有了進一步突破,更重要的是大數據相關技術的成熟,使得數據的獲取變得容易,大數據計算變得可能,以前許多不可能完成的事情,現在可以通過大數據的算力來進行學習和訓練。再結合現在 GPU、AI 芯片以及傳感器等硬件技術,使得需要大規模計算的深度學習訓練可以完成,這些都直接導致了AI應用的快速落地和到處開花。
以互聯網 AI 應用為例,互聯網巨頭是使用大數據標注并落地 AI 應用的最早受益者。AI 最早應用在搜索引擎(Google、百度)、廣告系統(Ebay)、電子商務網站(阿里)等,它們都是大數據的產生方和使用方,然后是在擁有大數據流的社交平臺(Facebook、騰訊),到現在使用大數據技術在垂直細分領域做個性化推薦平臺(頭條、快手)。一方面大家在使用這些互聯網平臺,另外一方面大家也在進行免費的大數據標注。
以商業 AI 應用為例,商業機構通過激活已有的大數據,并結合 AI 算法創造商業價值。醫療機構通過已有病歷實現疾病診斷/鑒別、個性化治療/行為矯正、臨床決策支持系統、流行病爆發預測等, 金融機構通過已有交易數據,進行大數據風控、個性化營銷、智能投顧、智能投研等。這些都是大數據與AI緊密結合的產物。
以實體世界 AI 應用為例,通過獲取實體世界的數據,實現智能化,帶來新的應用、新的商機。通過大數據、AI與汽車行業結合,誕生了自動駕駛、路徑規劃、實時路況、危險預警等應用;大數據與商業零售結合,收集海量顧客信息,結合 AI 技術,用于精準營銷、店鋪選址、庫存規劃、個性化服務等。大數據、AI 技術與智慧城市、智能安監、環境治理、教育等諸多領域結合后,都帶來了大量新的應用和商業機會。
因此,無論是傳統的數據挖掘、還是機器學習、深度學習,所有的模型都離不開大量的數據,可以說大數據技術是 AI 應用的養料和土壤,大數據技術催生了 AI 應用的落地。
9、最后一個問題是關于AI的應用前景。您覺得現在 AI 技術是否已經成熟到可以大規模落地應用了?以金融行業為例,您認為要真正實現 AI 技術在金融服務中的全面落地,現在還缺少什么?比如技術方面、數據資源方面等。
王東:最近對 AI 應用討論得挺多,有以下幾種觀點:
“速勝論”:理由是基于深度學習技術的爆發式進步,由 AlphaGo 完勝人類職業圍棋頂尖水平為導火索,在圖像領域(圖像識別、人臉識別、視頻識別等)、語音領域(語言識別、語言合成、智能翻譯等)取得了巨大的成功,火熱的人工智能帶來了很多機會,資本的大量涌入,市場上涌現了一大批 AI 初創公司,同時媒體的大肆宣揚,比如“人類要被機器人取代”,“機器開始威脅人類”等,導致一部分人對 AI 技術已經能夠大規模普及和落地充滿信心。
“投降主義論”:隨著進一步研究發現,許多問題并沒有解決。例如開放領域的聊天機器人不夠聰明,整體有待加強。主要原因在于自然語言理解的發展進程并沒有我們想象中快,深度學習也似乎沒有解決這個問題,可以與人類對話交流的機器人好像從未出現過。有外媒甚至評論道:“我不確定能不能說聊天機器人死了,因為我不知道它是否活過?!背松鲜龅囊恍┏晒︻I域,深度學習也并沒有解決其他所有領域的問題。
了解到人工智能歷史的同行都知道,其實人工智能至今經歷了三次大的熱潮。每次都經歷了開始是“人類要毀滅了”,后來是“騙子”的過程。
實際上,在一個特定領域的優秀表現,并不能代表 AI 技術無所不能。同樣的,在通用領域不能解決的問題,不代表特定領域不能解決。
我更加相信“持久戰論”,羅馬從來都不是一天能夠建成的,技術的突破也必然會經歷一定時間的積累。AI 技術在金融服務中的落地,我比較贊同宜信 CTO 向江旭先生提的觀點:“大膽擁抱,小心實踐”。
首先需要選擇金融領域的業務痛點,并通過 AI 技術來解決這些痛點,把非常炫酷的 AI 技術落實到實際業務需求中,而不是為炫酷而炫酷。就目前而言,我們的 AI 中臺會選擇在智能機器人和知識圖譜構建上發力。智能聊天機器人能為公司內外提供專業領域的知識解答,知識圖譜能為各業務方提供智能問答、智能搜索、精準營銷等。最重要的是,我們希望按照平臺化的方式去建設它們,希望建設知識圖譜的方法論、工具和平臺可復用。
目前在落地過程中,除了搭建 AI 中臺相關平臺以外,花費時間最多的是與數據相關的過程,無論是模型訓練,還是知識圖譜構建,很多時間用在獲取數據和探索數據。
對于普通的模型訓練,需要多個維度的數據,AI 科學家需要對這些數據進行觀察和探索,一般這些數據都是結構化數據,這個問題會隨著數據中臺的成長,數據匯集越來越多后,得到逐步的解決。數據中臺提供自助化探索數據的能力,能夠大幅減少獲取數據和探索數據的時間和成本。
對于圖譜構建和自然語言處理,我們很多的金融數據,保存為非結構化的數據和語料,例如 pdf文檔、表格數據、掃描圖片等,一方面要求數據中臺或數據平臺能夠提供非結構化數據的獲取能力,另一方面也要求 AI 中臺提供對這種非結構化數據進行在線標注、在線提取的平臺級能力。
-
AI
+關注
關注
87文章
30767瀏覽量
268917 -
機器學習
+關注
關注
66文章
8408瀏覽量
132580 -
大數據
+關注
關注
64文章
8884瀏覽量
137412
原文標題:大數據中臺向AI中臺演進是大勢所趨?
文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論