人工智能模型服務商“布爾數據”宣布完成數千萬元融資,由杭州市政府及財政局成立的杭高投、華甌創投共同投資。創始人肖豐表示,本輪融資將主要用于智能模型研究及產品開發,以進一步完善公司生態建設。此前,布爾數據曾于2018年底獲和山匯投資近千萬元天使輪融資。
布爾數據是杭州首新網絡科技有限公司旗下的是一家人工智能科技公司,基于大數據風控、人工智能、區塊鏈、機器學習算法等技術,為電商平臺、信用租賃、支付、銀行、非銀等行業提供智能風控解決方案。
公司成立于2017年,總部位于杭州未來科技城。布爾數據將人工智能與業務場景結合,使人工智能技術得到場景化落地。
具體來看,其產品主要有以下4種:
1、多頭借貸報告:基于信貸、支付等機構的數據,通過多維度數據分析,包括多頭趨勢、申請機構、負債風險、信貸逾期等全面分析用戶借貸行為,識別貸前欺詐風險,降低逾期率。應用場景有消費貸、汽車金融、融資租賃等。
2、小微商戶評級報告:基于商戶交易數據及資信狀況,綜合分析商戶的經營能力及信譽情況,有效識別小微商戶信貸風險。應用場景有商戶信貸服務、融資租賃等。
3、個人貸前評級報告:從欺詐、借貸、司法等維度進行模型分析,有效識別欺詐人群,甄別不良信用記錄,幫助機構篩選優質目標人群,識別潛在風險。
4、信息校驗驗證服務:針對個人及企業基本信息,提供信息校驗驗證服務。包括人臉驗證、活體識別、OCR識別等驗證功能。
其核心技術為智能風控引擎技術,可基于風險場景、用戶狀態,Al智能推薦管控策略,實現在線模型智能進化,提升系統整體風控能力。
布爾數據還建立動態反欺詐模型,將機器學習、人工智能應用到風控模型中。其設備指紋技術采用機器學習為Android、IOS、H5等設備定位唯一設備ID。利用布爾數據強大的決策引擎,精準分析一個設備上用戶的操作行為,發現多用戶之間的關聯情況,并識別模擬器,篡改設備等風險設備信息。其地理定位技術通過IP、基站、wifi、身份證、手機號及銀行卡等多維度的地理位置信息,利用算法等解析地址數據進行匹配關聯,篩查相似地址進行風險判斷,識別基于位置的欺詐行為。
布爾數據主要與銀行、保險、第三方支付、電商平臺等大型機構合作。據悉,公司目前已為數百家金融機構、電商平臺及政府部門等提供畫像評級產品。
團隊方面,公司有來自阿里巴巴、螞蟻金服、銀行、支付公司的人工智能領域算法專家。
背景
各種新類型設備將會導致數據量的爆發,其中大部分新設備目前還不存在。數據是有價值的,因為人工智能(AI)可以將數據中挖掘出商業價值。為了實現人工智能,我們將不得不啟用新的計算模型。
關鍵信息
一共有兩條關鍵信息。首先,人工智能工作負載(即機器學習、深度學習)需要一種處理數據的新方法——我們稱之為新的計算架構(即計算模型)。后面將闡述“計算架構”的含義,以及AI工作負載需要哪些類型的更改。其次,人工智能計算架構需要材料工程的突破。我將討論一些我們遇到的突破類型的例子。在應用材料領域,我們很興奮地預見到人工智能將為材料工程帶來巨大的增長機遇。
在這篇文章中,我的目標是總結AI工作負載的計算架構需求是如何不同于業界已經熟悉了幾十年的傳統計算架構(如x86或ARM)。我們將討論為什么傳統的馮?諾依曼計算架構對人工智能來說是不夠的。并從一個我們做過的實證分析來說明,如果我們不啟用新的計算架構,人工智能將無法實現。
人工智能的工作量有什么獨特之處?
有三大不同之處,而且它們是相互關聯的。
首先,人工智能需要大量內存,因為最流行的AI工作負載操作大量數據,但是內存也需要不同的組織方式。在流行的CPU中使用的傳統多層緩存架構對AI來說是不必要的,AI需要更直接、更快速的內存訪問。對于通過將數據存儲在緩存中來重用數據,則沒有那么多的關注。
在人工智能系統中輸入大量的數據是非常重要的。以谷歌Translate?翻譯服務為例:在2010年時,谷歌聘請了語言學家和算法專家來實現從英語到漢語的翻譯,最后,他們的翻譯準確率達到了70%。這很好,但不是很好。最近,谷歌采取了一種不同的方法:他們雇傭了很多數據科學家,數據科學家們將每個可用的英文網頁及其中文譯文輸入到一個相對簡單的深度學習算法中。這給了他們更好的結果,準確率高達98%!正如您所看到的,這里的重點是使用更簡單的算法來使用更多的數據,這是支持用大量數據驅動AI的論點。
其次,人工智能涉及大量的并行計算。并行計算意味著您可以并行地處理工作負載的不同部分,而不必擔心相互依賴。以圖像處理為例,可以并行處理圖像的不同部分,最后把圖像拼湊在一起。因此,所有傳統CPU中提供的復雜流水線對AI來說都是不必要的。
第三,人工智能需要大量的低精度計算,無論是浮點運算還是整數運算。這就是神經網絡的力量,它是機器學習或深度學習的核心。傳統的CPU有64位精度,在某些情況下可以達到512位。在很大程度上,AI并不需要這些。
因此,我們在這里有三個基本的和重要的計算架構變化,這是人工智能工作負載所需要的。這將我們帶到了同構與異構計算體系結構的主題。
同構計算與異構計算
在PC和移動時代,大多數應用程序(或工作負載)在處理需求(即計算架構)方面看起來很相似。最初,所有的工作負載都是由CPU處理的,當我們開始使用更多的圖片、視頻和游戲時,我們開始使用GPU。
將來,我們的工作負載看起來會越來越不同,每個工作負載都有自己的計算需求。我們需要的是各種不同的體系結構,每種結構都針對特定類型的工作負載進行了優化。這就是我們所說的“硬件復興”,因為它推動了針對各種新工作負載的體系結構創新。
還有一個原因可以解釋為什么這個行業正在從同構計算轉向異構計算。這與功耗密度有關,功耗密度限制了傳統CPU的性能。我們正處在一個用現代多核CPU架構來提高性能的困難時期。人工智能工作負載最基本的需求是更高的功耗效率(即每個操作對應的功耗)。隨著登納德定律(Dennard Scaling)的結束,實現這一點的惟一方法是構建特定于域(domain-specific)或特定于工作負載的體系結構,從而從根本上提高計算效率。
實證分析:DRAM和NAND出貨量與數據生成相關
為了理解數據生成和計算需求之間的關系,我們將年度DRAM和NAND出貨量與年度數據生成進行了比較。經驗關系表明,DRAM和NAND出貨量的增長速度都要高于數據生成的增長速度。在我們的分析中引入的數學關系是底層計算體系結構的代表。
我們利用所發現的經驗關系做了一個思維實驗,考慮在1%的智能汽車使用率下增加數據生成造成的影響。假設每輛智能汽車每天產生大約4TB的數據,我們發現,到2020年與前智能汽車水平相比,智能汽車產生的數據總量增加了5倍。
根據這一分析,使用傳統的計算模型,我們將需要8倍的DRAM裝機容量和25倍的NAND裝機容量(2020年)來處理1%的智能汽車使用。在應用材料行業,我們絕對希望這種情況發生,但我們不認為會發生。相反,該行業將需要采用基于新材料和3D設計技術的新型存儲器,以及新的計算架構。
綜上,傳統的馮?諾依曼計算架構在處理人工智能所需的海量數據時是不經濟的,甚至是不可行的。我們需要新的計算架構。
-
核心技術
+關注
關注
4文章
625瀏覽量
19628 -
人工智能
+關注
關注
1792文章
47416瀏覽量
238930 -
機器學習
+關注
關注
66文章
8425瀏覽量
132766
發布評論請先 登錄
相關推薦
評論