隨著圖、圖結構、圖數據、圖算法、圖計算、圖學習、圖神經網絡等信息技術的快速發展,各行業數字化水平的逐步提高,企業業務環境和計算場景日益復雜,數據間的關聯關系也正在變得更加交錯。在面對需要深度挖掘數據間復雜關聯關系的場景時,傳統的關系型數據往往計算效率低下,難以滿足應用需求。
本文通過科研端文獻研究、產業調研與專家訪談等方式,將從技術、人才、科研與產業四個維度展開分析,闡明行業發展背景、追溯技術發展歷程、拆解技術原理及優勢、勾勒行業格局,并研判圖計算未來發展趨勢。
圖計算技術特點
一、圖計算技術特點
1、高效地對具有復雜關聯關系的數據進行深度計算
圖提供了一種能夠代表現實世界中絕大多數事物關聯關系的獨特的結構。與經典的表格或者矩陣不同,圖上的節點和邊并沒有被賦予過多的權重,每個元素都依賴于其他元素并形成一種互聯互通的關系,而這種關系是所有基于圖的假設和預測的核心。在大數據計算中,通過分析圖數據之間的關聯性,能夠高效地從噪聲很多的海量數據中抽取有用的信息。
圖計算系統基于頂點和邊的方式存儲圖數據和計算,能夠建構任意復雜的網絡和模型并存儲大量的信息,進而完整且形象地映射分析人員想要研究的問題域。經典的表格結構的數據都能夠用圖數據來表示,但不是所有的圖數據都能夠用數組或表格的形式來表示。
2、在對簡單事物關系的數據進行計算時,列表型的數據尚且能夠展現出高效的性能
一旦模型復雜度提升例如金融領域中的交易數據,傳統的列表數據模型的劣勢將顯現無疑。倘若在傳統的關系型數據模式下進行分析和計算,復雜的業務場景將帶來冗余的表之間的關聯操作和頻繁的數據通信,造成成千上萬倍計算量的提升,系統性能大打折扣,極大降低了計算的效率。但是,在面對高度結構化的數據時,圖計算的處理能力將不及基于傳統數據模型的計算,這是由于在進行圖計算的過程中存在著隨機訪問的問題。
二、數據庫演進方向:關系型數據庫向非關系型發展
數據間關聯趨于復雜、數據量劇增,對于圖數據存儲計算的需求隨之增長。隨著通信技術和大數據的快速發展、業務環境和計算場景趨于多樣,企業的數據需求正在發生變化,除了數據量劇增之外,數據之間的關聯關系也變得更加復雜交錯。雖然傳統的關系型數據庫已經較為成熟,但在需要進行復雜關聯查詢的情況下,關系型數據庫需要多表關聯查詢,計算效率低下甚至難以完成。而圖數據庫的基礎數據結構由頂點、邊組成,能更自然、準確、直觀地表述數據間的關聯關系,從而提高計算效果,在社交網絡、知識圖譜等領域得以大展身手。
三、圖數據庫發展歷程:過往十年關注熱度持續攀升
過去 40 年,以 Oracle、 SQL為代表的關系型數據庫幾乎壟斷了全球數據庫市場。隨著關系型數據庫在數據關聯分析方面的乏力表現逐漸凸顯。在業務場景的驅動下,越來越多的企業對圖計算能力的需求快速增長,以增強自身商業決策能力。另一方面,自 2007 年第一款商用圖數據庫 Neo4j 發布以來,在學術界和產業界的共同努力下,圖數據庫的可擴展性、易用性等各方面能力逐漸補齊,產品成熟度逐漸提高。目前行業內已有傳統數據庫、公有云廠商和初創企業等進入。
各類數據庫近十年來熱度變化
四、圖計算系統發展歷程:從通用大數據計算系統到專用圖計算系統
早期專門針對大型圖計算的系統出現之前,業內主要通過單機圖算法庫或通用大數據計算系統實現。其中,Google 推出的大規模數據并行處理計算模型 MapReduce,以及加利福尼亞大學伯克利分校(UC Berkeley)AMP Lab 開發的 Spark 系統,對圖計算系統發展起到了重要推進作用。但由于磁盤存儲局限性等問題,通用型大數據計算系統在性能、易用性等方面都未能盡如人意。
圖計算領域研究側追究
一、研究側追究
1、圖計算領域研究側追蹤:近十年,熱度與發表論文數量雙漲
300 年前歐拉開辟了圖論研究的范疇,50年前圖數據庫在計算機誕生之后也隨即問世,進入大數據時代,數據量的指數膨脹不僅帶來了大量的數據分析需求,使得圖計算在面對復雜關聯數據時的優勢逐漸凸顯;同時海量的數據也給予了深度計算發展所需的養分,圖計算作為深入挖掘數據信息的有力工具,其研究進入了快速發展期。
從 2003 年到 2021 年,圖計算領域論文發表數量呈現明顯的上升趨勢 ,尤其在 2014、2015年至2021年期間,研究論文發表數量翻倍增長達到高峰。究其本質,移動互聯網和金融科技等大數據驅動型行業,以及人工智能相關技術、知識圖譜和圖神經網絡的研究在該時間段內蓬勃發展,極大地拉動了圖計算研究熱度。另一方面,底層硬件的不斷升級和圖計算引擎的成熟化、公開化也為圖計算的研究搭建了完善的基礎設施。
圖計算相關主題論文發表數量
從上圖可以看出,2012 年是研究熱度和發表論文數量的階段性分水嶺。近十年,以上述關鍵詞為研究主題的論文發表數量,呈明顯增長趨勢,相關領域當年論文發表數量均在2020 年、2021 年達到最高峰。
2、圖計算領域研究論文地域分布:中美領銜,歐洲國家緊跟其后
根據 WebofScience數據 ,近 20 年來圖計算相關話題領域的論文發表主要來自于中國和美國,德國、法國等歐洲國家和印度緊隨其后。在美國,以卡耐基梅隆大學 、加州大學伯克利分校以及麻省理工學院為首的計算機科學頂尖高校貢獻了絕大多數圖計算領域的論文發表。
在中國,清華大學、北京大學、中國科學院以及華中科技大學是圖計算領域研究的先驅,貢獻了中國絕大多數的高被引用圖計算論文。
歐美國家在計算機科學(圖計算相關領域)的研究積淀較多,積累了較為領先的學術界實力與豐富的產業界應用 。在圖計算研究早期,Google 等大型互聯網公司在核心業務中對于圖數據分析的采用以及各類大數據分析框架的開源為圖計算的發展起到了不小的推動作用。中國圖計算研究的高峰起源于大數據趨勢的鋪展,科技型企業依據業務分析需求,逐步深耕圖計算應用。與此同時中國的頂尖高校在圖計算的底層理論研究上也頗有建樹。
圖計算相關主題論文發表數量按國家分布
二、圖計算領域全球一流研究機構分布
國外涉及大學:
加拿大:UniversityofWaterloo;新加坡:National UniversityofSingapore、NanyangTechnologicalUniversity;澳大利亞:Universityof New South Wales;美國:Microsoft、Facebook、University ofCalifornia、UniversityofIllinoisatUrbanaGoogle、IBM、CarnegieMellonUniversityUniversityofWashingtonTeradataAster
、CornellUniversity、Stanford University
國內涉及大學:
清華大學計算機系、哈爾濱工業大學計算機學院、北京大學王選計算機研究所、北京郵電大學計算機學院、中國科學技術大學計算機科學與技術學院、復旦大學大數據學院、華中科技大學計算機系、上海交通大學軟件學院、電子科技大學、計算機科學與工程學院、香港大學計算機科學系、香港科技大學計算機科學與工程系、香港中文大學計算機科學與工程系
三、圖計算領域全球一流研究人才分布
圖計算的快速發展離不開研究學者們的努力和貢獻。不僅在基礎理論層面研究深耕,也在產業化實踐方面不斷更迭創新,助力圖計算在大數據的沃土里生根發芽,蓬勃生長 。
陳文光
清華大學計算機系教授,國家自然科學基金杰出青年基金獲得者。現任螞蟻集團圖計算技術負責人及技術研究院院長。2014年提出并實現了一種單機圖處理引擎GridGraph。2016年初,進一步成功研制了名為“Gemini ”的分布式圖計算系統,其在典型大數據分析應用(如PageRank) 上的性能是國際同類圖計算系統的十倍以上2021年,領導螞蟻集團與清華大學共同研發大規模圖計算系統GeaGraph(螞蟻集團TuGraph前身),并獲得2021世界互聯網領先科技成果發布。
鄒磊
中國RDF圖領域的先驅研究者。北京大學王選計算機所教授,國家自然科學基金優秀青年基金項目獲得者。研究領域包括圖數據庫,RDF知識圖譜,尤其是基于圖的 RDF 數據管理和自然語言問答研究。主持研發了面向知識圖譜數據的圖數據庫系統gStore和知識圖譜問答平臺gAnswer。2014 年所主持的項目“海量圖結構數據存儲和查詢優化理論研究”,獲得中國計算機學會自然科學二等獎。2017 年所主持的項目“大規模圖結構數據管理”獲得教育部自然科學二等獎。
石川
北京郵電大學計算機學院教授、博士研究生導師,北京郵電大學圖數據挖掘與機器學習實驗室的創辦人。主要研究方向為基于圖機構數據的數據挖掘、機器學習、人工智能和大數據分析。近年來,為異質圖神經網絡領域的研究貢獻了重要的力量。
張宇
華中科技大學計算機科學與技術學院副教授,主要研究方向是大數據處理的體系結構 和系統軟件、圖計算。研制了高能效軟硬協同圖計算引擎,性能功耗比在第18屆Green Graph 500 排名中全球第一 ,單機性能在第 23 屆和第 24 屆 Graph 500 排名中全球第一。
金海
華中科技大學、計算機科學與技術學院教授、博士生研究導師。主要研究方向計算機體系結構、計算系統虛擬化、集群計算和云計算等。
鄭衛國
復旦大學數據科學學院副教授。主要研究方向大規模圖數據管理和挖掘、自然語言處理,特別是知識圖譜、自然語言問答等相關算法的設計與應用。
陳海波
上海交通大學軟件學院教授、華為操作系統首席科學家、操作系統內核實驗室主任、SOSP首位中國學者主席。主要研究方向系統軟件,系統結構與系統虛擬化。
代亞非
北京大學信息科學技術學院教授。主要研究方向分布式系統研究。
陳紅陽
之江實驗室圖計算研究中心高級研究專家。主要研究方向大數據智能,智能網絡與系統,機器學習理論與應用,無線通信與網絡,LTE-A/ 5G通信技術標準化,無線定位與跟蹤技術,智慧城市,統計信號處理。
圖計算領域部分代表研究學者
四、圖計算研究趨勢
1、圖神經網絡
近年來,人們對深度學習方法在圖數據上的應用越來越感興趣,圖神經網絡也因此誕生并逐漸成為研究人員關注的熱點。圖神經網絡是指使用神經網絡來學習圖結構數據,提取和發掘圖結構數據中的特征和模式,滿足聚類、分類、預測、分割等圖學習任務需求的算法總稱。圖數據 正在變得越來越普遍、其蘊含的信息越來越豐富。圖神經網絡也被廣泛應用于推薦系統、社交網絡、計算機視覺和生物醫學發現等領域中。
2、圖數據查詢語言及圖數據庫測試基準的標準化制定
關系型數據庫的發展離不開 SQL 查詢語言的標準化 。目前Neo4j 、TigerGraph 、螞蟻集團在內的多家圖計算企業都參與了標準的聯合制定。ISO GQL 的制定將為今后商業應用開發提供一整套標準化的、高表現力的國際通用查詢語言,大量數據庫用戶和開發人員將從中受益。
關鍵產品及行業發展現狀
一、政策背景:高性能計算及圖數據處理技術受國家政策鼓勵和支持
多個國家均已將高性能計算技術提升到國家戰略高度。
美國基于對計算科學發展趨勢及新一輪信息技術 (IT) 革命到來的認識 ,于 2015 年頒布了著名的“國家戰略計算計劃”(NSCI) ,指明了在未來一段內時間圍繞高性能計算技術與產業發展的戰略目標、任務、方向及發展路徑,同時構建了組織架構、明確了各方面的責任分工。歐盟將先進計算列為戰略重點 ,定制“地平線計劃”。
韓國制定了到 2030年的高性能計算中長期發展戰略《 國家超高性能計算創新戰略》,旨在將韓國打造成為高性能計算強國,實現第四次工業革命時代的量子跳躍。
日本也在國家層面將先進計算納入扶持,并展開統一研發部署。
中國通過《 國家中長期科學和技術發展規劃綱要 ( 2006-2020 年) 》、“九五”至“十三五”國家科技發展及科技創新規劃 、國家高技術研究發展計劃 (“863”計劃) 、國家重點基礎研究發展計劃 (“973”計劃) 、國家自然科學基金重大研究計劃、國家“科技創新2030-重大項目”等一系列重大戰略規劃與政策,有力地支持了高性能計算技術與產業的發展。2021年11月,工信部發布《“十四 五”軟件和信息技術服務業發展規劃》,在“關鍵基礎軟件補短板”專欄中,指出在數據庫領域,應關注大規模并行圖數據處理等數據庫關鍵技術的突破。
全球高性能計算扶持政策
二、圖計算產業鏈
圖計算產業鏈
上游:基礎設施主要包括硬件設施、操作系統等,對于非原生圖存儲圖數據庫,還需接入其他類型數據庫。
中游:目前,圖計算行業內主要有兩類參與者——圖數據庫和圖計算系統(圖計算引擎) 。
下游:應用開發商負責在圖數據庫和圖計算系統的查詢分析能力基礎上,為用戶開發定制化應用,例如針對具體行業(如金融等) 的知識圖譜應用開發商:軟件集成商負責集成應用并提供運維等服務。
圖數據庫與圖計算系統對比
三、圖計算生態參與者:數量眾多,巨頭和初創企業各施所長
目前,圖計算行業內主要有圖數據庫和圖計算系統( 圖計算引擎) 兩類參與者 。實際應用中,圖數據庫和圖計算引擎的能力呈現融合趨勢,圖數據庫企業正在將 OLAP 能力與 OLTP 能力結合,向 HTAP 混合型數據庫方向發展。此外,部分巨頭廠商將圖數據庫與圖計算系統結合,提供涵蓋圖數據存儲、查詢、分析等功能的一站式平臺。
圖計算行業部分參與者
目前行業參與者中,既有阿里、騰訊、螞蟻、字跳、AWS、微軟等公有云、軟件、數據庫等領域的巨頭,也有 Neo4j、TigerGraph、創鄰科技、歐若數網等國內外創業企業。巨頭與創業企業呈現競爭與合作并存的關系。一方面,二者在項目競標中常同臺競爭;另一方面,由于巨頭產品線眾多,且仍以服務內部業務需求為主,在項目實施等方面能力不足,因此也需要與創業企業合作補足能力。
四、圖計算領域專利概述:以中美科技公司及高校為主
根據公開專利數據,以圖數據庫、圖計算為核心技術主題的專利當前申請人,以美國和中國科技公司為主,它們共同的業務特性是擁有海量復雜數據,以及需要處理它們之間的交互關系。
graph computing 領域專利主要所有者的部分代表專利
五、圖數據庫:圖數據的高效存儲與查詢
圖數據庫是以點、邊為基礎存儲單元,以高效存儲、查詢圖數據為設計原理的數據管理系統。對圖數據結構進行創建、讀取、更新和刪除 ( CRUD) 操作,是圖計算技術的核心。與傳統關系型數據庫相比,近年來圖數據庫在各類數據庫之中受到越來越多的關注。
圖數據庫是圖計算行業的重要參與者。海外圖數據庫初創企業眾多,其中部分已被收購整合;中國市場以互聯網大廠和垂直初創企業為主,也有不少應用層企業和傳統數據庫廠商參與如:阿里集團、騰訊云、阿里云、百度安全、華為云、字節跳動等。
圖數據庫行業部分參與者
六、商業化現狀:尚處于初期階段,未來廣闊空間尚待挖掘
目前,受制于整體市場對圖計算技術的認知仍未成熟,圖計算行業仍處于商業化初期階段。一方面,客戶對圖數據庫及圖計算技術認知不足,在如何理解圖能帶來的價值、如何進行圖數據庫選型、如何做好二次開發和持續運維等問題上,依然困難重重。另一方面,圖計算廠商對客戶的業務場景不夠了解,對于如何幫助客戶明確需求,將客戶業務場景存在的痛點轉化為圖的問題,如何在技術角度進一步提升產品力以更好滿足客戶需求,如何將圖技術應用到更廣的領域等問題,未來依然有很大潛在發展空間。
目前行業內主要以項目制形式銷售,標準化產品較少,單個項目金額以十萬到百萬量級為主,個別項目能接近千萬量級。圖數據庫廠商主要與應用開發商合作為客戶提供服務;視實際客戶和項目需求,也存在直接對接客戶,或者與軟件集成商、圖計算系統合作等情況。
圖計算企業按商業模式可分為開源和閉源。根據 DB-Engines 流行度數據,目前圖數據庫領域開源產品占 61.5%,閉源產品占 38.5%。開源即軟件源代碼按許可協議公開,開發者可在原始代碼的基礎上修改、使用;閉源即傳統模式售賣的商用軟件。目前不少項目方選擇 OpenCore 的模式,即核心模塊開源、進階版功能收費的模式展開商業化;另外也有部分廠商出于對開源生態不成熟、現有產品競爭激烈等原因考慮,選擇閉源策略。2022年世界人工智能大會上,螞蟻集團大規模圖計算系統中的圖數據庫 TuGraph宣布正式開源。
開源與閉源策略對比
七、主要應用場景
金融
過往金融機構主要通過對企業或個人等個體本身的特征進行分析以發現風險,而圖計算技術可以幫助挖掘個體之間的關聯關系,進一步發現潛在風險,在信貸風險評估、反洗錢、反欺詐、資金追蹤、潛客發現等場景中,能幫助挖掘出企業間循環擔保、薅羊毛灰黑產等重大風險。
社交
社交網絡天然具備圖數據結構。隨著社交數據量級迅速增長,為了更好地展示并發揮社交數據作用,圖計算技術也參與進來。在社交網絡數據可以通過社區發現等圖算法,更加深入地挖掘個體之間的聯系,進行用戶關系查詢、潛在黑客發現、社區挖掘、根據愛好推薦好友等操作。
能源
過去電網設備規模龐大且關聯關系復雜,用關系數據庫管理存在模型復雜、存儲冗余、檢索效率低等問題。圖計算技術可以幫助更高效、實時地管理電力設備并監控其運行狀態,及時解決問題,同時可在潮流計算等領域提供幫助,更加合理地分配電力去向。
搜索引擎
圖計算中的PageRank算法常被應用于搜索引擎領域。PageRank算法又稱網頁排名算法,是一種基于 “一個節點訪問次數或概率越高,則重要程度更高”的假設,根據網頁(節點)之間相互鏈接情況執行隨機游走模型,計算網頁(節點)的相關性和重要性以進行排名的技術,在谷歌搜索的網頁排名中有重要作用。
八、典型企業案例
1、螞蟻集團-金融風控行業案例
借助圖數據對主體間復雜關系以及對多種主體時序行為特征的強刻畫能力,螞蟻集團將圖技術應用于自身金融風控業務之中,以應對日益復雜的風險形勢,提高對于隱形的、有組織的團伙化犯罪風險的識別和挖掘能力。但是,由于風控場景本身存在強對抗、低延時的特性,對于圖數據計算的時效性提出了挑戰。
螞蟻安全團隊在圖技術基礎上建設了全圖風控架構,作為應對復雜風險形勢的下一代風控基礎設施,也是螞蟻智能風控技術體系“IMAGE”的組成部分。全圖風控即全域一張圖,在整個風控的生命周期,包括風險感知、風險識別、風險管控、風險審理、風險分析等環節中提供保障,提供團伙挖掘、資金鏈路識別、交易可信識別等核心服務能力。此外,除了用傳統的多度查詢來進行風險鏈路判斷外,還引入模式識別的方式(菱形/三角型等)、社區發現的算法等來應對更加復雜的場景。
同時,在豐富的數據來源和計算方式基礎上,螞蟻對在圖計算的時效性上也進行了優化,TuGraph 大規模圖計算平臺為螞蟻集團提供了業界領先的實時和時序大規模圖分析能力。在反洗錢領域,圖計算已覆蓋支付寶的全部資金交易,對疑似團伙類犯罪風險識別能力提高近 10 倍,風險審理分析效率提升 90%。
螞蟻集團風控領域的圖計算應用
2、創鄰科技 Galaxybase
創鄰科技主要產品 Galaxybase 是一款國產高性能分布式圖數據庫,采用原生圖存儲,100%自主研發 ,已入選2022信創數據庫排行榜。目前,創鄰客戶覆蓋金融、能源、互聯網等行業,標桿客戶包括農行、交行、國家電網、騰訊等,在信用卡反欺詐、IoT 數據管理、微服務治理等場景下,幫助客戶防控風險、提高管理效率。同時,創鄰科技是騰訊云啟創新生態合作伙伴的一員,與騰訊聯合研發了騰訊云圖數據庫TGDB。
此外,創鄰科技也通過與高校合作等方式,在大規模圖數據計算性能方面展開研究。2022 年 5 月,創鄰科技聯合中山大學團隊,依托國家超級計算廣州中心環境,完成了 Galaxybase 的安裝部署,并實現5萬億點邊規模交易數據智能挖掘性能測試,打破了世界最大規模圖處理記錄。
3、Neo4j
Neo4j 是第一款商用圖數據庫,對后續圖數據庫發展起到了重要作用。Neo4j 采用原生設計的圖存儲和屬性圖的數據模型,并首次提出了針對屬性圖的描述性查詢語言Cypher,后開放為 OpenCypher。
Neo4j 最初為完全開源產品,通過發展開發者社區知名度逐漸提升。2018 年 Neo4j 宣布從 Neo4j V3.5 版本開始,企業版將僅在商業許可下提供,開源策略從完全開源轉向 OpenCore,即核心功能開源、企業版功能閉源。
九、圖計算技術發展趨勢
1、查詢計算一體化
圖數據庫技術演進方向為查詢速度更快、承載數據量更多、查詢層級更深。目前圖數據庫以提供實時查詢功能為主,對于復雜離線計算仍需和圖計算引擎配合,增加了額外數據 ETL 的處理過程。隨著企業業務發展、對實時交易分析需求增加,未來圖數據庫將與圖計算引擎功能融合,結合 OLTP 與 OLAP 能力,即 HTAP 混合型數據庫。HTAP 數據庫基于新的計算存儲框架,能同時支持 OLTP 和 OLAP場景,在一份數據上保證事務處理的同時,支持實時分析,為客戶提供查詢計算一體化能力。
藍海大腦圖數據一體機具有精簡的高可用集群架構。軟硬一體,高度集成。開箱即用。優于目前的集中式存儲架構X3,高于集中式存儲架構X5。專業的運維平臺,深度監控管理一體機系統。分布式存儲,高可靠性,全架構冗余設計,避免任意單點故障,以及跨節點數據保護等,更好地為各行各業服務。
2、圖與機器學習結合
近年圖神經網絡在人工智能領域掀起了研究熱潮,目前部分圖平臺除常規圖計算算法外,也開始支持機器學習算法。圖數據與機器學習結合,有助于解決過往機器學習算法存在的可解釋性低下等問題,是人工智能符號主義和連接主義的一種結合。但目前,圖機器學習仍存在內存、硬件等方面的瓶頸,尤其對于大規模的圖深度學習,仍面臨著一些挑戰。
3、高性能圖計算
隨著圖算法日漸復雜,圖數據庫及圖計算對算力層的需求也隨之提升。未來通過軟硬件結合的方式,將高性能計算研究與圖相結合,更好地提升計算效率。目前已有一些高校和企業正在這一領域積極合作開展研究。2021 年 3 月,中國工程院院士鄭緯民教授帶領清華大學計算機科學與技術團隊,聯合海致科技,宣布籌備啟動高性能圖計算院士專家工作站。2022 年 6 月,華中科技大學圖計算團隊研發的圖計算機DepGraph 打破了圖計算性能世界記錄。
總結與展望
一、總結
作為一種理解世界的新方式,圖正憑借其對復雜關聯關系的強刻畫能力,贏得了越來越多的關注,圖數據庫逐漸成為全球數據庫領域競相布局的新興方向,圖計算系統也隨著圖數據規模不斷擴大和下游應用需求變化,逐步向前發展。中國圖計算領域不僅行業入局者越來越多,也逐漸從學術界走入產業界,踏上商業化道路。應用市場正在持續探索新的場景,當前圖計算在金融風控、社交網絡等領域已有大規模應用;未來隨著數據量級增長,數據關聯關系愈加復雜,圖數據作為關系最直接自然的表達將獲得越來越廣泛的應用。
與關系型數據庫等成熟市場相比,目前中國圖計算行業還處于發展初期,商業化任重而道遠。未來圖計算產業的發展,一方面行業生態仍需要進一步完善,拓展更多的應用場景,提高客戶對圖及相關技術的認知水平和接受程度,促進學術界的科研成果順利轉化為工業級產品;另一方面學術界也需要積極推動高水平的技術創新,站在技術前沿指引未來發展思路和方向,產學研聯動打造優秀的圖計算產品和解決方案,創建完善的圖計算行業體系。
二、展望
1、圖計算技術向著多(大規模)、快(低延時)、好(高可靠)、省(低成本) 的方向探索
隨著云計算、大數據、物聯網和人工智能等信息技術的快速發展,數據量級增長迅速,對大規模圖數據的處理需求愈加迫切。在復雜業務場景下,企業對大規模圖數據的查詢和計算對系統的計算性能、可擴展性、可靠性等各方面提出了挑戰。對此,學術界和產業界的研究者在圖計算部署架構、計算模型等方面進行了大量的研究。
2、圖學習作為圖技術與機器學習技術的結合,體現了人工智能符號主義與連接主義兩大流派的融合應用
作為圖計算的一類重要應用,知識圖譜屬于人工智能行業符號主義流派的代表作之一,與以機器學習為代表的連接主義,共同形成人工智能兩大重要流派。近年來機器學習領域的深度學習、神經網絡模型等發展迅速,在計算機視覺、自然語言處理等領域大展身手,實現了繼上世紀的專家系統之后人工智能行業的又一次市場爆發。同時,傳統機器學習固有的可解釋性低下、缺乏非歐空間數據結構處理能力等問題仍尚待解決。
3、圖技術有望拓展應用至更多的行業領域,產業生態亟待進一步完善
目前圖計算技術的應用集中在金融、社交網絡、電力能源等數據量大且具備復雜關系的領域。隨著各行業數字化水平的進一步提高,數據關聯日益復雜,以及大規模圖計算技術的進一步成熟,未來在供應鏈、政務公安、公共衛生等其他行業,或者與低代碼工具、BI 商業智能等應用工具結合,或將發掘出更多市場空間。
4、提高客戶采購決策者對圖計算技術的認知水平
幫助大量已經習慣以關系型數據模式理解業務的一線人員順利理解圖數據并開展業務應用,同時培養出更多優秀的圖數據庫及圖計算系統的開發、運維人員,以在底層能力基礎上建立起完整的工具和應用生態,對行業來說依然是不小的挑戰。圖計算在市場教育方面仍任重道遠。
審核編輯:湯梓紅
-
神經網絡
+關注
關注
42文章
4774瀏覽量
100897 -
數據庫
+關注
關注
7文章
3826瀏覽量
64507 -
知識圖譜
+關注
關注
2文章
132瀏覽量
7715
發布評論請先 登錄
相關推薦
評論