圖形分析(或圖形算法)是用于確定圖形中對象之間的關系強度和方向的分析工具。圖形分析的重點在于每次兩個對象之間的成對關系和整個圖形的結構特征。
什么是圖形分析?
圖形分析是一種新興的數據分析形式,可幫助企業(yè)理解網絡或圖形中關聯(lián)實體數據之間的復雜關系。
圖形是一種數學結構,用于對物理、生物、社會和信息系統(tǒng)中多種類型的關系和過程進行建模。圖形由通過邊緣連接(表示這些實體之間的關系)的節(jié)點或頂點(表示系統(tǒng)實體)構成。圖形處理是一種能夠穿梭各邊緣和節(jié)點的功能,用于發(fā)現和理解網絡中關聯(lián)數據之間的復雜關系和/或優(yōu)化路徑
圖形網絡分析有許多用途,例如分析社交網絡中的關系、網絡威脅檢測,以及根據共同偏好識別潛在買家。
在現實世界中,節(jié)點可以是人員、群組、地點或事物,例如客戶、產品、成員、城市、商店、機場、端口、銀行帳戶、設備、手機、分子或網頁。
節(jié)點之間的邊緣或關系示例包括友誼、網絡連接、超鏈接、道路、路線、電線、電話、電子郵件、“點贊”、付款、交易、電話呼叫和社交網絡消息。邊緣可以有一個單向箭頭來表示從一個節(jié)點到另一個節(jié)點的關系,比如 Janet“點贊了”Jeanette 的一篇社交媒體文章。不過,它們也可以是非定向的,比如,如果 Bob 是 Alice 的 Facebook 好友,那么 Alice 也是 Bob 的好友。
為何選擇圖形分析?
圖形分析可用于確定圖形中對象之間的關系強度和方向。重點是一次處理兩個對象之間的關系,以及整個圖形的結構特征。道路網絡、通信網絡、社交網絡、網頁和鏈接以及金融交易數據均為非常適合圖形的數據示例。圖形分析對于實現以下目標尤為有效:
檢測洗錢等金融犯罪
識別欺詐交易及活動
在社交網絡社區(qū)執(zhí)行網紅分析
根據客戶評級或購買物來執(zhí)行推薦分析
發(fā)現電網、水網和運輸網絡的缺點
優(yōu)化航空公司、零售和制造業(yè)的路線
圖形分析的工作原理是什么?
圖形分析使用聚類、分區(qū)、廣度優(yōu)先搜索、PageRank、連接組件和最短路徑等特定的圖形算法來分析多個應用程序中實體之間的關系:
| 聚類
基于物體的對象進行分組,因此集群內相似度較高,集群間相似性低。應用程序包括機器學習、數據挖掘、統(tǒng)計學、圖像處理以及大量物理和社會科學應用程序。
| 切割或分割
找到交叉邊緣最少的切口。應用程序包括發(fā)現數據和通信網絡的薄弱點,以及社交網絡中的社區(qū)檢測。
| 搜索
廣度優(yōu)先搜索和深度優(yōu)先搜索。
| 最短路徑
找到兩個興趣節(jié)點之間的最短路徑。應用程序包括社交網絡分析、交通運輸物流和許多其他優(yōu)化問題。
| 最寬路徑
在加權圖形中找到兩個指定頂點之間的路徑,從而將路徑中最小權重邊緣的權重更大化。應用程序包括 IP 流量路由和流量敏感型路線規(guī)劃。
| 連接組件
強連接圖形就是您從任何起始節(jié)點開始均可到達圖形中每個節(jié)點的圖形。強連接組件是各個子區(qū)域均強連接的圖形的最大子區(qū)域。應用程序包括社交網絡分析。
| 頁面排名
一種由互聯(lián)網搜索用于網頁排名的衡量網頁受歡迎程度的方法。應用程序還包括社交網絡分析、推薦系統(tǒng)以及在自然科學(研究蛋白質之間的關系時)和生態(tài)網絡中的新用途。
熱門圖形分析用例
創(chuàng)建推薦系統(tǒng) 通過識別客戶、社交媒體和產品數據之間的關系和頻率,公司可以創(chuàng)建智能推薦引擎,實時響應客戶的在線活動。
檢測欺詐。圖形分析支持您以極大的靈活性大規(guī)模地建模數據關系,快速分析大量交易數據,實時識別欺詐。
遵守監(jiān)管規(guī)定。遵守 HIPAA、PCI/DSS 和 GDPR 等法規(guī)關系到各行各業(yè)的企業(yè)。在收集客戶個人信息時,這些法規(guī)要求您在這些數據通過各種企業(yè)系統(tǒng)傳輸時能夠監(jiān)控這些數據。圖形分析能夠為您提供流經不同系統(tǒng)的數據的直觀表示,使得在企業(yè)系統(tǒng)中追蹤敏感數據更加容易。這就會為您提供一種實現合規(guī)性的簡化方法。
身份認證與訪問管理 (IAM)。確定哪些人可以進入敏感的應用程序和數據(基于云和內部部署)是一個復雜的過程。圖形分析能夠對所有必要的數據進行更加穩(wěn)健、實時的跨平臺管理,從而確定數據之間的關系并加速安全可靠的身份認證與訪問管理。
深入了解供應鏈效率。隨著全球化的發(fā)展,企業(yè)供應鏈變得更加復雜。借助圖形分析,您可以為這些復雜的關系建模,并深入了解供應鏈運營中效率低下的問題。
構建推薦系統(tǒng)
檢測欺詐
借助 GPU 加速圖形分析
網絡分析、基因組學、社交網絡分析等領域的大規(guī)模圖形處理需要強大且高效的計算性能。
GPU 具有大規(guī)模并行性,并且顯存訪問帶寬優(yōu)勢顯著,因此十分適用于加速數據密集型分析,特別是圖形分析。GPU 采用大規(guī)模并行架構,包含數千個專為同時處理多個任務而設計的小核心,非常適合執(zhí)行“為每個 X 執(zhí)行 Y”的計算任務,可應用于大型圖形中的頂點或邊緣集。
NVIDIA RAPIDS cuGraph 能夠提供將 RAPIDS 生態(tài)系統(tǒng)與熱門的 python 圖形庫 NetworkX 相集成的加速圖形分析庫。RAPIDS cuGraph 的愿景是使圖形分析無處不在,以便用戶只需考慮分析而無需考慮技術或框架。
新款 NVIDIA GPU 的強大計算能力實現更快的加快圖形分析速度。此外,GPU 的內部顯存速率使 cuGraph 能夠快速切換數據結構,滿足分析需求,而不限于單一數據結構。
通過有效利用 GPU 中的大規(guī)模并行性,RAPIDS 的圖形算法能夠將大型圖形的分析速度提高 1000 多倍。在單塊 A100 GPU 上探索多達 2 億個邊緣節(jié)點,并在 DGX A100 集群上擴展至數十億個邊緣節(jié)點。
NVIDIA GPU 加速的端到端數據科學
NVIDIA RAPIDS 結合了執(zhí)行高速 ETL、圖形分析、機器學習和深度學習的能力。這套完全在 GPU 上執(zhí)行數據科學流程的開源軟件庫和 API,可以將訓練時間從幾天縮短至幾分鐘。它依賴于 NVIDIA CUDA 基元進行低級別計算優(yōu)化,但通過用戶友好型 Python 界面實現 GPU 并行結構和極高的顯存帶寬。
RAPIDS cuGraph 無縫集成到 RAPIDS 數據科學生態(tài)系統(tǒng)中,使數據科學家能夠使用存儲在 GPU DataFrame 中的數據輕松調用圖形算法。借助 RAPIDS GPU DataFrame,數據可以通過一個類似 Pandas 的接口加載到 GPU 上,然后用于各種連接的機器學習和圖形分析算法,而無需離開 GPU。這種級別的互操作性是通過 Apache Arrow 這樣的庫實現的。從數據準備到機器學習,再到深度學習,它可加速端到端流程。RAPIDS 和 DASK 使 cuGraph 能夠擴展為多個 GPU,支持數十億個邊緣圖形。
原文標題:NVIDIA 大講堂 | 什么是圖形分析?
文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
-
NVIDIA
+關注
關注
14文章
5075瀏覽量
103528 -
gpu
+關注
關注
28文章
4768瀏覽量
129216 -
圖形分析
+關注
關注
0文章
3瀏覽量
887
原文標題:NVIDIA 大講堂 | 什么是圖形分析?
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論