案例簡介
? 本案例中通過 NVIDIA A100 GPU 加速器,上海市磁共振重點實驗室構建了高效的深度學習科研硬件平臺,建立高效且穩定的針對醫學圖像處理的深度學習平臺。
? 本案例中 NVIDIA 精英級合作伙伴信弘智能助力上海市磁共振重點實驗室部署了高效的科研硬件平臺。
客戶簡介及應用背景
上海市磁共振重點實驗室(Shanghai Key Laboratory of Magnetic Resonance)是從屬于華東師范大學的省部級重點實驗室, 是國內核磁共振研究和人才培養的主要基地之一。多年來,堅持自己在磁振物理學上的專業特色,逐漸形成了應用研究與技術研發并重,磁共振波譜與磁共振成像兼顧的局面,并先后建立了“上海市磁共振成像技術平臺”和“上海市核磁共振波譜技術服務平臺”兩個開放平臺,進一步強化了實驗室的開放服務功能。
目前該實驗室已與上海市范圍內十幾家重點醫院展開科研合作,對高效的大數據的醫學圖像處理有著急切的需求。此次借助 NVIDIA A100 GPU 和自身龐大的計算能力,構建出了高效穩定的科研硬件平臺,用于醫學圖像的各種后處理任務,深度學習相關任務。
客戶挑戰
不同于二維自然圖像,醫學圖像往往單個數據數據量較大,對于網絡傳輸帶寬及 GPU 顯存都提出了新的挑戰。并且由于科研課題較大、研究內容跨度較大和研究人員較多等因素。深度學習的硬件平臺效率成為了科研工作效率的瓶頸。如何在有限的預算內完成深度學習平臺的構建成為了新的挑戰。
跨節點使用性能不高,需要優化網絡環境,目前實驗室僅使用了一根 1GB 帶寬網線連接公用存儲服務器,在大型訓練任務中數據傳輸速度低成為深度學習任務的瓶頸。
應用方案
基于以上挑戰,作為解決方案的第一步,上海市磁共振重點實驗室使用了 NVIDIA A100 GPU 加速器,將深度學習訓練、推理和分析整合至一個易于部署的統一 AI 基礎架構中,通過大顯存方法減少IO速度帶來的影響。
目前,實驗室包括 A100 計算服務器總計擁有 7 個計算服務器(計算節點),每臺服務器擁有 4 塊 NVIDIA GPU 加速器用于深度學習,每臺服務器共享同一個存儲服務器。所有用戶通過 Active Directory 賬戶共享計算及存儲服務器。
并且為了進一步整合當前實驗室中 NVIDIA GPU 服務器資源,實驗室開發了面向臨床及科研的醫學圖像 AI 開發開源平臺“Strix”。該平臺基于 NVIDIA 團隊的 MONAI 醫學圖像 AI 處理庫開發。整合了醫學圖像 AI 開發中涉及的數據準備,數據預處理,多種任務框架,結果可視化等步驟。讓醫學圖像 AI 開發可以更為簡單易于上手。針對不同架構的 GPU, Strix 也做了針對性的優化。例如 A100 GPU 的 MIG 虛擬 GPU 技術,我們提供了虛擬 GPU 交互式選擇,實現讓用戶更輕松的選擇目標 GPU 進行訓練。
使用效果
通過NVIDIA A100 GPU的MIG技術,在小團隊的工作環境中有較高的自由度,在計算資源較為緊缺的情況下,可以增加可用用戶數。在顯存資源較為緊缺的情況下,可以減少用戶數增加單個顯存容量。
更大的顯存可以運行需要更大顯存的深度學習任務,讓許多從前無法實現的科研課題在新的GPU上成為可能。同時最新的Ampere架構支持了半精度運算,搭配 NVIDIA的自動混合精度(Automatic Mixed Precision ) 技術,在節省運行顯存開銷的同時,加速神經網絡訓練速度。帶來了更快的網絡訓練及推理效率。
上海市磁共振重點實驗室表示,“作為以醫學圖像處理為重點的課題組,通過與 NVIDIA 的緊密合作,我們將更高效地利用前沿AI技術及醫學圖像技術,解決醫療行業的高價值問題,專注在更智能更高效更安全的未來醫療的新技術。”
審核編輯:郭婷
-
NVIDIA
+關注
關注
14文章
4999瀏覽量
103224 -
gpu
+關注
關注
28文章
4747瀏覽量
129020 -
服務器
+關注
關注
12文章
9219瀏覽量
85595
發布評論請先 登錄
相關推薦
評論