AI正在各個行業掀起漸進式的變革,醫療一直是其中的熱門領域,被業界認為有可能盡快實現產業化。
AI+醫療的快速發展,離不開迅速增長的醫學大數據規模、快速提升的算力和理論基礎的進展。進一步分析,從資本層面來看,AI+醫療有較好的投資盈利預期,受到了資本的追捧;從技術和人才角度來看,醫療AI的研究機構眾多,包括科研單位、高校、大型企業、創業企業等,造就了一大批奮戰在一線的科研機構,相應的技術和人才水平較高;具體到細分應用,特別是在醫學圖像識別領域,擁有豐富的技術和設備等資源。
醫療影像面臨的數據挑戰
AI在醫療產業的發展,最初是數據收集,主要是通過多種工具或設備來收集人體的健康數據,醫療影像是其中之一,也是迄今為止AI在醫療行業落地最為成熟的應用之一。隨著醫療信息化和生物技術不斷地發展,醫療數據的類型和規模正以前所未有的速度快速增長。在醫療AI領域,獲取高質量的醫學影像數據難度較大。一方面來自于醫學影像數據前處理和標注所需的投入,占據了開發成本的絕大部分,工作量巨大;其次,隨著現代醫學影像技術的發展,醫學影像數據的產生技術也變得越來越復雜,客觀上加大了數據的獲取和使用難度;同時,由于醫學影像數據絕對的私密性,數據的擁有方采取高度保護措施,也加大了AI研發機構獲取數據的難度。
只有獲取更多的數據進行訓練,AI模型才能更強健。而眼下這些現狀,顯然有礙于深度學習理論下AI模型的進展。
“聯邦學習”——打破數據壁壘,保護隱私數據
日前,在全球高端的醫學影像會議MICCAI召開期間,NVIDIA攜手倫敦國王學院推出了用于醫學影像分析、且具有隱私保護能力的聯邦學習系統( federated learning system)。據了解,該實驗基于取自BraTS 2018數據集的腦腫瘤分割數據而實施,包含了285位腦腫瘤患者的MRI掃描結果,采用了NVIDIA V100 Tensor Core GPU用于訓練與推理。NVIDIA醫療副總裁Kimberly Powell與NVIDIA資深研究科學家Nicola Rieke介紹了聯邦學習系統的技術細節、實施前景及研究背景。
右一:NVIDIA醫療副總裁Kimberly Powell
左一:NVIDIA資深研究科學家Nicola Rieke
左一:NVIDIA資深研究科學家Nicola Rieke
聯邦學習(federated learning)是一種能夠讓開發者與各企業機構利用分散在多個位置的訓練數據,對中心深度神經網絡(DNN)進行訓練的學習范式,該方法可以支持各企業機構針對共享模型開展協作,而無需共享任何臨床數據。
NVIDIA最新發布的論文中,對這一數據訓練方式表述為:“聯邦學習在無需共享患者數據的情況下,即可實現協作與分散化的神經網絡訓練。各節點負責訓練其自身的本地模型,并定期提交給參數服務器。該服務器不斷累積并聚合各自的貢獻,進而創建一個全局模型,分享給所有節點。”
一言蔽之,“聯邦學習系統”最大的突破,在于它的運行方式是——模型找數據,而非數據找模型。如下圖所示,最左邊的“全局AI模型”可以分散到各個醫院或研究中心,利用它們本地的數據進行訓練,之后再將訓練后的模型回傳,而數據始終保存在本地。通過各個醫院、研究中心等機構不斷地訓練,“全局AI模型”不斷壯大,再分享給各個節點,實現了數據與模型訓練的“雙贏”。
由于無需上傳病人的隱私數據,大大打消了數據擁有方對于隱私數據的顧慮。但是,這一系統是否足夠安全?有無被通過“反推”方式破解數據的風險?
Nicola Rieke對<電子發燒友>表示,通過模型反演、設法使數據重現的手段已在研究考量中,因為如果知道底層的運行邏輯,不排除會有一些反推手段。為了提高聯邦學習的安全性,研究人員試驗了使用ε-差分隱私框架的可行性。該框架是一種正式定義隱私損失的方法,該方法可以借助其強大的隱私保障性來保護患者與機構數據。據Nicola Rieke介紹,相當于完成模型訓練之后,加入“噪點”使數據變得模糊,改變了原有數據的顆粒度,使得反推更加困難。
“聯邦學習”VS.“集中化數據處理”
Kimberly Powell進一步談到了聯邦學習系統的價值所在。她提到,在當前很多AI的研究或項目中,大量的工作離不開“數據收集”,各個國家都在進行相應的工作。但是涉及跨國或是跨區域的合作,大家幾乎不可能共建一個數據池進行分享,因此數據壁壘愈發凸顯。這時“聯邦學習系統”就能夠發揮作用了。通過深度學習從數據中自動提取知識,再運用“聯邦學習”有效聚合各機構從私有數據中本地習得的知識,能夠進一步提高深度模型的準確性、穩健性與通用化能力。
與集中化的數據處理方式相比,聯邦學習所提供的方法可以在不共享機構數據的情況下實現相當大的分割性能。試驗結果顯示,隱私保護與受訓模型質量之間產生了自然折中。而且,通過使用稀疏向量技術,聯邦學習系統可以實現嚴格隱私保護,且對模型性能僅產生合理的輕微影響。
另外就是集中化的數據處理方式,相當于將數據量增加了一倍。例如1TB 的CT圖象,將它集中起來進行訓練,需要把這1TB數據進行拷貝再做轉接傳輸,給整個系統增加了額外的數據負擔,對于系統的算力、存儲、帶寬都是更為嚴峻的考驗。
目前什么樣的系統能夠采用“聯邦學習”? Kimberly Powell表示,NVIDIA 的GPU硬件基本上對于每個服務器供應商來說都是可以使用的,入門級的投入1萬美金即可。NVIDIA與美國放射科學會已經共同打造了一個參考架構,可以應用到各個醫院中,如果僅是試用性的訓練,用這個架構的第一層就可以了。如果有相對高層級的需求,可能需要從頭去打造全新的算法應用。
Kimberly Powell強調,“聯邦學習系統”是目前在醫療健康AI領域的突破性進展,該研究為部署安全聯邦學習方面做出了巨大的推動,并將廣泛推動數據驅動型精準醫學的進步。
崛起的醫療AI,進擊的NVIDIA
根據公開數據,到2020年醫療數據量將達40萬億GB,數據生成和共享的速度將迅速增長,其中80%以上的數據為非結構化數據。面對如此迅速增長的醫療數據量,不借助AI的提升很難進行甄別和處理。Kimberly Powell以2017年獲得諾獎的一臺記錄人體蛋白質數據的機器舉例,這臺機器可以在原子層面記錄人體的蛋白質數據,這種新型的探測技術每天收集超過3T數據,可以用于很多醫療研究領域,例如基因組學等等。在接下來的幾年中,它所生成的數據會比Facebook、YouTube的數據總和還要多。想象一下全世界范圍之內,所有的醫院、供應商所產生的數據。
另一方面,就放射科而言,實際的醫生數量與需求之間并不匹配,存在著巨大的人員缺口,在美國這一缺口達到50%。Kimberly Powell稱,正因為如此,需要將一些工作實現自動化,降低AI的應用門檻。
她認為,2018年是AI在放射科應用的拐點,除了通過AI大幅降低成本,提升圖像質量,真正將醫療工作與AI整合在了一起。例如CT設備通過AI實時算法縮短成像時間,生成更多更安全、準確的實時圖像;以及探測顱內出血的設備,可以根據實際情況及時幫助醫生根據工作優先級調整工作流程等。
根據億歐智庫的研究顯示,國內疾病風險預測、醫學影像場景下的公司數量最多,占醫療AI公司總數的一半以上,相關產品相對成熟。
也正是看到了AI在醫學影像領域的巨大潛力,NVIDIA不斷加大在這一細分領域的投入。今年春天,NVIDIA正式發布了Clara。和CUDA一樣,Clara的推出是NVIDIA在GPU易用性方面做出的又一努力。但不同于CUDA,Clara面向醫療領域的垂直細分應用,從軟件層面幫助開發者在GPU平臺部署計算密集型醫療AI應用程序。
由于標記數據對于構建安全可靠的AI至關重要,但放射科醫生無法花費數小時來標記數據集。因此Clara具備輔助注釋功能,可以加速結構化數據集的創建,從而在幾分鐘內完成注釋。
此外,Clara還具有遷移學習的功能,能夠對已有模型進行調整,從而適應本地變量。它能夠使用包含本地人口統計的數據和本地影像設備對深度學習算法進行定制,且無需移動或共享患者數據。因此,醫生可為自己的患者創建模型,而無需使用10倍的數據量從頭開始。
對于初創公司來說,Clara這種可以在官網免費下載的SDK很受歡迎。NVIDIA也在增加更多的加速引擎,幫助他們提升效率,加速方案的部署。此外,Clara也面向針對醫療設備公司、醫院等企業客戶。
截至目前,這一平臺的開發者數量已經增長了4倍。據了解,最新發布的“聯邦學習系統” 也會整合到Clara工具平臺中。而不論是聯邦學習系統還是Clara,都是NVIDIA使AI在醫療行業更為落地的鋪墊。作為底層技術賦能者,NVIDIA正在通過軟件+硬件的方式,雄心勃勃地進發著。
Kimberly Powell表示,得益于之前在消費級AI的良好基礎,NVIDIA能夠在醫療AI領域提供面向更復雜應用的開發工具。下一步,針對自動化AI將進行更為深入的研究和投入。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
gpu
+關注
關注
28文章
4729瀏覽量
128891 -
醫療
+關注
關注
8文章
1822瀏覽量
58738 -
英偉達
+關注
關注
22文章
3770瀏覽量
90990
發布評論請先 登錄
相關推薦
NVIDIA助力西門子醫療加速醫學影像AI部署
MONAI 集成現已上線西門子醫療 Digital Marketplace,加速 AI 在臨床工作流中的應用落地。
NVIDIA加速計算如何推動醫療健康
近日,NVIDIA 企業平臺副總裁 Bob Pette 在 AI Summit 一場演講中重點談論了 NVIDIA 加速計算如何推動醫療健康
NVIDIA AI助力實現更好的癌癥檢測
由美國頂級醫療中心和研究機構的專家組成了一個專家委員會,該委員會正在使用 NVIDIA 支持的聯邦學習來評估聯邦學習和
名單公布!【書籍評測活動NO.49】大模型啟示錄:一本AI應用百科全書
具體章節中逐一介紹這些參與共創的朋友,在這里不再詳細列舉。
本書并非從學術或理論的角度出發,而是匯集了前沿的行業實踐經驗,每篇內容都緊密關聯實際應用,旨在成為大模型在各行各業落地實踐的
發表于 10-28 15:34
AI for Science:人工智能驅動科學創新》第4章-AI與生命科學讀后感
高效地篩選出具有潛力的藥物候選分子,加速新藥上市的進程。在基因測序與編輯領域,AI技術將提高基因數據的處理速度和準確性,為個性化醫療和精準
發表于 10-14 09:21
GE醫療與亞馬遜云科技達成戰略合作,通過生成式AI加速醫療健康領域轉型
GE醫療已選擇亞馬遜云科技作為其戰略云服務合作伙伴,致力于推出全新的定制化基礎模型,加速創新醫療應用快速開發。 ? GE醫療將利用亞馬遜云科
發表于 08-29 16:38
?270次閱讀
云天勵飛加速推動大模型行業落地
陳寧博士受邀發表主題演講,首次展示云天勵飛邊緣AI的戰略全貌。 ? 大模型落地的多重挑戰 邊緣AI提供解法? 今年WAIC上,“大模型+行業”的應用
西門子中國與亞馬遜云科技簽署戰略合作協議 加速生成式AI在制造行業創新應用落地
和服務,并結合西門子在工業領域的深厚積累和經驗,聯合創新團隊將深入探索云計算、人工智能、機器學習、大數據等前沿技術與制造業更進一步融合,并加速生成式
發表于 04-18 11:30
?211次閱讀
NVIDIA的專用AI平臺如何推動下一代醫療健康行業的發展
醫療科技創新企業在 GTC 上介紹了 NVIDIA 的專用 AI 平臺如何推動下一代醫療健康行業
NVIDIA在加速識因智能AI大模型落地應用方面的重要作用介紹
本案例介紹了 NVIDIA 在加速識因智能 AI 大模型落地應用方面的重要作用。生成式大模型已廣泛應用于各領域,通過學習人類思維方式,能快速
FPGA在深度學習應用中或將取代GPU
業可行性方面考慮,自動駕駛汽車等應用可能需要多達 7-10 個 GPU(其中大多數會在不到四年的時間內失效),對于大多數購車者來說,智能或自動駕駛汽車的成本將變得不切實際。”
機器人、醫療保健和安全
發表于 03-21 15:19
AI大模型落地學習機,大模型應用成學習機創新方向
電子發燒友網報道(文/李彎彎)大模型在終端產品上的落地,除了智能手機、PC之外,還有學習機。過去一段時間,隨著大模型的火熱,互聯網、教育公司都已經紛紛披露大模型在教育領域的最新動態,并發布搭載
家居智能化,推動AI加速器的發展
電子發燒友網報道(文/黃山明)AI加速芯片,也稱為人工智能加速器(AI Accelerator),是一種專為執行機器學習和深度
評論