將醫學影像交給人工智能(AI)來分析,可以比人類專家更快、更準確地檢測和測量出異常情況,推動基于影像的醫療診斷更進一步發展。要借此來改善患者的治療效果并確立針對性的治療方法,就必須建立起在不同人群中具有普遍性的高質量AI模型。然而,要建立這樣的AI模型,就離不開大量數據的支持,并且這些數據還需要經過精心標注,才能供機器來學習。
現在,我們可以通過深度學習(DL)的一個分支——弱監督學習來完成AI的訓練。這項機器學習技術可以降低對數據標注的完整性和準確性要求,幫助醫生更輕松地獲得更加深入的信息。用于弱監督學習的數據只需進行更容易實現的粗略標注(例如只需標注整個影像,而不必標注影像中細分的關鍵區域) ,并且學習過程中可以充分利用預訓練模型和常見的可解釋性方法。本文中,我們將研究數據管理在弱監督學習中發揮的重要作用。
醫學影像的標注并非易事
醫療行業中的影像標注存在著許多困難。首先,醫學影像本身以及相關的檢查結果數據往往存儲在不同的系統中,導致數據標注工作困難重重,也就難以獲得經過標注的數據。
例如,來自計算機斷層掃描(CT)或磁共振成像(MRI)的影像數據可能存儲在醫院系統中,但相關的活檢或腫瘤切除檢查結果往往會存儲在病理實驗室中,而這些實驗室可能位于醫院之外的私人診所或檢測機構。這時,如果要核對某些數據和標注的話,雖然做法上可行,但獲取并匯總數據的工作可能會花費大量時間,尤其是在涉及不止一家私人診所或檢測機構的情況下。
而且,要在影像中尋找并標記出疾病發生和進展的跡象(生物標志物),本身就是一件極其耗時并且復雜的事情,因為這些數據必須逐個像素地進行標注,最終的標記數量可達上千個。如果需要通過算法來分割影像或者定位到特定區域(如病變或手術邊界)的話,這一問題尤為嚴重。這樣的過程往往需要耗費大量成本,因為醫學影像標注通常要借助專業知識才能進行,而且MRI和CT影像還需要做三維標注。這兩項缺點加在一起,使醫學影像的標注成為了一項成本不菲的工作,而且還難以通過外包來完成。
由于標注過程需要用到專業知識,標注的質量也會因標注人員對這些知識掌握程度的不同而發生變化,進而影響到深度學習模型的最終表現。對于數據標注而言,標注的準確性是一大問題。通常情況下,經驗不足的放射科醫生或住院醫師會接受數據標注培訓,但他們的標注準確度顯然比不上有著數十年工作經驗的臨床醫生。
此外,閱片人員所表現出的差異也會影響到標注的結果:一方面,不同的閱片人員對同一幅影像的解讀會有細微差異;另一方面,同一個閱片人員如果在不同時間標注同一幅影像,最終結果也會有細微的區別。
最后,人工標注這件事本身也會限制最終結果。機器學習的一大優勢在于模型可以發現人類無法察覺的規律,然而人工標注終究依賴于人工輸入,模型最終輸出的結果很容易因此而受到限制。
例如,AI如果只能復制人類對某些任務的想法,那么它就很可能無意中把某個人的偏見也復制過來。
此外,輸入數據中某些看似無關區域的特征也可能具有預測性,但由于它們不在人為選定的關注區域內,因而會直接被拋棄。
例如,疾病的顯著指征完全可能出現在關注區域周邊的其他組織中,甚至可能會出現在附近的其他器官中。
運用弱監督學習來進行訓練
在上述場景中,我們更希望AI可以接受更加籠統的標注(例如一幅影像中是否包含癌癥組織或其他疾病指征),然后再由模型來找出其中最能說明問題的特征 。這正是弱監督學習的用武之地。
使用弱監督學習實現自動標注。人工智能發現了病理學家沒有發現的預測性特征。
弱監督學習是深度學習的一個分支,旨在通過更少、更粗略的標注來生成性能良好的深度學習模型。這些標注大致可以分為三大類:不完整、不精確和不準確的標注。這里使用“大致”一詞是因為單個數據集中可以結合使用多種標注方法,并且弱監督標注的目的就是根據需要來解決各種組合問題。
不完整的標注通常表現為數據集的一部分被標注,而其余部分未被標注。
不精確的標注則是直接標注出影像的整體結果,不對特定關注區域進行分割。
不準確的標注源于標注人員缺乏專業知識,以及某些疾病指征之間的模糊性或不確定性。
有趣的是,如果通過更粗略、更容易實現的標注就可以產生不錯的結果,那么不精確的標注可能比不完整或不準確的標注更有用。不精確的標注不容易出錯,因為它不需要達到像其他標注那樣的詳細程度,而且它也更容易獲得:
例如只需從掃描報告中提取出有關癌癥分期的信息,就可以表明該掃描影像包含癌癥組織,而不必再通過人工的方式把癌變區域從三維影像中“摳”出來。這些標注自身雖然“不精確”,但卻可以讓數據集獲得更多可用的標注,進而提升準確度。
尤為重要的是,通過這種標注方式,我們就不必再為了標出一切相關的細枝末節而花大價錢雇傭或培養高度專業的人員。這種方式最終可以提高標注的準確性,畢竟給出一個二選一的答案遠比詳細描繪出所有特征來得容易。
要在常見的醫學影像應用(例如檢測和定位關鍵區域)中利用這種不精確的標注,比較常見的做法是利用以下兩步流程:
打造主干模型,例如訓練一個深度學習模型來預測由不精確的標注所描述的類別。
在對特定掃描影像進行預測的模型中,使用像素屬性方法(也稱為顯著性或可解釋性方法)將模型決策的最相關區域突顯出來。
兩個輸入圖像(金魚和熊) ,以及在弱監督學習期間用于執行分割的基于梯度的像素屬性方法。
使用卷積神經網絡作為主干
醫療領域經常需要用到影像數據,因而將卷積神經網絡(CNN)用作弱監督學習主要的基礎深度學習框架就是自然而然的選擇。CNN的工作原理是通過學習來減少醫學掃描影像中需要處理的像素量(通常是將三維圖像降維表示),然后將這些像素對應到類別標注。
在弱監督學習中,我們還可以結合使用多種方法。您可以使用自己的數據集訓練新的網絡(如果該數據集足以提供其他類似數據源的優勢),也可以使用預先訓練好的網絡來對新任務進行遷移學習。例如,ResNet50和VGG16就是利用源自日常生活的數百萬張圖片來訓練的兩種CNN架構。雖然它們并沒有使用醫學影像進行過訓練,但它們仍然非常有用,因為在模型早期階段的層中學習到的卷積過濾器往往涉及的是通用的特征,如線條、形狀和紋理等,這對醫學影像依然是有用的。
要使用這些模型之一來進行遷移學習,只需去掉后期階段的類別預測層,然后用代表新的醫學影像任務所需類別的層來重新初始化即可。雖然模型的最終目標是讓輸出結果能夠突顯出影像中的相關物體和值得關注的區域,但首先進行的第一步只需預測影像中是否存在這些值得關注的區域即可。
弱監督定位的AI可解釋性
當深度學習主干完成訓練,可以準確預測是否存在值得關注的類別后,下一步便是使用某種AI可解釋性方法來分割關注區域。這些可解釋性方法(也稱為像素屬性方法)旨在深入了解深度學習模型在做出某種預測時在圖像中看到的內容,其輸出是某種形式的圖像(通常稱為顯著圖),可以根據最終目標以多種不同的方法計算得出。
在這些方法中,基于梯度的顯著圖是最常用的方法之一,其核心包括輸出預測以及對所有構成該輸出的神經元進行檢測。根據方法的不同,這種檢測可以一直追溯到第一個輸入層——標準梯度(Vanilla Gradient),也可以停留在某個較后期的層,如神經網絡架構中的最后一個卷積層——GradCAM。其他的方法可以實現不同的目的,例如產生更平滑的關注區域、改善更簡單的方法存在的局限性,或在所需特征周圍進行更緊密的分割。
GradCAM是一種ML可解釋性方法,可用于在弱監督學習中分割特征,它所獲取的是關于最后一個卷積層的輸出類的梯度。
結語
就在不久前,識別醫學影像中的生物標志物依然還需要大量以復雜方式進行標注的影像數據。然而,弱監督學習等技術降低了對數據標注完整性、精確性和準確性的要求,從而能夠輕松揭示出以往需要耗費大量時間、借助高度專業的知識才能發現的問題。
弱監督學習只需采用更容易實現的粗略標注(例如只標注整個影像,而不是標注影像中細分的關鍵區域)就可以運作。它可以重新利用預先訓練好的CNN模型,然后使用常見的可解釋性方法,根據預測的類別將值得關注的區域突顯出來。在這些特性的支持下,便可以將使用醫學影像數據訓練的模型用于各種應用,無需進行大量像素級標注。這不僅節省了時間和成本,更有可能發現臨床醫生以前未曾了解的預測特征,從而提高診斷的準確性、改善患者的治療效果。
Becks作者介紹
Becks是Imagia公司的機器學習技術負責人,該公司是一家位于蒙特利爾的初創公司,致力于幫助臨床醫生運用人工智能推動醫學研究。在業余時間,她還與Whale Seeker合作,這是另一家運用人工智能對鯨魚進行檢測的初創公司,旨在讓工業發展與這些溫和的巨獸和諧共存。她從事深度學習和機器學習領域的工作,致力于研究新的深度學習方法并直接應用這些方法來解決現實世界的問題、構建渠道和平臺來訓練和部署人工智能模型,以及為初創公司的人工智能和數據戰略提供咨詢服務。
關于貿澤電子
貿澤電子(Mouser Electronics)是一家全球授權半導體和電子元器件授權分銷商,服務全球廣大電子設計群體。貿澤電子原廠授權分銷近1,200家知名品牌,可訂購數百萬種在線產品,為客戶提供一站式采購平臺,歡迎關注我們,獲取第一手的設計與產業資訊信息!
原文標題:醫學影像數據訓練太難?那是因為你還不知道這個利器~
文章出處:【微信公眾號:貿澤電子】歡迎添加關注!文章轉載請注明出處。
審核編輯:湯梓紅
-
AI
+關注
關注
87文章
31089瀏覽量
269415 -
測量
+關注
關注
10文章
4885瀏覽量
111471 -
影像
+關注
關注
0文章
130瀏覽量
14511
原文標題:醫學影像數據訓練太難?那是因為你還不知道這個利器~
文章出處:【微信號:貿澤電子,微信公眾號:貿澤電子】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論