在醫學成像中應用機器學習 (ML),為改善胸部 X 光 (CXR) 圖像解讀的可用性、延遲時間、準確率和一致性提供了絕佳的機會。事實上,我們已經開發了大量的算法來檢測如肺癌、肺結核和氣胸等特定疾病。然而,由于這些算法是被訓練用于檢測特定疾病,其在普遍臨床環境下的實用性可能會受到限制,因為這種環境下可能會出現各種各樣的異常情況。例如,我們無法通過氣胸檢測算法發現癌癥結節,而肺結核檢測算法可能也無法識別肺炎特有的癥狀。由于初始分診步驟是確定 CXR 是否包含相關的異常,如果能使用一種通用算法,以識別包含任何異常情況的 X 光圖像,即可大大簡化工作流。然而,由于在 CXR 上出現的異常情況種類繁多,開發能識別所有異常情況的分類算法可謂充滿挑戰。
我們發表于《科學報告》的“深度學習用于區分正常和異常胸部放射照片,并泛化到兩種未知疾病:結核病與新冠肺炎 (Deep Learning for Distinguishing Normal versus Abnormal Chest Radiographs and Generalization to Two Unseen Diseases Tuberculosis and COVID-19)”一文中提出了一個模型,該模型可以在多個去識別化的數據集和環境中區分正常和異常的 CXR。我們發現,該模型在檢測一般的異常情況以及結核病和新冠肺炎等未知病例方面表現良好。我們還針對公開可用的 ChestX-ray14 數據集發布了本研究中用到的測試集的放射科醫生標簽集[1]。
深度學習用于區分正常和異常胸部放射照片,并泛化到兩種未知疾病:結核病與新冠肺炎
https://www.nature.com/articles/s41598-021-93967-2
用于檢測異常的胸部 X 光圖像的深度學習系統
我們使用基于 EfficientNet-B7 架構的深度學習系統,且在 ImageNet 上進行了預訓練。我們使用來自印度阿波羅醫院的 20 多萬張去識別化 CXR 來訓練該模型。通過使用基于正則表達式的自然語言處理方法,我們在相關的放射學報告中為每張 CXR 分配“正常”或“異常”標簽。
EfficientNet-B7
https://github.com/tensorflow/tpu/tree/r1.15/models/official/efficientnet
ImageNet
https://arxiv.google.cn/abs/1409.0575
為評估該系統在新問診者群體中的普及程度,我們在兩個由大量異常情況組成的數據集中比較了其性能:阿波羅醫院數據集的測試分塊 (DS-1),以及公開可用的 ChestX-ray14 (CXR-14)。一群獲美國職業認證的放射科醫生為此項目對兩個測試集的標簽進行了注釋。該系統在 DS-1 和 CXR-14 上的接收者操作特征曲線下面積 (Receiver operating characteristic) (AUROC) 分別達到了 0.87 和 0.94(數字越高越好)。
盡管對 DS-1 和 CXR-14 的評估中包含多種異常情況,不過出現的用例可能是在全新或未知的環境(未知疾病)中利用這樣的異常檢測算法。為評估該系統對新問診者群體和訓練集中未知疾病的通用性,我們使用了來自三個國家(地區)的四個去識別化數據集,包括兩個公開可用的結核病數據集和兩個來自 Northwestern Medicine 的新冠肺炎數據集。該系統在檢測結核病時曲線下面積達到了 0.95 至 0.97;在檢測新冠肺炎時曲線下面積達到了 0.65 至 0.68。由于對這些疾病呈現陰性的 CXR 仍可能包含其他相關異常情況,我們進一步對該系統檢測異常(而不是檢測疾病為陽性或陰性)的能力進行評估,發現結核病數據集的曲線下面積為 0.91 至 0.93,新冠肺炎數據集的曲線下面積為 0.86。
檢測新冠肺炎的表現大幅下降是因為許多被系統標記為“陽性”的異常病例對于新冠肺炎來說呈現陰性,但仍需要注意,其中可能包含異常 CXR 結果。這進一步突顯了異常檢測算法的作用,尤其是在特定疾病模型可用的情況下。
此外需要注意的是,泛化到未知疾病(即結核病和新冠肺炎)和泛化到未知 CXR 結果(例如胸腔積液 、實變 /浸潤)之間存在差別。在此項研究中,我們證明了該系統在檢測未知疾病方面的通用性,但對于未知 CXR 結果則不具有通用性。
臨床方面的潛在優勢
為了解深度學習模型在改善臨床工作流方面的潛在實用性,我們模擬了在病例優先級方面該模型的應用,即“加急”異常病例,并將其放置在正常病例之前。在上述模擬操作中,系統將異常病例的周轉時間減少了 28%。通過這種設置,我們可以重新確定優先級,將復雜的異常病例轉交給心胸專科放射科醫生,從而對可能需要緊急決策的病例進行快速分類,并有機會通過簡化審查的方式對陰性 CXR 進行批量審查。
此外,我們發現該系統可以作為預訓練模型來優化胸部 X 光片的其他 ML 算法,尤其是在數據有限的情況下。例如,我們在最近的研究中使用了正常/異常分類算法,以根據胸部 X 光片檢測肺結核。在專業放射科醫生或分子檢測技術等資源匱乏的地區,異常情況和結核病的檢測算法可以在初期診斷中發揮關鍵作用。
分享改進后的參考標準標簽
要發揮 ML 的潛力,以在世界范圍內輔助解讀胸部 X 光片,我們還有很多工作要做。具體來說,在去識別化的數據上獲得高質量標簽可能是在醫療領域開發和評估 ML 算法的一個重要障礙。為了加速努力進程,我們通過發布在本研究中用到的標簽,對之前發布的標簽進行擴展,并將其用于公開可用的 ChestX-ray14 數據集。我們期待著社區在該領域開展未來的機器學習項目。
責任編輯:haq
-
機器學習
+關注
關注
66文章
8408瀏覽量
132573 -
深度學習
+關注
關注
73文章
5500瀏覽量
121117
原文標題:深度學習助力異常胸部 X 光片檢測
文章出處:【微信號:tensorflowers,微信公眾號:Tensorflowers】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論