隨著 AI 技術的普及,人工智能與醫療場景的結合擁有更多值得期待的可能性。然而,有研究人員發現,人工智能在醫療領域的應用缺陷同樣明顯,與人類一樣,人工智能也會為達到某種目標選擇走 “捷徑”,甚至在具體應用場景中會出現 “誤判”。
5 月 31 日,《自然機器智能》(Nature Machine Intelligence)上發表了題為《放射 COVID-19 檢測的 AI 選擇信號的快捷方式》(Fitting elephants in modern machine learning by statistically consistent interpolation)的論文,華盛頓大學研究人員對胸部放射圖中準確檢測 COVID-19 的人工智能系統穩定性提出了質疑,他們證明 COVID-19 的人工智能系統并不依賴于醫學病理學,而是混淆因素,這會導致一種測試表象與實際不符結果。
例如,COVID-19 的人工智能系統在新醫院里測試的失敗。該團隊發現,人工智能模型無法真正反映 COVID-19 存在的基礎病理學,而是利用 COVID-19 的存在或缺失與反映圖捷徑之間的虛假關聯。
華盛頓大學研究員的實驗聚焦在 “最壞情況混淆” 的研究,他們構建了兩個不同的數據集,一個用來復制歷史研究數據,另一個用于新醫院的外部驗證。該模型最重要的一點在于,能夠區分 COVID-19 陽性和 COVID-19 陰性病例的關鍵數據。研究人員構建的人工智能模型在三個方向提出了自己的看法。
第一,可解釋的 AI 識別虛假混淆者。這個研究結果對傳統觀點是顛覆性的,當數據集來源于陽性和陰性 COVID-19 病例相似病理時,他們認為混淆不會造成什么問題,高性能醫療 AI 系統在實際檢測過程中具有一定的選擇性,大概率會選擇不受歡迎的捷徑而非所需信號。
可解釋的 AI 可視化圖像因素對于深神經網絡來說尤為重要,這些神經網絡經過培訓和學習之后,能夠檢測放射圖中的 COVID-19。
第二,可解釋的醫學領域人工智能技術缺乏透明度。人工智能的應用離不開大量的數據支撐,技術層面通常依據數據集給出幾個方向的預測,遺憾的是我們無法知道構建的模型如何給出定性的結果。例如,一個使用捷徑的系統,可以根據人們年齡的大小推斷患某種疾病可能發生的概率,這種推斷的邏輯基于歷史數據或以往病例的頻率做出判斷,這種推斷本身并沒有錯,但這種關聯是非透明的,缺乏透明度的關聯有時會造成病理誤判。
人工智能系統在數據識別方面還具有明顯優勢,而它的缺陷是不能學習疾病病理。COVID-19 的結果與數據源存在較好關聯的情況下,人工智能技術幾乎起不到作用。
第三,捷徑對泛化有可變影響。值得關注的是,某些快捷會損害通用性能,當人工智能模型在一組數據集上測試時,可以保持較高的性能。如果在第二組數據集上測試,測試的準確性就會降低 50%,研究人員把這種現象稱為 “泛化差距”。
雖然快捷方式學習能夠很好地解釋較大的泛化差距,研究人員認為這種方式依然不可取,根本原因是沒有辦推廣到其他設置,在臨床方面的應用效果也欠佳。
研究人員還研究了哪些快捷鍵可能導致推廣不良,為此,他們還分析了臨床元數據和每個存儲庫的平均圖像。在沒有統一標準的快捷方式中,圖像文本標記對于預測 COVID-19 很重要。在概括的快捷鍵中,患者性別可能是好概括的因素,因為在兩個數據集中患有 COVID-19 陽性結果中,男性比例相對較高。研究人員推斷,只有少數模型能監測真正的 COVID-19 病理學。
理論上來說,緩解快捷方式學習的解決方案是,刪除模型用作快捷鍵的圖像因素。事實上,在實踐的過程中,很難去除所有圖像因素。研究人員試圖找到一個更加可靠的解決方案,來消除圖像因素,讓快捷鍵方式學習簡單地收集數據減小混淆。經過大量的實驗,研究人員希望精細化收集數據,盡量抑制捷徑學習的潛力,出于嚴謹考慮該研究團隊稱,改進的數據收集只能部分解決問題。
人工智能模型在應用方面并不具有落地性,盡管研究人員在該論文中提出諸多令人興奮的觀點。有相關數據表明,相當數量的醫院采購了一種有缺陷的模型 —covid - net,醫院采購之后究竟用于臨床還是僅用于研究,真實的使用意圖尚不明確。
值得注意的是,有的醫院不愿意為此擔責任,醫療保健使用者傾向用聚合酶鏈反應 (PCR) 來診斷 COVID-19,他們不會依賴一個相對未經測試的胸片檢測。
盡管如此,該團隊仍然對人工智能在臨床醫學的可行性持積極態度,如果有辦法獲取更多的樣本,能夠更加高效地審計這些系統,那么將幫助研究人員避免他們在 COVID-19 模型中發現的一些缺陷。他們相信,隨著科技的不斷進步,有好的辦法可以防止人工智能系統學習 “捷徑”。
可解釋的人工智將安全有效地用于醫療決策,成為解決患者病理的有效工具。人工智能在某些病理方面能夠提供更加精準的診斷,將會推動未來醫療行業的變革。
原文標題:AI 技術無法真正反映 COVID-19 存在的基礎病理學,臨床應用層仍面臨諸多挑戰
文章出處:【微信公眾號:DeepTech深科技】歡迎添加關注!文章轉載請注明出處。
責任編輯:haq
-
AI
+關注
關注
87文章
30734瀏覽量
268893 -
人工智能
+關注
關注
1791文章
47184瀏覽量
238266
原文標題:AI 技術無法真正反映 COVID-19 存在的基礎病理學,臨床應用層仍面臨諸多挑戰
文章出處:【微信號:deeptechchina,微信公眾號:deeptechchina】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論