對乳腺癌的早期篩查一直是機器學習的一個熱門研究方向,可是已有的篩查模型大多數依賴于白人女性樣本,因此對于非白人女性的篩查準確率令人堪憂。
最近麻省理工開發的新模型不僅很好地解決了這個問題,而且還能夠提前五年篩查出乳腺癌病患!
這一項突破性研究,標志著深度學習技術推動下的醫學進步,可以提前了解病情,做針對性治療,這對于病患來說,是一大福祉。
Regina Barzilay和Lehman與CSAIL博士生的主要作者Adam Yala共同撰寫了這篇論文。
已有的篩查模型
之前的疾病篩查模型大多是CNN(卷積神經網絡)的改良版本,CNN是前饋神經網絡,模擬人的視覺對于圖像的理解。網絡結構中的卷積核提取圖像的邊緣、輪廓等信息,Relu等激活函數模擬大腦對于外界信號刺激的應答,對提取到的圖像信息做整合,淺層卷積層提取到局部的圖像信息,層數越深的卷積層能提取到全局的圖像信息,在CV(Computer Version)領域也稱為感受野(Receptive Field),CNN網絡模型對于圖像的分類任務處理十分友好,下圖很好地展示了CNN網絡的結構和原理:
CNN圖像理解示意圖
疾病篩查任務也就是二分類任務,對于輸入的圖像,需要得到是否患病的判斷。給醫學圖片做標簽(在計算機科學中標記為0或1,0表示沒有患病,1表示患?。?,在模型中,通過Label(標記)好圖片的訓練和反向傳播的參數調整,使得模型具備一定的學習能力,最終能夠對未標記的醫學圖片做疾病篩查。但是訓練的結果依靠數據集的好壞,已有的很多乳腺癌預測數據集都偏向于白人女性的研究,鮮少考慮到其他族裔。麻神理工大學研究人員開發的診斷模型考慮到了這一點。
將研究擴展到少數族裔
麻省理工的研究人員在一篇博客中指出,事實上這個看起來不起眼的一個細節是乳腺癌預測的關鍵:因為黑人女性死于乳腺癌的概率比白人女性高 42%。而正是目前的乳腺癌早期診斷技術中對黑人女性的診斷模型缺失造成了這一巨大差異,因為包括黑人女性在內的少數族裔樣本在已有的深度學習模型開發中通常鮮有被考慮進去。
而麻省理工的研究人員表示,他們對乳腺癌預測模型的研究正是為了彌補這一缺陷,他們希望通過這一研究提高對少數族裔健康評估的準確性。針對同一個問題的研究同時也是近期很多業界公司研究和產品開發的重心。
模型結果表明,對于黑人和白人女性的預測效果都相當好。
之所以強調對黑人與白人女性的效果一樣好,是因為研究人員在開發過程中發現同類的人工智能模型存在大量偏差——因為它們對樣本的采集嚴重地傾向白人女性,黑人女性則很少。因此來自麻省理工的研究團隊仔細地設計了他們的模型,使得它對于兩種族裔的女性都能夠很好地作出預測。
基于風險評估的提前預測
麻省理工學院教授Regina Barzilay本人是一名乳腺癌幸存者,她表示希望這樣的系統能讓醫生在個人層面定制篩查和預防計劃,使得晚期診斷成為歷史。
所有性別都有患乳腺癌的風險,而大部分人通常認為只影響女性。自1989年第一個乳腺癌風險模型以來,研究者發展患乳腺癌的風險在很大程度上取決于人類的知識和對主要危險因素的直覺,如年齡、乳腺癌和卵巢癌的家族史、激素和生殖因素以及乳房密度。
然而,這些標志物中的大多數僅與乳腺癌微弱相關。因此,這些模型在個人層面上仍然不是很準確,并且鑒于這些限制,許多組織仍然認為基于風險的篩查計劃是不可能的。
另一方面,“自20世紀60年代以來,放射科醫生已經注意到女性在乳房X線照片上可以看到獨特且變化很大的乳房組織模式,”Lehma說?!斑@些模式可以代表遺傳,激素,懷孕,哺乳,飲食,體重減輕和體重增加的影響。我們現在可以在個人層面的風險評估中更準確地利用這些詳細信息?!?/p>
不同于已有的預測模型,麻省理工計算機與人工智能實驗室開發出的模型準確地將31%的癌癥患者置于風險最高的類別,而傳統模型僅為18%,可以至多提前五年預測乳腺癌細胞發展。
數據集來源
MIT / MGH團隊不是手動識別乳房X線照片中驅動未來癌癥的模式,而是訓練深度學習模型直接從數據中誘導模式。麻省理工開發的這一預測模型的開發基于超過六萬名來自麻省總醫院(Massachusetts General Hospital)的病人樣本,其中包括超過九萬份乳房X光檢查報告和病人們病情發展情況。
這一模型從這些數據出發,通過深度學習甚至能夠辨識出一些人類醫生都無法辨認出的病情。因為已有的關于乳腺癌的假設和風險因素都充其量是一個指導性的判斷框架,而麻省理工的這個模型并不是基于類似的框架,因此模型的準確性在預測性診斷和預篩查方面會更加準確。
總結與展望
總的來說,麻省理工計算機與人工智能實驗室的這一項目旨在協助醫生們為病人盡早選擇正確的治療方案,而不是像現在的大多數情況下一樣,在病人們的病情惡化甚至發展到晚期時才告訴他們這一殘酷的事實。
同時,最近在nature中也有報道,對于BRCA1和BRCA2基因的突變檢測也能更有效地開展乳腺癌的治療。
展望未來,來自麻省理工的團隊希望能夠用這一技術來提高其他類似疾病的預測準確性,如通過掃描腦部結構,可以對阿爾茨海默病和多發性硬化癥做預測,同理也可以對心血管疾病做預測。只要針對某種疾病的研究已經有成型的風險模型,這一技術就有可能大大提高對它預診斷的準確性。
-
麻省理工
+關注
關注
0文章
39瀏覽量
12307 -
人工智能
+關注
關注
1792文章
47442瀏覽量
239005
原文標題:乳腺癌預測模型只有白人女性數據,MIT剛剛把它擴展到了所有族裔
文章出處:【微信號:BigDataDigest,微信公眾號:大數據文摘】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論