IgA腎病的長期預(yù)后風(fēng)險預(yù)測一直是醫(yī)學(xué)界的難題。近日,中國學(xué)者在腎臟病頂級期刊《美國腎臟病雜志》(AJKD) 上發(fā)表論文,介紹了如何利用AI技術(shù),改善對IgA腎病的長期預(yù)后風(fēng)險預(yù)測。這是全球第一篇發(fā)表在腎臟病頂級期刊上的AI疾病預(yù)測論文。
中國大約有1.2億慢性腎病(CKD)患者。其中有一種最常見的腎病,它的病因尚不完全清楚,且其遠期預(yù)后非常不理想。它就是 IgA 腎病(IgA nephropathy,IgAN),是全球范圍內(nèi)發(fā)病率最高的原發(fā)性腎小球疾病之一,在亞洲人群中發(fā)病率尤高。
IgA腎病的遠期預(yù)后不佳,10?25 年內(nèi) 30?40% 的患者會進入終末期腎病(腎衰竭)。終末期腎病患者通常需要進行透析或腎移植治療,人均治療花費10-15萬元/年,這給個人、家庭和社會帶來了沉重的負(fù)擔(dān)。因此,如何準(zhǔn)確地對IgA腎病患者的預(yù)后風(fēng)險進行預(yù)測,對于指導(dǎo)患者的個體化預(yù)防、治療和管理,以及相關(guān)臨床研究具有重要的意義。
近日,國家腎臟疾病臨床醫(yī)學(xué)研究中心(東部戰(zhàn)區(qū)總醫(yī)院)、平安醫(yī)療科技、IBM中國研究院聯(lián)合在腎臟病頂級期刊《美國腎臟病雜志》(AJ?D)上發(fā)表論文《IgA腎病的腎臟終點預(yù)測和風(fēng)險分層》,介紹了如何利用 AI 技術(shù),改善對IgA腎病的長期預(yù)后風(fēng)險預(yù)測。陳聽雨、李響、李映雪、夏爾玉、秦勇、梁少姍、徐峰、梁丹丹、曾彩虹、劉志紅等人是論文的貢獻者。
研究人員將 AI 算法與統(tǒng)計分析方法相結(jié)合,建立了一套精準(zhǔn)、可解釋、臨床實用的 IgA 腎病患者預(yù)后風(fēng)險預(yù)測系統(tǒng)。據(jù)悉,這是全球第一篇發(fā)表在腎臟病頂級期刊上的 AI 疾病預(yù)測論文。
長期隨訪患者數(shù)據(jù),機?學(xué)習(xí)方法構(gòu)建模型
既往研究發(fā)現(xiàn)影響 IgAN 預(yù)后的多項危險因素,包括基線尿蛋白 > 1g/d、高血壓、腎功能不全、高尿酸血癥、男性、嚴(yán)重病理評分等,并在此基礎(chǔ)上建立了多種預(yù)測 IgAN 預(yù)后的評分系統(tǒng),但這些評分系統(tǒng)受制于樣本量小,病理評分標(biāo)準(zhǔn)不一, 納入特征少以及評分臨床實用性欠佳等缺點。
本文致力于使用2047 例中國長期隨訪 IgAN 患者數(shù)據(jù),借助機?學(xué)習(xí)方法,建立結(jié)合臨床及腎臟病理的預(yù)后風(fēng)險預(yù)測模型及風(fēng)險分層系統(tǒng),使醫(yī)生可快速準(zhǔn)確地預(yù)估患者的腎臟預(yù)后風(fēng)險。
數(shù)據(jù)及實驗設(shè)計:
回顧性分析采用來自中國 18 個臨床中心的 1997 年 1 月~2010 年 6 月住院經(jīng)腎活檢確診為 IgAN 患者的臨床及隨訪資料。數(shù)據(jù)涵蓋了患者的人口學(xué)特征、生理指標(biāo)、病理指標(biāo)等36個變量。臨床結(jié)局定義為 “eGFR 較基線下降≥50% 或 終末期腎病(end-stage kidney disease, ESKD)” 。
根據(jù)以上研究對象及觀察指標(biāo)建立的預(yù)測模型,可以在患者活檢時預(yù)測以上臨床結(jié)局的風(fēng)險,預(yù)測時間窗口為活檢后 5 年。
AI融合統(tǒng)計模型,兼顧模型精準(zhǔn)度和實用性
XGBoost精準(zhǔn)預(yù)測:
本文首先使用XGBoost方法進行了建模。
目前為止,XGBoost 方法在中小型結(jié)構(gòu) / 表格數(shù)據(jù)上已取得了無數(shù)卓越的成績。其作為一種基于決策樹的集成機?學(xué)習(xí)算法,使用梯度上升框架,適用于分類回歸問題,速度快,效果好。
本文選取 XGBoost 作為預(yù)測模型,除了其精準(zhǔn)的預(yù)測能力外,還有一個更重要的原因,即 XGBoost自動處理缺失值的能力。缺失值在醫(yī)療數(shù)據(jù)中一直是個無法避免又棘手的問題。由于大部分機?學(xué)習(xí)模型都需要較多的變量作為輸入,在實際臨床應(yīng)用時很難將所需變量搜集完整。這一點阻撓了機?學(xué)習(xí)算法在臨床實踐中的廣泛應(yīng)用。XGBoost 方法自動學(xué)習(xí)缺失值的分類方向,從而擺脫了在實際應(yīng)用時缺失值造成的束縛。
本文輸出了重要性排名前十的變量(如下表)。在 NJIgAN?RSS 系統(tǒng)中,用戶可以根據(jù)實際情況填入這些變量的信息,獲取預(yù)測的風(fēng)險概率。
Stepwise Cox 簡化評分:
為了進一步增強系統(tǒng)在臨床實踐中的實用性,本文進一步構(gòu)建了無需借助計算機便能使用的打分模型。
Stepwise Cox 作為一種傳統(tǒng)的回歸分析模型,每個被選擇的變量都有一危險比(hazard ratio,HR),其統(tǒng)計學(xué)顯著性可用 p 值來評估,臨床解釋性能佳,故本文利用該方法建立簡化評分模型。
Stepwise Cox 在建模過程中自動進行特征選擇,但由于其采用的逐步遞歸特征選擇非常容易陷入局部最優(yōu)解,所以直接基于原始的 36 個變量進行建模所得到的模型效果并不理想。
本文基于了 XGBoost 給出的對于模型分類效果具有顯著作用的 10 個變量作為初始變量,在此基礎(chǔ)上進行Cox 回歸建模, 從一定程度上減小了局部最優(yōu)帶來的弊端。
本文通過 CHAID 方法進一步將 stepwise Cox 選出的變量進行離散化,將 Cox 回歸系數(shù)作為打分模型權(quán)重,得到了最后的打分模型。打分最終納入了 3 個變量:腎小管萎縮/間質(zhì)性纖維化比例(%) (基于牛津分型分為 T1;T2)、球性硬化比例>25%、尿蛋白>1g/d, 最終將患者 3 個變量對應(yīng)的得分相加,即得到患者的風(fēng)險分層評分(risk stratification score,RSS),進一步將 0?1 分為低危組,2 分為中危組,3?4 分為高危組。
模型評價結(jié)果
XGBoost 模型在訓(xùn)練集及驗證集上的 C?statistics 分別為 0.89、0.84。本文對比了 XGBoost 以及其他機?學(xué)習(xí)、統(tǒng)計方法的區(qū)分度性能,如下表。
簡化版評分模型在訓(xùn)練集上的 C?statistic為 0.81 (95% CI, 0.76?0.86),驗證集為 0.80 (95% CI, 0.75?0.84)。現(xiàn)有評分模型ARR 在本文訓(xùn)練集上的 C?statistic為 0.71 (95% CI, 0.65?0.77),驗證集為 0.74 (95% CI, 0.69? 0.78)。可見,本文所建立的評分模型與現(xiàn)有模型相比,在預(yù)測精準(zhǔn)度上具有顯著的提高。
模型一致性結(jié)果如下圖所示,Hosmer?Lemeshow 檢驗所得統(tǒng)計值 1.144,p?value=0.8,說明此模型一致性結(jié)果較高。
下圖展示了風(fēng)險得分為 0?4 分人群的 ?aplan? Meier 曲線(ES?D 及聯(lián)合結(jié)局)。Log?rank test 的結(jié)果(P < 0.001)說明發(fā)現(xiàn)利用本文的評分模型對 IgA 腎病病人的預(yù)后風(fēng)險進行了很好的分層。
結(jié)論
本文建立了 IgAN 患者的腎臟預(yù)后風(fēng)險預(yù)測系統(tǒng) NJIgAN?RSS,包含了精準(zhǔn)的 XGBoost 概率預(yù)測模型以及簡化版的 SSM打分模型,并對其進行了外部驗證。與現(xiàn)有的 ARR 模型相比取得了更加精準(zhǔn)的預(yù)測性能。該項研究推動了 AI 算法在疾病預(yù)測方面的應(yīng)用。
NJIgAN?RSS 系統(tǒng)已在網(wǎng)上公開發(fā)布(http://njszb. gdpcloud.com/),用戶輸入各項參數(shù)后,便可獲得患者五年內(nèi)的預(yù)后風(fēng)險概率以及風(fēng)險等級。
-
論文
+關(guān)注
關(guān)注
1文章
103瀏覽量
14956 -
ai技術(shù)
+關(guān)注
關(guān)注
1文章
1268瀏覽量
24289
原文標(biāo)題:中國學(xué)者頂級期刊發(fā)文:AI精準(zhǔn)預(yù)測腎病預(yù)后
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論