把你的免疫反應看作是一個巨大的機器學習問題,你的身體就是計算機。
免疫細胞在你的身體中移動,對它們接觸到的各種物質進行取樣,從你自己的細胞,到絕對不應該存在的有機體細胞。如果免疫細胞遇到的東西不應該是你身體的一部分——例如細菌或病毒——那么身體會出動哪些知道如何對付這些闖入者的細胞。
如果有細胞之前曾經見過這個入侵者,知道如何處理它的話,那么你的身體會迅速繁殖這個細胞數千次——多到足以讓它可以在有時間駐扎到你全身之前壓制住細菌或病毒。一旦入侵者被驅逐,免疫系統就會再次減少這些細胞的數量,保持足夠的儲備——萬一細菌卷土重來——有足夠的免疫步兵再次擊潰這些入侵者。
這個過程可以幫助你保持健康,也可能是讓醫生更早地發現患者疾病的關鍵——借助以云計算為動力的人工智能。
今年早些時候,微軟宣布與位于西雅圖的健康技術和基因測序公司Adaptive Biotechnologies達成合作,Adaptive Biotechnologies的基因測序儀目前用于檢測殘余骨髓瘤——也就是說,細胞會顯示已經接受血癌治療的人的細胞并非完全沒有這種疾病。
現在,該公司正在考慮的不僅僅是追蹤一種疾病,目標是確定檢測任何可能讓你免疫系統遭受重創的東西,從感染到癌癥,而且依靠微軟的機器學習功能來幫助它達到這一目標的。
人體免疫系統的功能非常強大,人體體內有二十億個淋巴細胞,其中稱為‘輔助’T細胞,其他是‘細胞毒素’或者‘殺傷性’T細胞。
每個T細胞都可以識別抗原——也就是免疫系統的觸發因素——這些抗原顯示進入人體的細菌、病毒、真菌或其他入侵者。每個T細胞可以結合數百種不同的抗原,每種抗原對于不同的細菌或病毒都是獨有的。
一旦T細胞受到打擊,(取決于T細胞的類型)它可能會殺死入侵者,或者向數百萬其他免疫細胞發出信號,讓這些細胞過來攻擊入侵者。當T細胞被激活時,對免疫系統進行快照,通過注意到哪些T細胞受體被激活以及哪些抗原與其結合,可以確定哪種疾病已經侵入了人體。而且,一旦確定了疾病,醫生就可以更清楚地知道如何進行治療。
Adaptive Biotechnologies成立于2009年,致力于讀取和掃描免疫系統和免疫細胞上的受體。隨著時間的推移,該公司不僅追蹤免疫受體,而且也開始研究受體與其結合的抗原之間的聯系。通過研究這種約束關系,Adaptive Biotechnologies開始朝著能夠診斷來自免疫受體的特定疾病的方向努力著。
但隨后,根據Adaptive Biotechnologies首席執行官、聯合創始人Chad Robins的說法,他們意識到“我們需要非常復雜的機器學習和計算能力才能真正解決問題——這是Web體量的一個大問題。”
微軟人工智能與研究副總裁PeterLee指出,每個人的基因組大約有200GB:“這僅僅是基因組數據——用于提取的元數據,以及來自成像、可穿戴設備、(與人口規模的基因組數據關聯的)患者縱向健康記錄的數據來源,是非常巨大的。信息內容遠遠超出了人類的理解,因此對人工智能和數據分析的需求確實變得至關重要。”
單個血液樣本通常會提取約一百萬個T細胞,這些T細胞中的每一個在基因上都是與特定抗原受體綁定的。將這些T細胞受體DNA序列的讀數翻譯成一組抗原,然后將這些抗原完美翻譯成疾病狀態。,是一個非常非常大的機器學習問題,”Lee補充說。
這時候就需要使用微軟的機器學習技術。微軟使用的算法是目前用于自然語言翻譯的算法。“這與我們在Bing搜索引擎中所謂的主題識別技術有一些相似之處,”Lee說。微軟使用AdaptiveBiotechnologies的MIRA系統生成訓練數據——這些訓練數據被用于創建從T細胞受體到抗原的“翻譯圖”,然后盡可能準確地將這些抗原映射回疾病。
這聽起來有點抽象,這種做法可能會帶來一些具體的好處:如果映射如Adaptive和微軟預想的那樣起作用了,那么這可能意味著患者在他們知道他們生病了之前就可能被診斷出患有疾病。例如,卵巢癌的癥狀非常隱蔽,直到晚期才會被發現。通過對患有基因突變(如BRCA1,會讓患者患卵巢癌的風險更高)的患者進行先發性檢測,這項檢測可以提取關于早期癌癥的指示性免疫信號。你越早發現疾病,治愈的可能性就越高。
Adaptive現在正在研究兩種“未滿足醫療需求的疾病,要么非常非常難以診斷以及/或者診斷需要治療干預,而這可能顯著影響對患者的護理,”Robins這樣表示。
Adaptive首先瞄準了一些疾病,一旦模型得到驗證,它希望使用相同的系統來累積越來越多的條件。“如果我們真的能夠從中得出診斷結果,那么隨后幾年我們就會在接下來的兩年、五年以及未來二十年繼續推進,”微軟的Lee說。
一旦一種疾病被破解,機器學習能夠是否可以更容易或更快地破解下一種疾病?
“讓我給你一個既樂觀又悲觀的答案。樂觀的是,隱藏層中的深層神經網絡天生地學習了一些關于免疫系統工作方式的隱藏結構,然后了解了6種、60種、100種甚至更多疾病之后的某個時候,你只是實現了這種能力的爆炸。”從某種程度上說,神經網絡可能僅僅能夠了解和解碼每種新疾病而不需要再訓練。
當然,存在一種悲觀的看法。“你也會碰壁。在某些時候,新增訓練數據的價值和新增計算能力的價值開始消失。有時候,我們會在機器翻譯等領域看到這一點:幾個月前,我們宣布我們在翻譯英文和普通話方面達到了人類的水平。我們獲得了90%的準確率,但為了獲得最后10%,我們需要2倍的計算能力和2倍的數據……目前我真的不知道我們在試圖將T細胞受體序列映射到抗原到疾病狀態方面處于什么樣的狀態,我們希望是前者,但也可能是后者,或者某種形式上兩者兼有。”
雖然沒有人知道這個悲觀或者樂觀的觀點是否正確,但Adaptive預計第一個單一疾病診斷測試將在三年的時間進行,更全面的多病篩查測試將在八到十年的時間。
“隨著我們開始分層次地進行[每項單一疾病測試],一個接一個地進行,在某個時刻,一次性完成所有操作的成本效益、易用性和效率能夠達到足夠的水平。這將成為一個生物系統的視圖,這就是我們將要努力的目標,”Robins說。
就像你會定期去醫生那里進行檢查,或者在你到一定歲數的時候被要求***癌或腸癌篩查,未來你可能會被要求進行一次抽血,經過分析告訴你要注意哪些疾病,甚至告訴你以前從來沒懷疑有過的癥狀。
Lee說,這個系統甚至有可能診斷出只有十億分之一可能性的癥狀,或者是一種全新的疾病。
“看起來我們將會發現那些我們還沒有弄清楚、不常見甚至是從沒見過的癥狀。這些觀察對于醫學研究和科學進步的價值問題是我們想知道的問題。這也是推動著我們針對那些剛開始生成、可能有助于科學發現的開放式探索。”
-
人工智能
+關注
關注
1791文章
47184瀏覽量
238266 -
機器學習
+關注
關注
66文章
8407瀏覽量
132567
原文標題:如何利用機器學習了解人體免疫系統?
文章出處:【微信號:gh_ecbcc3b6eabf,微信公眾號:人工智能和機器人研究院】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論