IBM 研究部主任達里奧吉爾表示,科學的緊迫性從未如此強烈。Gil 指的是為 Covid-19 開發疫苗的競賽,但他說,這種緊迫性并沒有消失,他引用了氣候變化、未來流行病、糧食短缺和能源安全等規模問題。解決這些問題所需要的是加快發現速度。
該解決方案將結合人工智能 (AI)、量子計算、高性能計算 (HPC) 和混合云技術。
達里奧吉爾(圖片:IBM)
“使用[這些技術],我們可以從根本上改變我們進行發現的過程,”吉爾說。“我們可以加速和增強傳統的科學方法。”
Gil 的例子是材料科學,它在歷史上一直依賴于偶然發現(想想鐵氟龍,它是在尋找新制冷劑時發現的。凡士林和石墨烯是類似的驚喜)。如果不是偶然發現的,有用的新材料通常是通過反復試驗發現的,即使使用最新的基于 HPC 的復雜分子建模和模擬,這也非常昂貴并且可能需要數年時間。
這就是人工智能的用武之地。
“[AI] 真正實現了前所未有的大規模速度和自動化水平,幫助我們解決越來越復雜的問題,”Gil 說。“正是人工智能可以幫助我們迎來這個加速發現的新時代。它可以幫助我們增強科學方法,將其從線性過程轉變為閉環。”
閉環 Gil 設想使用 AI 篩選現有知識庫,然后使用 HPC(或未來的量子計算)通過模擬增強數據并尋找該知識庫中的空白。這些信息被輸入到生成 AI 模型中,該模型可以建議候選新分子來填補空白。然后,人工智能驅動的機器人可以根據數據和過去化學反應的例子生成候選分子。
Gil 說:“這個過程將隨著新知識引發新問題而達到高潮,循環再次開始。” “所以這將是一個持續的發現循環,越來越自動化和越來越自主。”
Gil 將這個循環稱為“加速發現”,并強調這不是在遙遠的未來,而是現在肯定會發生的事情。
PAG 發現
Gil 演講中的另一個例子是基于加速發現更可持續的光刻膠材料。光刻膠對半導體制造過程至關重要;化學放大光刻膠使用稱為光酸產生劑 (PAG) 的化學物質。
使用傳統工藝,發現一個新的 PAG 可能需要 10 年時間,并且至少要花費 1000 萬美元。科學家們將搜索已發表的文獻,并利用他們能找到的東西以及他們自己的知識來設計一種分子并針對所需的特性。然后,他們將經歷合成、表征和測試的迭代循環,直到獲得令人滿意的化合物。即使有超級計算機可供使用,這個過程也是漫長而艱難的,尤其是因為要考慮大量的化合物。
加速發現已將該過程縮短到一年多 100 萬美元。
加速發現工作流程有四個階段。首先,一個名為 Deep Search 的人工智能會“讀取”所有現有的關于 PAG 的科學文獻。
“使用深度搜索通常會將該過程加快一千倍,因為 AI 可以在每個處理核心每秒攝取和處理大約 20 頁,”Gil 說。“另一方面,技術文獻的人類讀者通常每頁需要一到兩分鐘。”
該知識庫由已知 PAG 系列的樹狀圖表示(下圖的內部灰色部分)。樹狀圖中的空白區域代表數據丟失的地方。
第二步是通過 AI 驅動的模擬來豐富數據。另一個 AI 模擬已知 PAG 的實驗參數,比常規模擬快 2-40 倍。
“對于某些房產,可用數據非常稀疏或嘈雜且不可靠,幾乎沒有用,”吉爾說。“我們必須用足夠的預測屬性數據來擴充這個數據集,以訓練人工智能模型。在這里,我們使用 AI 豐富的模擬來為數據集中 PAG 的重要屬性提供定量值。”
這些特性包括毒性(上表中的紫色數據)、生物降解性(藍色)和 λ max,即材料吸收最強的光波長(綠色)。
這些信息被輸入第三種類型的人工智能,稱為生成模型。如今,生成式 AI 被用于為社交媒體檔案、與人類書寫的散文、計算機代碼和現在的分子無法區分的長論文文本生成虛假的檔案圖像。這個想法是有效地填補(灰色)樹狀圖中的空白。在 IBM 的案例中,他們希望尋找一種具有更好可持續性特性(尤其是生物降解性)的 PAG 材料。
“我們已經看到使用生成模型來識別差距并為測試創建材料概念的 10 倍加速,”Gil 說。
該過程的最后一步是在 AI 驅動的實驗室中測試結果,根據 Gil 的說法,該實驗室的合成速度比傳統方法快一百倍。
在這個階段有一些人為的參與;專家選擇最佳候選者進行實驗驗證,盡管產生現實生活中化學物質的化學合成是由機器完成的。在位于蘇黎世的 IBM RoboRXN 實驗室,人工智能、自動化和云技術的驚人組合已經學習了合成有機化學,并且可以通過機器人遠程應用它。
IBM 在 11 月使用這種加速發現過程發現了其第一個新的 PAG 材料。
“[新材料] 帶來了一個未來會有更多、更多加速發現的世界的希望,”吉爾說。
未來愿景
除了解決流行病和氣候變化等人類問題外,IBM 的愿景是加速發現將定義未來最具創新性的業務。以科學發現為核心業務的公司顯然會受益,包括生命科學、化學品和材料公司。當今大企業的另一大部分依賴于科學發現,包括汽車制造商、科技公司、醫療保健和公用事業。還有更多是由信息和發現驅動的,也就是說,他們通過數據實驗和學習獲得了競爭優勢。第三類是軟件、金融市場、媒體和娛樂、電信公司、銀行和零售)。加速科學和發現將影響所有這些業務。
三種類型的科學驅動型企業(圖片:IBM)
“我確信明天最具創新性的企業將是發現驅動型企業,”吉爾說。“他們將尋求平臺、工具和技術,使他們能夠加速發現過程,從而賦予他們競爭優勢。但這需要對科學和研發進行大量投資。”
吉爾再次提到了在 14 個月內開發的 Covid-19 疫苗。如果發現按照傳統方式進行,疫苗要到 2033 年才能上市。
“為了應對我們最大的挑戰,我們需要更快地發現,”他說。“我們需要釋放加速發現的力量,我們需要有目的地去做,不僅僅是數字產品和服務的數字創新,還要引導我們的數字能力來改善我們的物理世界。”
審核編輯 黃昊宇
-
AI
+關注
關注
87文章
30763瀏覽量
268914 -
先進技術
+關注
關注
0文章
24瀏覽量
6223
發布評論請先 登錄
相關推薦
評論