天壤成立于 2016 年,是一家專注于通用智能研究的創(chuàng)新企業(yè)。致力于打造復(fù)雜系統(tǒng)下的通用人工智能平臺(tái)。天壤 XLab 以創(chuàng)新的 AI 計(jì)算方式破解生命科學(xué)難題,希望為人類生命健康和疾病療法帶來(lái)革命性改變。目前圍繞蛋白質(zhì)結(jié)構(gòu)、功能、相互作用、突變及設(shè)計(jì)等核心問(wèn)題開發(fā)適用于生物計(jì)算的算法和平臺(tái)。
天壤以 AI 為驅(qū)動(dòng),推出的全新的蛋白質(zhì)設(shè)計(jì)平臺(tái) —— TRDesign。平臺(tái)采用全新的蛋白設(shè)計(jì)理念,突破之前蛋白質(zhì)設(shè)計(jì)方法計(jì)算復(fù)雜粗糙且需要主側(cè)鏈反復(fù)迭代更新的難題,根據(jù)目標(biāo)功能快速生成氨基酸序列。AI 通過(guò)大量學(xué)習(xí)蛋白質(zhì)序列與結(jié)構(gòu)的關(guān)系,能夠準(zhǔn)確探索出蛋白質(zhì)可折疊空間所有潛在的可能性。將在蛋白質(zhì)折疊中學(xué)到的序列-結(jié)構(gòu)-功能關(guān)聯(lián)反向映射,端到端地從頭進(jìn)行蛋白質(zhì)設(shè)計(jì)、檢測(cè)并進(jìn)行穩(wěn)定性、親和力優(yōu)化,以從頭設(shè)計(jì)的路線快速生成多肽、抗體、蛋白質(zhì)。
目前天壤正全力推動(dòng)特性更優(yōu)異的人工蛋白質(zhì)設(shè)計(jì)工藝和藥物開發(fā)流程。同時(shí),基于強(qiáng)化學(xué)習(xí)和自學(xué)習(xí)領(lǐng)域的見(jiàn)解,正結(jié)合實(shí)驗(yàn)自動(dòng)化,設(shè)計(jì)一個(gè)全智能化的濕實(shí)驗(yàn)平臺(tái) TRLab ——以 AI 為內(nèi)核、依靠實(shí)驗(yàn)數(shù)據(jù)的反饋來(lái)建立自我強(qiáng)化學(xué)習(xí)的實(shí)驗(yàn)體系,真正超越傳統(tǒng)化學(xué)和生物學(xué)方法,以規(guī)?;姆绞郊涌焯剿鞲哂袃r(jià)值的蛋白質(zhì)和落地轉(zhuǎn)化,應(yīng)用于生物醫(yī)學(xué)和化學(xué)、工業(yè)、農(nóng)業(yè)、食品、材料學(xué)、環(huán)境保護(hù)等眾多領(lǐng)域。
蛋白質(zhì)由 20 多種氨基酸以不同長(zhǎng)度排列組合組成,在幾微秒至幾毫秒內(nèi)迅速地折疊成一個(gè)特殊的三維結(jié)構(gòu),決定蛋白質(zhì)之間迥異的功能。自然界中已知的蛋白質(zhì)序列數(shù)據(jù)達(dá)數(shù)十億,要研究?jī)|級(jí)蛋白質(zhì)序列和百萬(wàn)級(jí)蛋白質(zhì)結(jié)構(gòu)與對(duì)應(yīng)功能,才能獲取蛋白質(zhì)折疊中序列-結(jié)構(gòu)-功能的高維數(shù)據(jù)關(guān)聯(lián)關(guān)系,這需要對(duì)大量蛋白質(zhì)序列數(shù)據(jù)進(jìn)行計(jì)算。
對(duì)于底層分子層面的微觀計(jì)算模擬,要實(shí)現(xiàn)高效預(yù)測(cè)和目標(biāo)功能的氨基酸序列的快速生成,需要探索蛋白質(zhì)可折疊空間的所有潛在可能性。對(duì)于提取開發(fā)共進(jìn)化信息、深入模擬蛋白質(zhì)之間的相互作用、構(gòu)建大規(guī)模相互作用圖網(wǎng)絡(luò)、靶點(diǎn)發(fā)現(xiàn)、突變蛋白質(zhì)結(jié)構(gòu)模擬、抗體模擬等研究工作,需要更好的模擬計(jì)算策略及更高性能的計(jì)算基礎(chǔ)設(shè)置來(lái)支撐,極具挑戰(zhàn)。
天壤通過(guò)借助NVIDIA A100 Tensor Core GPU、NVIDIA RTX 3090 GPU加速平臺(tái),利用深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、高性能計(jì)算三大工具,解決了超大復(fù)雜生物模型計(jì)算中的高緯數(shù)據(jù)的分析問(wèn)題,使模型兼具微觀尺度的精度和宏觀尺度的效率。利用 AI 研究了億級(jí)的蛋白質(zhì)序列和百萬(wàn)級(jí)的蛋白質(zhì)結(jié)構(gòu)與對(duì)應(yīng)功能,建立了序列-結(jié)構(gòu)-功能間的深層關(guān)聯(lián),并成功將一維序列映射到三維結(jié)構(gòu),進(jìn)而將這種高維關(guān)聯(lián)進(jìn)行普適性應(yīng)用,快速生成具有特定功能的蛋白質(zhì)。
使用 NVIDIA 解決方案后,極大地提升了天壤在生物計(jì)算當(dāng)中運(yùn)用深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)等多種機(jī)器學(xué)習(xí)算法根據(jù)目標(biāo)功能蛋白研究進(jìn)行模型設(shè)計(jì)、訓(xùn)練等過(guò)程的迭代和優(yōu)化效率,降低基于 AI 的蛋白質(zhì)研究、檢驗(yàn)的計(jì)算閉環(huán)成本。
近年來(lái) AI 計(jì)算對(duì)長(zhǎng)期存在的基礎(chǔ)科學(xué)問(wèn)題的解決上做出了很大貢獻(xiàn),特別是生物計(jì)算在復(fù)雜系統(tǒng)高緯關(guān)聯(lián)信息挖掘與生命系統(tǒng)設(shè)計(jì)方面呈現(xiàn)的巨大優(yōu)勢(shì)。傳統(tǒng)的蛋白質(zhì)結(jié)構(gòu)解析及蛋白質(zhì)設(shè)計(jì)等復(fù)雜工程都需要生物科學(xué)家、研究員在實(shí)驗(yàn)室進(jìn)行,有儀器造價(jià)高、耗時(shí)長(zhǎng)、實(shí)驗(yàn)流程復(fù)雜等困難。而運(yùn)用 AI 技術(shù)的生物計(jì)算,通過(guò)對(duì)海量生物數(shù)據(jù)信息的分析,模型設(shè)計(jì)和優(yōu)化,使高通量、準(zhǔn)確的蛋白質(zhì)結(jié)構(gòu)信息的獲取成為現(xiàn)實(shí),大幅加速蛋白質(zhì)工程設(shè)計(jì)。
“天壤是NVIDIA 初創(chuàng)加速計(jì)劃(NVIDIA Inception)成員企業(yè)。在 AI 技術(shù)賦能生物科技領(lǐng)域, NVIDIA GPU 對(duì)整個(gè)流程的加速提供了強(qiáng)大的基礎(chǔ)架構(gòu)。在訓(xùn)練環(huán)節(jié),天壤能夠通過(guò)模型設(shè)計(jì)、數(shù)據(jù)蒸餾、數(shù)據(jù)增強(qiáng)等手段來(lái)調(diào)整和優(yōu)化模型,突破已解析蛋白質(zhì)結(jié)構(gòu)有限的數(shù)據(jù)掣肘。在基于人體細(xì)胞內(nèi)微環(huán)境分子層面的多組學(xué)分析和蛋白設(shè)計(jì)環(huán)節(jié),得益于 NVIDIA GPU 先進(jìn)計(jì)算框架的支撐和穩(wěn)定安全的算力服務(wù)保障?!?天壤 XLab 實(shí)驗(yàn)室負(fù)責(zé)人苗洪江博士表示。
“生命科學(xué)爆發(fā)的時(shí)代才剛剛到來(lái),目前 NVIDIA 也在加速構(gòu)建基因組學(xué)、藥物研發(fā)等項(xiàng)目,提高數(shù)據(jù)分析和處理效率,提供計(jì)算能力強(qiáng)勁的 AI 平臺(tái)和行業(yè)解決方案。我們希望通過(guò) NVIDIA Inception 計(jì)劃,推動(dòng)以 AI 蛋白質(zhì)設(shè)計(jì)能力為核心、干濕實(shí)驗(yàn)閉環(huán)能力支撐的規(guī)范化流程,加快探索具有高價(jià)值的蛋白質(zhì)?!?/p>
原文標(biāo)題:NVIDIA A100 加速 AI 全流程,助力天壤打造 AI 主導(dǎo)的蛋白質(zhì)設(shè)計(jì)平臺(tái) TRDESIGN
文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
審核編輯:湯梓紅
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5025瀏覽量
103266 -
AI
+關(guān)注
關(guān)注
87文章
31155瀏覽量
269488 -
人工智能
+關(guān)注
關(guān)注
1792文章
47442瀏覽量
239005 -
蛋白質(zhì)
+關(guān)注
關(guān)注
0文章
25瀏覽量
7995
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論