蛋白質(zhì)是維持生命所必需的結(jié)構(gòu)復(fù)雜的生物大分子,人體內(nèi)幾乎所有的功能如肌肉收縮、呼吸,或?qū)⑹澄镛D(zhuǎn)化為能量等,都與蛋白質(zhì)之間的相互作用密切相關(guān)。而獲得蛋白質(zhì)三維結(jié)構(gòu),則有助于科學(xué)家了解它在人體內(nèi)的作用,并設(shè)計(jì)相應(yīng)的藥物。
近日,人工智能公司DeepMind宣布,其用AlphaFold預(yù)測(cè)了六種由新冠病毒基因編碼的蛋白質(zhì)的三維結(jié)構(gòu),包括膜蛋白、非結(jié)構(gòu)蛋白等,而且已經(jīng)開放下載。
獲悉病毒蛋白質(zhì)結(jié)構(gòu) 有助于研發(fā)針對(duì)性藥物
病毒由核酸和蛋白質(zhì)組成,而蛋白質(zhì)是由病毒基因組編碼的。病毒蛋白質(zhì)有兩種,一種是結(jié)構(gòu)蛋白,它們可以構(gòu)成一個(gè)形態(tài)成熟的有感染性的病毒顆粒,幫助病毒侵染細(xì)胞,例如殼體蛋白、膜糖蛋白和存在于病毒顆粒中的酶等;另一種是非結(jié)構(gòu)蛋白,則幫助病毒在宿主細(xì)胞里復(fù)制、基因表達(dá),擴(kuò)大在人體內(nèi)的“領(lǐng)地”。
早在1月10日,中國(guó)公布新冠病毒全基因組序列。但僅僅知道基因組序列,并不能充分了解蛋白質(zhì)是如何工作的。
“蛋白質(zhì)的成分包括20種氨基酸,每個(gè)蛋白質(zhì)由幾十到上千個(gè)氨基酸組成。部分氨基酸的線性序列會(huì)形成螺旋或者折疊狀的二級(jí)結(jié)構(gòu),并進(jìn)一步有序組合堆積成三維結(jié)構(gòu),這種三維結(jié)構(gòu)決定了蛋白質(zhì)在人體內(nèi)如何發(fā)揮作用。”中國(guó)藥科大學(xué)藥學(xué)院教授肖易倍接受科技日?qǐng)?bào)記者采訪時(shí),打了個(gè)比方,如果說人體的病毒受體是鎖,病毒的刺突糖蛋白就是鑰匙,如果這些鑰匙能插進(jìn)人體病毒受體蛋白,就會(huì)侵染細(xì)胞,科學(xué)家要做的,就是弄清楚鑰匙內(nèi)的三維結(jié)構(gòu)是什么、鑰匙和鎖的關(guān)系是什么,進(jìn)而阻止鑰匙去開鎖,即阻止病毒侵染細(xì)胞。
“知道了蛋白質(zhì)如何發(fā)揮功能,就知道如何有針對(duì)性地抑制病毒活性,如果發(fā)現(xiàn)某個(gè)蛋白是入侵宿主細(xì)胞的關(guān)鍵蛋白,就可以針對(duì)這個(gè)蛋白或者蛋白的某個(gè)區(qū)域做藥物設(shè)計(jì)。”南京大學(xué)生命科學(xué)學(xué)院教授、博導(dǎo)董咸池說。
預(yù)測(cè)結(jié)果即使準(zhǔn)確 實(shí)驗(yàn)過程仍不可回避
在DeepMind團(tuán)隊(duì)看來,可根據(jù)氨基酸序列確定蛋白質(zhì)的三維結(jié)構(gòu)。他們基于深度神經(jīng)網(wǎng)絡(luò),通過預(yù)測(cè)蛋白質(zhì)中每對(duì)氨基酸之間的距離,以及連接這些氨基酸的化學(xué)鍵之間的角度,使用兩種方法,來構(gòu)建預(yù)測(cè)模型。
“第一步是在結(jié)構(gòu)生物學(xué)常用的技術(shù)上,訓(xùn)練神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)蛋白質(zhì)中每對(duì)氨基酸之間的距離或角度,然后不斷組合這些概率,提高蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)的準(zhǔn)確度;第二步是通過梯度下降來優(yōu)化得分。他們預(yù)測(cè)的是整個(gè)蛋白質(zhì)鏈,而不是蛋白質(zhì)結(jié)構(gòu)組裝之前的蛋白質(zhì)‘碎片’,因此一定程度上降低了整個(gè)預(yù)測(cè)過程的復(fù)雜性。”湖南大學(xué)超算中心副主任、教授彭紹亮告訴科技日?qǐng)?bào)記者,AlphaFold從頭開始對(duì)蛋白質(zhì)的形態(tài)結(jié)構(gòu)進(jìn)行建模,而沒有使用已經(jīng)解析的蛋白質(zhì)作為模板,這意味著需要超大的計(jì)算量。
而據(jù)清華大學(xué)自動(dòng)化系生物信息學(xué)副教授汪小我介紹,在目前國(guó)際的蛋白質(zhì)數(shù)據(jù)庫(kù)(PDB)中,有大約3萬種已知的蛋白質(zhì)結(jié)構(gòu),利用其中與目標(biāo)序列具有相似性的蛋白質(zhì)序列,可以為蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)提供支持。
在人工智能深度學(xué)習(xí)之外,科學(xué)家們想要獲取蛋白質(zhì)結(jié)構(gòu),目前大多從核磁共振、冷凍電鏡與X射線衍射技術(shù)中尋求答案。
“三種方法都依賴大型設(shè)施、儀器,實(shí)驗(yàn)手段獲得的蛋白質(zhì)結(jié)構(gòu),通俗地說就是給蛋白質(zhì)多角度拍照片,然后根據(jù)海量二維照片重構(gòu)三維結(jié)構(gòu),結(jié)果客觀精確,但是實(shí)驗(yàn)周期比較長(zhǎng),通常需要幾個(gè)月,實(shí)驗(yàn)門檻和實(shí)驗(yàn)成本高,實(shí)驗(yàn)難度也不小。”彭紹亮說。
此次AlphaFold對(duì)新冠病毒蛋白質(zhì)結(jié)構(gòu)的預(yù)測(cè),是脫離于實(shí)驗(yàn)之外的結(jié)構(gòu)重構(gòu)。預(yù)測(cè)的準(zhǔn)確性,尚需同行評(píng)審,以及實(shí)際臨床治療的驗(yàn)證。不過,DeepMind指出,“模型會(huì)指出結(jié)構(gòu)的哪些部分更有可能是正確的,雖然這些未被研究的蛋白質(zhì)不是當(dāng)前治療的重點(diǎn),但它們可能會(huì)增加研究人員對(duì)新冠病毒的理解”。
而對(duì)于AlphaFold的預(yù)測(cè)結(jié)果,彭紹亮認(rèn)為,如果預(yù)測(cè)結(jié)果準(zhǔn)確,還要進(jìn)行分子對(duì)接、分子動(dòng)力學(xué)模擬等很多計(jì)算分析過程,以及動(dòng)物實(shí)驗(yàn)、人體臨床試驗(yàn)的驗(yàn)證。“計(jì)算可以不斷被加速,但實(shí)驗(yàn)過程是不可回避的,而最終的一切都是以能做出臨床可用的藥物和疫苗為目標(biāo)。”
-
AI
+關(guān)注
關(guān)注
87文章
30759瀏覽量
268903 -
DeepMind
+關(guān)注
關(guān)注
0文章
130瀏覽量
10850
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論