計算生物學(xué)揭秘奧密克戎強感染性原因
以下文章來源于DeepTech深科技 ,作者LXS
編者按:2019年底開始的新冠疫情席卷全球,影響著我們每一個人。病毒的不斷變異使得抗疫變得愈加艱辛和漫長。如何預(yù)測病毒的變異和疫情的發(fā)展,甚至從根本上遏制病毒的傳播,這似乎已經(jīng)超出了傳統(tǒng)生物學(xué)的能力范圍。
對此,微軟亞洲研究院積極展開了一系列針對新冠病毒相關(guān)的研究,并取得了一定的階段性成果。就在近期,微軟亞洲研究院和清華大學(xué)生命科學(xué)學(xué)院及醫(yī)學(xué)院在奧密克戎變異株強傳染性的機理解釋方面又有了新的突破,相關(guān)成果已被生物學(xué)領(lǐng)域的頂級期刊《Cell Research》接收。想了解奧密克戎為什么感染性這么強么?讓我們在今天的文章中一探究竟。
也歡迎大家點擊下方視頻,了解新冠病毒的感染機理,探索AI新用法,看看AI如何為人類抗疫提供新的可能!本文轉(zhuǎn)載自公眾號“DeepTech深科技”。年來,微軟亞洲研究院在新冠病毒方面進行了一系列研究。
2021 年,微軟亞洲研究院與清華大學(xué)在《Advanced Theory and Simulations》上共同發(fā)表了封面文章《通過分子動力學(xué)模擬探索 SARS-CoV-2 刺突蛋白 NTD 的調(diào)控功能》(Exploring the Regulatory Function of the N-terminal Domain of SARS-CoV-2 Spike Protein Through Molecular Dynamics Simulation)[1]。
這是微軟亞洲研究院和清華大學(xué)生命科學(xué)學(xué)院龔海鵬教授團隊共同開展的一項計算生物學(xué)研究,主要通過分子動力學(xué)模擬、研究新冠病毒侵染人類機理中 N 端結(jié)構(gòu)域 NTD(N-Terminal Domain)的作用。
據(jù)了解,在新冠病毒表面有一層 S 蛋白,只有在被人體的受體蛋白 ACE 2 識別以后,病毒才能進入人體。兩者結(jié)合能力越強,就越容易造成感染。
S 蛋白的形態(tài)有點像字母“Y”,向下的一豎即 S2 區(qū)域嵌入在病毒表面,起到固定的作用。伸出來的兩個“枝丫”分別叫作 NTD 和 RBD(受體結(jié)合域,Receptor Binding Domain)。
圖1:新冠病毒 S 蛋白結(jié)構(gòu)(左圖為 S 蛋白三聚體結(jié)構(gòu),由三條鏈組成;右圖為 S 蛋白單體結(jié)構(gòu),由 NTD、RBD 以及 S2 組成)
在該研究之前,人們已經(jīng)通過實驗知道了 RBD 可以直接起到一個識別人體受體蛋白的作用,而 NTD 的具體作用還不十分清晰。
微軟亞洲研究院和龔海鵬教授實驗室合作搭建了一個有百萬個原子的穩(wěn)定模擬體系,在進行了數(shù)十億步(1 步是 1 飛秒,即一千萬億分之一秒)的分子動力學(xué)模擬之后,提出了一個“楔形”模型假說,簡單來說,可以把 NTD 看作是安插在了 RBD 和“Y”字底部的一個“楔子”。
研究發(fā)現(xiàn),RBD 有 down 和 up 兩種狀態(tài),只有 up 狀態(tài)才有可能與人的受體蛋白做識別。該項研究發(fā)現(xiàn),RBD 傾向于從 up 的狀態(tài)轉(zhuǎn)變?yōu)?down 的狀態(tài),而當(dāng) NTD 像楔子一樣塞入 RBD 下端時,阻止了 RBD 的這一傾向,即 NTD 使得 RBD 保持 up 狀態(tài),進一步讓其擁有了感染的能力。
可以說,NTD 在病毒的侵染過程中起到了一個調(diào)控作用,調(diào)節(jié) RBD 的形態(tài),從而改變了病毒感染人體的傾向。
圖2:NTD 在 SARS-CoV-2 的 S 蛋白構(gòu)象變化中發(fā)揮調(diào)控功能示意圖
由此可以預(yù)見,NTD 調(diào)控 RBD 的界面可能成為潛在的****物靶點。若能設(shè)計一個****物分子可以把 NTD 向外拉出,也就是把這個“楔子”拔出來,那 RBD 就傾向于 down 的狀態(tài),變成沒有感染能力的構(gòu)象,病毒感染人的能力就會減小很多。
“我們這項工作在世界范圍內(nèi)首次提出了 NTD 在病毒侵染過程中的調(diào)控模型。此外,我們根據(jù)這個潛在的****物靶點,設(shè)計了****物的虛擬篩選算法,并對新冠病毒的一些潛在性****物做了一定篩選,為新冠病毒****物研發(fā)提供了一定的參考價值?!蔽④泚喼扪芯吭褐鞴苎芯繂T王童說道。
近期,微軟亞洲研究院和清華大學(xué)生命科學(xué)學(xué)院王新泉教授和醫(yī)學(xué)院張林琦教授課題組開展合作,在奧密克戎變異株強傳染性的機理解釋方面有了新的突破,其成果已被生物學(xué)領(lǐng)域的頂級期刊《Cell Research》接收。
據(jù)了解,在此次合作中,王新泉教授課題組率先解析了奧密克戎高分辨率的晶體結(jié)構(gòu),為奧密克戎感染機理研究奠定了基礎(chǔ)。
相比于靜態(tài)的晶體結(jié)構(gòu),王童團隊利用分子動力學(xué)模擬從“動態(tài)視角”模擬和分析奧密克戎結(jié)構(gòu)變異及其侵染機理。
研究中,微軟亞洲研究院的研究員們首先構(gòu)建了兩個模擬體系,分別以原始的新冠病毒結(jié)構(gòu)和奧密克戎的結(jié)構(gòu)作為起始結(jié)構(gòu),對這兩個結(jié)構(gòu)平行地進行長時間、數(shù)億步的分子動力學(xué)模擬,模擬出的是原子級別的運動過程,從而觀察病毒在人體中的真實變化。
(來源:Pixabay)
“對分子運動進行模擬的方法可以分成兩種,經(jīng)典的分子動力學(xué)模擬和基于第一性的量子模擬,”王童說,“對于研究新冠病毒中蛋白大分子、大尺度的構(gòu)象變化運動,經(jīng)典動力學(xué)模擬方法是一種更適合的手段?!?br />
據(jù)王童介紹,經(jīng)典模擬適用于大體系,像蛋白質(zhì)成千上萬的原子,比如此次模擬體系就包含上百萬的原子。從時間上來說,經(jīng)典模擬做的都是數(shù)億到數(shù)十億步的模擬。相比之下,量子模擬相對準確,但計算過程的耗時使其只能適用于非常小的體系,比如對只有十余個原子的體系計算性質(zhì)或進行短暫的模擬。
構(gòu)建了模擬體系之后,微軟亞洲研究院利用自研算法,分析了原始新冠病毒和奧密克戎感染人體的能力,以及它們結(jié)構(gòu)上非常細微的差異。
值得注意的是,研究過程中產(chǎn)生的數(shù)據(jù)量極其龐大,整個模擬下來,至少有數(shù)億個結(jié)構(gòu),產(chǎn)生了數(shù)億到數(shù)十億幀的結(jié)構(gòu)變化。
為此,研究人員創(chuàng)造性地提出一種全新的馬爾科夫模型算法對數(shù)據(jù)進行分析。其對分子動力學(xué)模擬的數(shù)據(jù)分析有著更強的表征能力,可以更加真實地模擬出蛋白的動態(tài)變化過程。
在對海量的數(shù)據(jù)進行篩選和分析后,研究人員將數(shù)十億的結(jié)構(gòu)聚合成幾類代表性的結(jié)構(gòu),再去分析它們之間的區(qū)別和如何相互轉(zhuǎn)換,以及與人受體蛋白的結(jié)合能力,從而更好地理解奧密克戎感染的分子機理。
這些聚合出來的代表性構(gòu)象被稱為“亞狀態(tài)”,研究人員對其做了定性的結(jié)合自由能計算,以此在一定程度上反映病毒的感染能力。
具體來說,在研究中,聚類以后的奧密克戎和原始病毒都有三個亞狀態(tài)。由于奧密克戎本身只是原始病毒的變體,所以它們各自占比最高的一個亞態(tài),無論是從結(jié)構(gòu)上,還是和人的受體蛋白結(jié)合的能力上來說都是非常類似的。
由此可見,奧密克戎結(jié)構(gòu)的關(guān)鍵不同之處在其他兩個亞狀態(tài)上。相比原始病毒的兩個亞狀態(tài),奧密克戎的兩個亞狀態(tài)和人的受體蛋白ACE2有更多的相互作用,結(jié)合能力更強(結(jié)合自由能更低),因此可能導(dǎo)致了更強的感染能力。
同時研究還發(fā)現(xiàn),奧密克戎的三個亞狀態(tài)之間相互轉(zhuǎn)換非常快,很容易從類似于原始病毒的主亞狀態(tài),轉(zhuǎn)換成結(jié)合能力更強的另外兩個亞狀態(tài)。這也從動態(tài)視角解釋了為什么奧密克戎感染性這么強的一個原因。
圖3:分子動力學(xué)模擬揭示奧密克戎的狀態(tài)變化及感染機理(左圖為新冠病毒 S 蛋白,右圖為奧密克戎變異株的 S 蛋白,其中兩個體系的 State3 基本一致且為主要構(gòu)象,奧密克戎的另外兩個亞態(tài)結(jié)合自由能明顯高于新冠病毒的兩個亞態(tài))
在最新有關(guān)奧密克戎的研究工作中,王童表示,“這項研究在世界上首次使用‘干濕結(jié)合’的方式和動態(tài)視角,從結(jié)構(gòu)生物學(xué)和計算生物學(xué)兩個角度同時出發(fā),提出了奧密克戎感染性強的分子機理?!?br />
上面提到的“干濕結(jié)合”,也就是“干實驗”(計算實驗)和“濕實驗”(傳統(tǒng)科學(xué)實驗)的結(jié)合。
據(jù)了解,“干實驗”可以對“濕實驗”現(xiàn)有的一些結(jié)論做驗證和補充,還能做一些“濕實驗”做不了的或者是需要花很多時間、人力去做的研究。
比如,在奧密克戎的研究中,若在“濕實驗”實驗室里一個個去分析突變位點結(jié)構(gòu)的變化,可能需要數(shù)月時間,在疫情如此嚴峻的情況下,顯然不利于疫情防控工作。而使用計算的手段來模擬這種突變造成的影響,可能只需要一周到兩周的時間。
另外,“濕實驗”在前期很多時候都是探索性質(zhì)的,甚至在研究方向上是非常迷茫的。這時“干實驗”可以在一定程度上引導(dǎo)“濕實驗”的實驗設(shè)計,幫助其找到一個更容易成功的方法。
值得注意的是,兩者并不是互相取代,而是同等重要、相互指導(dǎo)、相輔相成的?!拔覀冊诤脱芯炕锇楹献鞯倪^程中就有這樣的感覺,我們認為‘干濕結(jié)合’會對整個科學(xué)研究起到一個螺旋式上升、波浪式前進的推動作用?!蓖跬f道。
微軟亞洲研究院主管研究員王童
他還補充說,在新冠病毒的研究方面,與清華大學(xué)多位老師的合作是一個非常好的起點。微軟亞洲研究院非常希望能和海內(nèi)外高校、科研院所的專家學(xué)者們有更多的深入合作和跨領(lǐng)域交流。
據(jù)了解,微軟亞洲研究院后續(xù)還會就新冠病毒為何在整個冠狀病毒進化過程中感染性如此強的原因方面開展相關(guān)研究。
最后,關(guān)于計算生物學(xué)等跨學(xué)科領(lǐng)域?qū)θ瞬诺囊蠛桶l(fā)展趨勢,王童也發(fā)表了自己的看法。
他認為跨學(xué)科發(fā)展主要是圍繞一個關(guān)鍵詞,就是“交叉”。交叉不是簡單的“加法”,而是“乘法”。兩個學(xué)科之間要發(fā)生一定的化學(xué)反應(yīng)和深度的融合。
拿計算生物學(xué)來說,其本質(zhì)上就是計算機科學(xué)與生物學(xué)的交叉,需要結(jié)合兩個領(lǐng)域的知識,并真正消化理解,才能在計算生物學(xué)領(lǐng)域產(chǎn)生真正的學(xué)術(shù)影響力,解決真正的科學(xué)問題。
而這也對人才的培養(yǎng)或者說對人才的需求,提出了一個更高的要求。如果研究人員只掌握某一方面的知識,對另一學(xué)科的認識不夠深入,只停留在簡單的工具使用層面,那么研究工作就只能浮于表面,也很容易造成計算參數(shù)設(shè)置有誤等問題,導(dǎo)致最終計算結(jié)果與實驗結(jié)果完全不一樣的情況。
未來,各學(xué)科之間的交叉融合一定會越來越多,在具體的科研工作中,不同背景的人才在合作交流過程中,需要更多傾聽對方領(lǐng)域的知識和訴求,只有建立在互信、開放心態(tài)的基礎(chǔ)上,才能推動跨學(xué)科間的研究持續(xù)向前發(fā)展。
參考:
1. Y. Li,T. Wang,J. Zhang,B. Shao,H. Gong,Y. Wang,X. He,S. Liu,T. Liu.Exploring the Regulatory Function of the N-terminal Domain of SARS-CoV-2 Spike Protein through Molecular Dynamics Simulation.Advanced Theory and Simulations 4(2021).
https://doi.org/10.1002/adts.202100152
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。