Cell | 深度突变学习预测SARS-CoV-2受体结合域组合突变对ACE2结合和抗体逃逸的影响...
本文介紹一篇來自于蘇黎世聯(lián)邦理工學(xué)院的Joseph M. Taft在Cell上發(fā)表的工作——《Deep Mutational Learning Predicts ACE2 Binding and Antibody Escape to Combinatorial Mutations in the SARS-CoV-2 Receptor Binding Domain》。
SARS-CoV-2的持續(xù)變異以及對(duì)疫苗和中和抗體產(chǎn)生耐藥性變種的出現(xiàn),有可能延長(zhǎng)COVID-19流行的時(shí)間。SARS-CoV-2變種的產(chǎn)生部分是由于病毒突刺蛋白,特別是ACE2,與受體結(jié)合域(RBD)的突變產(chǎn)生的。ACE2也是中和抗體的主要靶點(diǎn)。作者提出了一種基于機(jī)器學(xué)習(xí)的蛋白質(zhì)工程技術(shù)——深度突變學(xué)習(xí)(DML)。DML能對(duì)ACE2結(jié)合和抗體逃逸的影響做出準(zhǔn)確預(yù)測(cè),并且能查詢數(shù)十億RBD變體組合突變的大規(guī)模序列空間。高度多樣化的SARS-CoV-2變種已經(jīng)被確定來自多種進(jìn)化路線。DML可用于對(duì)當(dāng)前和未來變異的預(yù)測(cè)分析,包括高突變的變異,如奧密克戎(Omicron),從而指導(dǎo)COVID-19治療性抗體療法和疫苗的開發(fā)。
1.介紹
在2021年和2022年期間,具有較高傳播率和免疫逃逸(抗體逃逸)的SARS-CoV-2變種已經(jīng)取代了最初的原始株(Wu-hu-1)。這類變體通常在RBD中至少存在一個(gè)突變,會(huì)直接影響與ACE2的結(jié)合。例如,Alpha (B.1.1.7)、Beta(B.1.351)和Gamma (P.1)變異均具有N501Y突變,該突變與ACE2具有較高的親和力。
中和抗體,包括單克隆抗體療法和那些由疫苗誘導(dǎo)的抗體(原始的Wu-Hu-1刺突蛋白),通常與變體的結(jié)合活性和中和活性會(huì)降低。詳細(xì)的分子分析表明,許多SARS-CoV-2中和抗體具有相同的序列和結(jié)構(gòu)特征,這導(dǎo)致它們被分為四個(gè)由RBD靶向表位組定義的常見類別。第1類抗體包括以前臨床使用的REGN10933 (casirivimab)和LY-CoV16 (etesevimab)。K417位點(diǎn)突變的循環(huán)變異體(例如Beta、Gamma和Delta + (B.1.617.2 + K417N))以及水貂Y453F突變(Cluster 5)會(huì)降低這些1類抗體的中和作用。2類中和抗體包括臨床使用的LY-CoV555 (bamlanivimab)也會(huì)強(qiáng)烈抑制ACE2的結(jié)合。然而,具有RBD突變E484K/Q的Beta、Gamma、eta (B.1.525)、Kappa (B.1617.1)和iota (B1.526)等變體都會(huì)導(dǎo)致大大降低結(jié)合活性和中和活性。第3類抗體,包括臨床使用的REGN10987 (imdevimab)和S309 (sotrovimab),結(jié)合部分保守表位,并對(duì)幾種變體(如Alpha、Beta、Gamma)產(chǎn)生耐藥性。CR3022等第4類抗體針對(duì)sarbecovirus病毒中高度保守的表位,并且在很大程度上對(duì)逃逸變體具有抗性,但由于它們不直接抑制ACE2結(jié)合,因此通常缺乏中和作用。
Omicron的出現(xiàn)表明,變異可以進(jìn)化出嚴(yán)重的免疫逃避特性,例如逃脫結(jié)合到一系列不同RBD表位的幾種中和抗體。值得注意的是,幾乎所有臨床批準(zhǔn)的抗體療法都失去了對(duì)Omicron的實(shí)質(zhì)性中和活性(ba1 / B.1.1.529),包括Eli Lilly(LY-CoV16+LyCoV555)、Regeneron(REGN10933+REGN10987)和AstraZeneca (AZD8895+AZD1061)的多類抗體雞尾酒療法。所有這些后來都被美國(guó)FDA撤銷了臨床授權(quán)(Eli Lilly和Regeneron)或修改了劑量(Regeneron)。一個(gè)例外是S309,它最初是從感染SARS-CoV-1的患者的B細(xì)胞中分離出來的,對(duì)SARS-CoV-2具有交叉反應(yīng)性。S309降低了對(duì)Omicron的中和活性(ba1),但仍然有效的原因可能是它與在基因多變的sarbecovirus病毒中發(fā)現(xiàn)的一個(gè)高度保守的表位結(jié)合。然而,Omicron亞譜系ba2顯示S309大量逃逸,并在2022年初廣泛傳播,從而導(dǎo)致S309失去臨床授權(quán)。截至2022年8月,LY-CoV1404 (bebtelovimab)是唯一經(jīng)臨床批準(zhǔn)的抗體,該抗體與原始的Wu-Hu-1 RBD結(jié)合,對(duì)Omicron ba1和ba2變體和新興的ba4和ba5亞系都保持了很強(qiáng)的中和活性。
Bloom等人對(duì)SARS-CoV-2的整個(gè)201個(gè)氨基酸RBD進(jìn)行了酵母表面展示和深度突變掃描(DMS),以確定單位置替換對(duì)與ACE2結(jié)合和逃離單克隆抗體或血清抗體的影響。雖然DMS在RBD單突變分析方面非常有效,但之前的幾個(gè)循環(huán)變體(如Beta、Gamma和Delta)具有多個(gè)RBD突變,而Omicron及其亞系具有多達(dá)21個(gè)RBD突變(BA.1.12.1),因此迫切需要確定組合突變的影響。然而,隨著突變數(shù)量和氨基酸多樣性的增加,組合序列空間呈指數(shù)增長(zhǎng),迅速超過了實(shí)驗(yàn)篩選技術(shù)的能力。例如,當(dāng)只關(guān)注直接參與ACE2結(jié)合的20個(gè)RBD殘基中的一個(gè)子集時(shí),理論序列空間遠(yuǎn)遠(yuǎn)超過了酵母文庫(kù)所能篩選出的。
本研究中,作者通過集成RBD突變文庫(kù)的酵母展示篩選與深度測(cè)序和機(jī)器學(xué)習(xí)(圖1),建立了深度突變學(xué)習(xí)(DML)。使用DML全面查詢RBD組合突變及其對(duì)一組中和抗體中ACE2結(jié)合和逃逸的影響,包括臨床使用的治療方法和其他廣泛中和和有效的抗體。DML揭示了RBD突變高度多樣化的突變范圍,這些突變可以保持與ACE2的結(jié)合,同時(shí)避開許多不同類別的中和抗體。最后,DML能夠預(yù)測(cè)抗體對(duì)未來SARSCoV-2變異的穩(wěn)健性,可以用來評(píng)估和選擇最有臨床發(fā)展前途的抗體治療。
圖1 RBD深度突變學(xué)習(xí)預(yù)測(cè)ACE2結(jié)合和抗體逃逸綜述。RBD或SARS-CoV-2刺突蛋白在酵母表面表達(dá),突變文庫(kù)設(shè)計(jì)在RBD的受體結(jié)合基元上(RBM-3、RBM-1、RBM-2),這些位點(diǎn)與ACE2和中和抗體(如治療性抗體藥物)相互作用。通過FACS篩選與ACE2結(jié)合和中和抗體的RBD文庫(kù),分離出結(jié)合和非結(jié)合(逃逸)群體并進(jìn)行深度測(cè)序。訓(xùn)練機(jī)器學(xué)習(xí)模型,根據(jù)RBD序列預(yù)測(cè)ACE2或抗體的結(jié)合狀態(tài)。然后,使用機(jī)器學(xué)習(xí)模型預(yù)測(cè)ACE2結(jié)合和抗體逃逸在當(dāng)前和未來的變異和譜系。
2.結(jié)果
2.1 RBD突變文庫(kù)的設(shè)計(jì)與篩選
SARS-CoV-2 RBD突變文庫(kù)位于受體結(jié)合基序核心區(qū)域(RBM-3: 439-452位; RBM1: 453 - 478; RBM-2: 484-505)。這是與ACE2接口的RBD子區(qū)域,在此區(qū)域中病毒基因組測(cè)序數(shù)據(jù)中通??梢杂^察到突變。為了生成高突變序列空間的訓(xùn)練數(shù)據(jù)集,Starr等人此前發(fā)表了ACE2結(jié)合的DMS數(shù)據(jù),并設(shè)計(jì)了組合突變方案。對(duì)單個(gè)突變的適應(yīng)度值進(jìn)行了經(jīng)驗(yàn)閾值設(shè)置并將其轉(zhuǎn)化為氨基酸頻率,排除了低于ACE2結(jié)合適應(yīng)度閾值的突變。對(duì)于每個(gè)位點(diǎn),通過最小化均方誤差選擇接近所需氨基酸分布的退化密碼子(一些位點(diǎn)由于無法耐受突變和保留ACE2結(jié)合而保持固定),從而得到理論氨基酸多樣性為 (文庫(kù)3C)、 (文庫(kù)1C)和 (文庫(kù)2C)的RBM文庫(kù)(圖2A)。研究人員還設(shè)計(jì)了一個(gè)擴(kuò)展版的2C文庫(kù),在417位和439位具有完全退化密碼子(NNK),這些密碼子在許多循環(huán)變異體中發(fā)生突變,并與抗體逃逸相關(guān),得到的氨基酸理論多樣性為(文庫(kù)2CE)。為了生成較低突變序列空間的訓(xùn)練數(shù)據(jù)集,作者構(gòu)建了平鋪突變文庫(kù),將完全退化密碼子(NNK)平鋪在每個(gè)RBM的3個(gè)位置,理論氨基酸多樣性分別為 (文庫(kù)3T)、 (文庫(kù)1T)和 6(文庫(kù)2T)(圖2B)。
合成的寡核苷酸通過編碼不同文庫(kù),跨越感興趣的區(qū)域,使用PCR擴(kuò)增得到與RBD全序列同源的雙鏈DNA。將酵母(S. cerevisiae EBY100)與文庫(kù)編碼的DNA和線性化質(zhì)粒共同轉(zhuǎn)化,每個(gè)文庫(kù)獲得個(gè)以上的轉(zhuǎn)化子。RBD變體在酵母表面顯示為與Aga2的C端融合。它是基于結(jié)合可溶性人ACE2受體,通過熒光激活細(xì)胞分選(FACS)分離得到的(圖2C)。同時(shí)也會(huì)分離出與ACE2完全失去結(jié)合的RBD變體。重要的是,這并不包括僅部分降低結(jié)合的變體,因?yàn)檫@樣的中間種群由于不能指定結(jié)合或者不結(jié)合,不能用來訓(xùn)練監(jiān)督機(jī)器學(xué)習(xí)模型(圖2C)。對(duì)所有已排序文庫(kù)進(jìn)行RBD基因的深度靶向測(cè)序(Illumina),蛋白序列標(biāo)簽顯示,ACE2結(jié)合和非結(jié)合片段的氨基酸使用模式高度相似(圖2D)。
抗體包括臨床使用的治療性抗體(REGN10987、REGN10933、LY-CoV16、LY-CoV555、S309和LY-CoV1404),特殊的sabrecoay病毒的抗體(S2E12、S2H97和A23-58.1)和其他直接從COVID-19個(gè)體中分離的強(qiáng)效中和劑(G32A4、mAb-50、mAb-64和mAb-82)。每個(gè)抗體和文庫(kù)的結(jié)合和逃逸(非結(jié)合)的比例變化很大,例如RBM-2文庫(kù)REGN10933的逃逸突變比例很低,而LY-CoV555的逃逸突變比例很高(圖2E)。對(duì)所有已排序的RBD文庫(kù)的抗體結(jié)合部分和逃逸部分再次進(jìn)行深度測(cè)序,與ACE2相似,兩個(gè)部分的蛋白序列標(biāo)識(shí)看起來高度相似。
圖2 ?RBD突變文庫(kù)設(shè)計(jì),酵母表面展示篩選及深度測(cè)序。(A)顯示的是氨基酸在組合文庫(kù)(文庫(kù)3C, 1C, 2C)中的使用情況。退化密碼子來自于用于ACE2結(jié)合的DMS數(shù)據(jù) (B) 退化密碼子的代表性例子平鋪在RBM-2上,它們被匯集在一起組成庫(kù)2T。(C)流式細(xì)胞儀點(diǎn)圖顯示酵母顯示篩選組合(1C、2C、2CE、3C)和平鋪RBD文庫(kù)(1T、2T、3T)和對(duì)照RBD (Wu-Hu-1)。(D) RBD的氨基酸標(biāo)簽圖是基于ACE2結(jié)合和非結(jié)合選擇的深度測(cè)序數(shù)據(jù)。(E)流式細(xì)胞儀點(diǎn)圖描繪了酵母展示篩選ACE2結(jié)合的RBD庫(kù)(2C和2CE)的結(jié)果。
2.2 機(jī)器學(xué)習(xí)模型能夠準(zhǔn)確預(yù)測(cè)ACE2的結(jié)合和抗體逃逸
來自ACE2選擇的深度測(cè)序數(shù)據(jù)經(jīng)過預(yù)處理、質(zhì)量過濾和平衡步驟,形成最終的訓(xùn)練集。在核苷酸翻譯到蛋白質(zhì)后,氨基酸序列通過獨(dú)熱編碼轉(zhuǎn)換為輸入矩陣(圖3A)。使用機(jī)器學(xué)習(xí)模型對(duì)ACE2結(jié)合進(jìn)行分類,模型輸出為任何給定RBD序列與ACE2結(jié)合的概率P(較高的P與結(jié)合相關(guān))。使用來自RBM-2庫(kù)的數(shù)據(jù)訓(xùn)練了一系列基線模型,并使用準(zhǔn)確率、F1、精度、召回率進(jìn)行評(píng)估。測(cè)試的機(jī)器學(xué)習(xí)模型包括最近鄰KNN、邏輯回歸、樸素貝葉斯、支持向量機(jī)SVM和隨機(jī)森林RF、RNN。在RBM-2庫(kù)上訓(xùn)練的所有基線模型都有很好的性能(即準(zhǔn)確率在0.87 - 0.94之間)。由于RF和RNN模型具有較好的性能,訓(xùn)練速度較快,作者選擇它們進(jìn)行進(jìn)一步的優(yōu)化和應(yīng)用。
SARS-CoV-2通過一系列突變,包括Omicron等變體及其亞系,它們的RBD中產(chǎn)生了多個(gè)組合突變。因此,在不同的突變編輯距離(ED)中確定機(jī)器學(xué)習(xí)模型的性能很重要。最初,由單點(diǎn)突變(ED1)組成的DMS數(shù)據(jù)被用于訓(xùn)練基線模型,所得到的模型在ACE2結(jié)合預(yù)測(cè)方面表現(xiàn)出非常差的性能(即準(zhǔn)確率為0.50, AUC為0.56 - 0.65)。這可能是因?yàn)閱吸c(diǎn)突變?cè)谳^遠(yuǎn)的距離上不具有可加性,因此無法解釋組合突變的非線性影響,導(dǎo)致模型預(yù)測(cè)幾乎所有的組合逃逸變體都是ACE2結(jié)合劑。將數(shù)據(jù)分為低突變距離(≤ED5)和高突變距離(≥ED6)。作者發(fā)現(xiàn),當(dāng)只使用低距離庫(kù)(2T)訓(xùn)練模型時(shí),它們對(duì)高距離數(shù)據(jù)ACE2結(jié)合的預(yù)測(cè)性能非常差(準(zhǔn)確率<0.65,AUC <0.83)(圖3B)。然而,僅使用高距離(RBM-2C/CE)或聯(lián)合低距離和高距離庫(kù)(RBM-2 Full)訓(xùn)練的模型在所有距離上的表現(xiàn)都得到了極大的提高,低距離和高距離的準(zhǔn)確率分別為>0.94和>0.92,兩種模型的AUC均為>0.97(圖3B)。
與ACE2選擇類似,抗體選擇的深度測(cè)序數(shù)據(jù)經(jīng)過預(yù)處理、質(zhì)量過濾、平衡和編碼。使用監(jiān)督機(jī)器學(xué)習(xí)模型(RF和RNN)對(duì)抗體逃逸進(jìn)行分類,將抗體逃逸定義為給定RBD序列逃逸給定抗體的概率(低P值與逃逸相關(guān))。與之前一樣,作者表明,與只有低距離(RBM-2T)或只有高距離庫(kù)(RBM-2C/CE)的模型相比,同時(shí)使用低距離和高距離庫(kù)(RBM-2 Full)的模型能夠更好地預(yù)測(cè)對(duì)典型抗體(LY-CoV16)的逃避(圖3C)。幾乎所有抗體的RBM-2模型都顯示出很高的性能指標(biāo),只有LY-CoV555表現(xiàn)出較低的F1得分。機(jī)器學(xué)習(xí)訓(xùn)練和基準(zhǔn)測(cè)試表明,平衡的分類數(shù)據(jù)(結(jié)合和非結(jié)合/逃逸中的序列變體數(shù)量相似)是訓(xùn)練精確模型所需的。因此,LY-CoV555模型較低的性能可以通過其不平衡的分類數(shù)據(jù)來解釋(幾乎所有RBD變體都逃逸了LY-CoV555)(圖3D)。對(duì)于RBM-1庫(kù),大多數(shù)抗體在低ED時(shí)產(chǎn)生不平衡的分類數(shù)據(jù)(很少在≤ED5時(shí)產(chǎn)生逃逸變異體)。因此,RBM-1模型僅使用高距離數(shù)據(jù)(≥ED6)進(jìn)行訓(xùn)練,除了LY-CoV16、mAb-64和mAb-82這類數(shù)據(jù)不平衡的抗體(圖3E)以外,對(duì)大多數(shù)抗體都會(huì)產(chǎn)生好的效果。最后,對(duì)于RBM-3庫(kù),幾乎所有抗體的分類數(shù)據(jù)都是不平衡的,因此,未來將排除研究RBM-3機(jī)器學(xué)習(xí)模型。
圖3 訓(xùn)練和測(cè)試基于RBD序列預(yù)測(cè)ACE2結(jié)合和抗體逃逸的機(jī)器學(xué)習(xí)模型和深度學(xué)習(xí)模型。(A)來自ACE2和單克隆抗體(mAb)選擇的深度測(cè)序數(shù)據(jù)經(jīng)過獨(dú)熱編碼,用來訓(xùn)練監(jiān)督機(jī)器學(xué)習(xí)(RF)和深度學(xué)習(xí)模型(RNN)。模型根據(jù)RBD序列預(yù)測(cè)ACE2結(jié)合或不結(jié)合以及mAb結(jié)合或逃逸(不結(jié)合)的概率(P)來進(jìn)行分類。(B和C)在2T、2C或Full ACE2或LY-CoV16結(jié)合數(shù)據(jù)上訓(xùn)練的RF和RNN模型的性能,通過精度、F1和ROC曲線顯示。低距離序列和高距離序列分別定義為WuHu-1 RBD中≤ED5和≥ED6的序列。(D和E)在RBM-2和RBM-1數(shù)據(jù)上訓(xùn)練的13個(gè)mAb模型的準(zhǔn)確性、F1和AUC,在低距離和高距離測(cè)試序列上進(jìn)行評(píng)估。
2.3 合成譜系變體的預(yù)測(cè)分析
用計(jì)算機(jī)生成合成譜系可以模擬可信的進(jìn)化路徑,其中排除了每個(gè)突變步驟中沒有預(yù)測(cè)到ACE2結(jié)合中間體的RBD變體(圖4a)。重點(diǎn)分析了RBM-2區(qū)域和四種中和抗體(LY-CoV16、LY-CoV555、REGN10933、REGN10987)。當(dāng)RF和RNN模型均得出P > 0.5時(shí),預(yù)測(cè)給定的RBD序列與ACE2結(jié)合,否則預(yù)測(cè)它們是非結(jié)合劑。選擇46個(gè)合成譜系變體來體現(xiàn)ACE2結(jié)合預(yù)測(cè)的多樣性(圖5a)。此外,使用類似的模型方法對(duì)合成變體的四種治療性抗體的逃避進(jìn)行預(yù)測(cè)。在完成所有的機(jī)器學(xué)習(xí)預(yù)測(cè)后,將每個(gè)合成的RBD變體分別在酵母細(xì)胞表面展示,并評(píng)估ACE2結(jié)合和抗體逃逸情況。模型對(duì)ACE2結(jié)合的預(yù)測(cè)準(zhǔn)確率為91.67%,非結(jié)合預(yù)測(cè)準(zhǔn)確率為100%,總體預(yù)測(cè)準(zhǔn)確率為93.48% (圖4b)。對(duì)于33個(gè)正確預(yù)測(cè)的ACE2結(jié)合變異,4種治療性抗體的抗體逃逸預(yù)測(cè)的綜合準(zhǔn)確率為93.94% ?(圖4c)。AlphaFold2對(duì)8個(gè)合成RBD變體進(jìn)行了結(jié)構(gòu)預(yù)測(cè)(圖4d)。結(jié)果表明,幾個(gè)ACE2非結(jié)合變體與原始的Wu-Hu-1 RBD沒有本質(zhì)上的差異。相反,ACE2結(jié)合變體出現(xiàn)了廣泛的結(jié)構(gòu)構(gòu)象。
圖4 RBD變體合成譜系的預(yù)測(cè)與驗(yàn)證。(A)從Wu-Hu-1 RBD在選定的編輯距離(ED3, ED5和ED7)測(cè)試合成變體的工作流程。(B)合成變體的譜系圖描繪了基于機(jī)器學(xué)習(xí) 的ACE2結(jié)合與非結(jié)合的預(yù)測(cè)和驗(yàn)證 (C)合成變體的點(diǎn)圖對(duì)應(yīng)的是機(jī)器學(xué)習(xí)模型(RF和RNN)預(yù)測(cè)和抗體結(jié)合或逃逸的驗(yàn)證。(D) AlphaFold2的結(jié)構(gòu)建模顯示了預(yù)測(cè)的具有ACE2結(jié)合(綠色框)或非結(jié)合(紅色框)的RBD變體結(jié)構(gòu)。
2.4 預(yù)測(cè)當(dāng)前和未來變體的抗體逃逸
作者在RBM-2上使用機(jī)器學(xué)習(xí)模型預(yù)測(cè)ACE2結(jié)合譜系上的抗體逃逸 (圖5)。REGN10933和REGN10987對(duì)Wu-Hu-1、Alpha、Kappa的ED1譜系有很大的適應(yīng)性(圖5A-I)。而Beta和Gamma的ED1譜系幾乎完全不受LY-CoV555和LY-CoV16的影響。來自所有變體的ED2譜系中有很大一部分逃逸了REGN10933、LY-CoV555和LY-CoV16,并且隨著突變數(shù)量的增加,逃逸的可能性越來越大。值得注意的是,小部分的Beta ED2譜系預(yù)計(jì)會(huì)逃脫所有的四種治療性抗體。其中一些變體在417、484、493和501位點(diǎn)發(fā)生突變,這些位點(diǎn)都在Omicron變體中發(fā)生突變(圖5F)。為了進(jìn)一步可視化,作者構(gòu)建了深度逃逸網(wǎng)絡(luò)(圖5C, F, I),描述了四種治療性抗體對(duì)低距離突變的脆弱性。
圖5 選擇RBD變異的低突變距離抗體逃逸的預(yù)測(cè)分析(A, D和G) 。熱力圖描繪了單克隆抗體(mAb)結(jié)合,通過RF和RNN模型評(píng)估Alpha, Beta和Kappa的ED1和ED2變體。(B, E和H)對(duì)ED1和ED2轉(zhuǎn)義n個(gè)的序列數(shù)量(模型間一致,閾值>0.5)。(C, F和I)深度逃逸網(wǎng)絡(luò)顯示了變異及其逃離單克隆抗體之間可能的進(jìn)化路徑。
2.5 確定抗體對(duì)SARS-CoV-2突變譜系的穩(wěn)健性
在選擇用于治療的候選抗體時(shí),抗體對(duì)潛在的SARS-CoV-2變異的穩(wěn)健性(保持結(jié)合能力)可能是一個(gè)關(guān)鍵參數(shù)。為此,作者應(yīng)用DML來確定是否可以前瞻性地確定幾種中和抗體的穩(wěn)健性。最初,作者專注于與Omicron相對(duì)應(yīng)的合成譜系變體(圖6A)。作者測(cè)定了RBM-2中Omicron存在的特定單突變和組合突變的抗體逃逸。機(jī)器學(xué)習(xí)顯示,一些抗體,如LY-CoV16和LY-CoV555,預(yù)計(jì)可以保持與大多數(shù)單一變異體的結(jié)合,但幾乎失去與所有組合變異體的結(jié)合(圖6B),而其他抗體,如REGN10987和LY-CoV1404,預(yù)計(jì)可以與幾乎所有的單一變異體和組合變異體的結(jié)合。在此方法的基礎(chǔ)上,作者通過計(jì)算該位置的突變導(dǎo)致逃逸的平均百分比,探索了給定位置或位置組合中所有突變的影響。這使得作者能夠構(gòu)建動(dòng)態(tài)抗體逃逸譜系,并識(shí)別可能導(dǎo)致逃逸增加的突變序列的譜系。作者使用機(jī)器學(xué)習(xí)模型來預(yù)測(cè)RBM-2中的抗體結(jié)合和逃避高距離組合變異體(圖6D, E),揭示了幾種抗體的不同水平的魯棒性。
圖6 確定抗體對(duì)合成RBD變體和突變譜系的魯棒性。(A)組合文庫(kù)RBM-2的Omicron (BA.1)突變。(B)在Omicron中觀察到的單個(gè)和組合突變的結(jié)合預(yù)測(cè)。(C)沿著Omicron譜系的動(dòng)態(tài)逃逸剖面,從Wu-Hu-1距離1-4的所有突變的逃逸序列百分比。(D) Wu-Hu-1編輯距離為6-10中的每個(gè)抗體的ACE2結(jié)合RBD的抗體預(yù)測(cè)。
3.討論
在這項(xiàng)研究中,作者開發(fā)了DML,這是一種基于機(jī)器學(xué)習(xí)的蛋白質(zhì)工程方法,用來確定SARS-CoV-2 RBD組合突變對(duì)ACE2結(jié)合和抗體逃逸的影響。在DML中,機(jī)器學(xué)習(xí)模型對(duì)從文庫(kù)篩選出數(shù)千個(gè)標(biāo)記RBD變體進(jìn)行訓(xùn)練,可以對(duì)數(shù)十億個(gè)RBD變體的序列空間進(jìn)行非常準(zhǔn)確的預(yù)測(cè),這比僅通過實(shí)驗(yàn)篩選的預(yù)測(cè)要大幾個(gè)數(shù)量級(jí)。結(jié)合未來的文庫(kù)設(shè)計(jì)、基于不同結(jié)合閾值的更精密的篩選策略和改進(jìn)的機(jī)器學(xué)習(xí)模型,可以提高RBD較長(zhǎng)長(zhǎng)度的預(yù)測(cè)。作者的DML庫(kù)是基于原始的Wu-Hu-1 RBD序列,然而,全球幾乎所有的循環(huán)變體都是Omicron或其亞系。Bloom等人表明不同的RBD變異時(shí),單氨基酸突變(DMS)會(huì)導(dǎo)致突變軌跡的改變。考慮到Omicron變體中存在大量的突變,未來的DML研究應(yīng)使用基于Omicron的RBD序列的突變文庫(kù),但需要注意的是,未來可能還會(huì)出現(xiàn)其他高距離變體,這需要持續(xù)更新文庫(kù)設(shè)計(jì)。通過在一個(gè)大的突變范圍內(nèi)準(zhǔn)確預(yù)測(cè)抗體逃逸,DML可能使研究人員能夠選擇最具魯棒性的候選抗體療法。未來,除了中和活性,抗體對(duì)RBD組合突變的穩(wěn)健性將是評(píng)估COVID-19抗體治療開發(fā)的一個(gè)關(guān)鍵參數(shù)。最后,有證據(jù)表明,其他地方性冠狀病毒的受體結(jié)合域可能正在經(jīng)歷適應(yīng)性進(jìn)化,以逃避人類抗體反應(yīng)。因此,應(yīng)用DML來預(yù)測(cè)抗體逃逸,并結(jié)合病毒進(jìn)化的系統(tǒng)模型,可能有助于識(shí)別未來可能出現(xiàn)的變異,從而助力COVID-19疫苗的開發(fā)。
4.不足
為了建立DML,作者使用RBD上之前發(fā)布的DMS數(shù)據(jù),以提高與ACE2結(jié)合變體的概率。這對(duì)生成足夠的機(jī)器學(xué)習(xí)訓(xùn)練數(shù)據(jù)很重要,但會(huì)導(dǎo)致固定一些位置。單突變DMS數(shù)據(jù)表明,這些位置的突變會(huì)導(dǎo)致與ACE2完全失去結(jié)合。雖然這種方法在很大程度上有效地覆蓋了大多數(shù)SARS-CoV-2變體的突變序列空間,但它也存在一些局限性。因?yàn)樽髡叩奈膸?kù)設(shè)計(jì)中的一些固定位置在Omicron或其亞系中發(fā)生了突變。最顯著的是486位點(diǎn),該位點(diǎn)在Omicron BA.4和BA.5變體(F486V)中發(fā)生突變。此位點(diǎn)與抗體逃逸密切相關(guān)。因此,未來的DML突變庫(kù)設(shè)計(jì)將需要考慮上位性效應(yīng)的影響,而不應(yīng)該只依賴于單突變的DMS數(shù)據(jù)。此外,在構(gòu)建庫(kù)的過程中,作者將RBD分成三個(gè)不同的區(qū)域來構(gòu)建。這使得無法探究RBM位點(diǎn)突變的上位性效應(yīng)。
參考資料
Joseph M. Taft, Cédric R. Weber, Beichen Gao, Roy A. Ehling, Jiami Han, Lester Frei, Sean W. Metcalfe, Max Overath, Alexander Yermanos, William Kelton, Sai T. Reddy, Deep Mutational Learning Predicts ACE2 Binding and Antibody Escape to Combinatorial Mutations in the SARS-CoV-2 Receptor Binding Domain, Cell 2022, ISSN 0092-8674,?
https://doi.org/10.1016/j.cell.2022.08.024.
總結(jié)
以上是生活随笔為你收集整理的Cell | 深度突变学习预测SARS-CoV-2受体结合域组合突变对ACE2结合和抗体逃逸的影响...的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Shell编程(week4_day5)-
- 下一篇: ffmpeg输出x264的CBR流或者文