【Nature. Mach. Intell. 】基于Transformer的多肽-HLA I类结合预测和疫苗的新生抗原序列设计...
近日,國(guó)際知名期刊《Nature Machine Intelligence》在線發(fā)表了上海交通大學(xué)生命科學(xué)技術(shù)學(xué)院魏冬青團(tuán)隊(duì)的研究論文《A transformer-based model to predict peptide–HLA class I binding and optimize mutated peptides for vaccine design》。生命科學(xué)技術(shù)學(xué)院2017級(jí)博士研究生褚晏伊和香港大學(xué)深圳醫(yī)院的張艷博士為該論文的共同第一作者。生命科學(xué)技術(shù)學(xué)院魏冬青教授和熊毅副研究員為該論文的共同通訊作者。
人類白細(xì)胞抗原(HLA)和肽(pHLA)之間相互作用的計(jì)算預(yù)測(cè)可以加快表位篩選和疫苗。該研究開發(fā)了TransMut框架,包含了用于pHLA結(jié)合預(yù)測(cè)的TransPHLA和用于突變肽優(yōu)化的AOMP程序,它可以推廣到生物分子的任何結(jié)合和突變?nèi)蝿?wù)(圖1)。
TransPHLA設(shè)計(jì)了Transformer衍生模型來(lái)預(yù)測(cè)pHLA的結(jié)合。在pHLA結(jié)合預(yù)測(cè)、新抗原鑒定和HPV疫苗鑒定方面,TransPHLA均優(yōu)于現(xiàn)有的14種方法?;赥ransPHLA開發(fā)的AOMP程序可用于疫苗設(shè)計(jì),它可以自動(dòng)優(yōu)化突變肽,以搜索對(duì)目標(biāo)HLA具有更高親和力并與源肽具有高度同源性的突變肽。在3660個(gè)非結(jié)合pHLA中,有3630個(gè)源肽被成功突變。其中,94%通過(guò)IEDB的推薦方法得到驗(yàn)證,88%與源肽的同源性高于80%。
圖1.TransMut框架在webserver上的輸入和輸出
1.數(shù)據(jù)集
該研究包含112種HLA,肽長(zhǎng)度從8到14,共有366種HLA-肽長(zhǎng)度組合。詳情見圖2和圖3。
圖2.不同數(shù)據(jù)集中每個(gè)HLA相關(guān)的可結(jié)合的pHLA樣本數(shù)
圖3.不同數(shù)據(jù)集中肽長(zhǎng)度相關(guān)的可結(jié)合的pHLA樣本數(shù)
2.TransPHLA模型
TransPHLA的核心思想是自注意力機(jī)制的應(yīng)用。TransPHLA由以下四個(gè)模塊組成(圖4):首先使用embedding block將positional embedding添加到amino acid embedding中,以生成sequence embedding,然后應(yīng)用dropout技術(shù)來(lái)增強(qiáng)魯棒性。通過(guò)embedding block,TransPHLA分別生成肽和HLA的embedding。接下來(lái),這些embedding將分別作為Encoder block的輸入。Encoder block包含masked multi-head self-attention mechanism和feature optimization block。Feature optimization block是先上升后下降的全連接層的組合,這個(gè)模塊使得注意力機(jī)制得到的特征表示更好。然后,將輸出的肽和HLA的特征表示連接,作為pHLA的embedding。在pHLA的embedding通過(guò)encoder block后,使用projection block預(yù)測(cè)pHLA的結(jié)合分?jǐn)?shù)。
圖4.TransPHLA模型圖
論文鏈接:
https://www.nature.com/articles/s42256-022-00459-7
參考鏈接:
https://news.sjtu.edu.cn/jdzh/20220325/169006.html
總結(jié)
以上是生活随笔為你收集整理的【Nature. Mach. Intell. 】基于Transformer的多肽-HLA I类结合预测和疫苗的新生抗原序列设计...的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: [2020-07]百度广告搜索词获取最新
- 下一篇: 音视频OSD——修改叠加信息的位置