【量子位节选摘抄】张亚勤:未来10年AI+生物制药大有可为,我们正开展破壁计划
1 前言
????????去年谷歌DeepMind推出的AlphaFold 2,無(wú)疑將當(dāng)下的AI技術(shù)與尚在探索的生物技術(shù)完美結(jié)合起來(lái)。
去年張亞勤從百度離開(kāi)加入清華大學(xué),成立清華智能產(chǎn)業(yè)研究院AIR。如今,短短一年,已有多名世界頂級(jí)科學(xué)家加盟AIR。
????????在MEET2022智能未來(lái)大會(huì)上,張亞勤透露清華智能產(chǎn)業(yè)研究院在進(jìn)行的重要科研項(xiàng)目之一,就是利用AI技術(shù)開(kāi)發(fā)抗體、研究DNA序列、預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)等等。
????????張亞勤認(rèn)為,AI在新冠疫苗的研發(fā)過(guò)程中發(fā)揮了重要作用,堪稱(chēng)AI在生命科學(xué)實(shí)際應(yīng)用中的重大事
2 演講要點(diǎn)
2.1 關(guān)于清華大學(xué)智能產(chǎn)業(yè)研究院(AIR)
????????清華大學(xué)智能產(chǎn)業(yè)研究院(AIR)使命是利用人工智能技術(shù)賦能產(chǎn)業(yè)升級(jí),推動(dòng)社會(huì)進(jìn)步。
AIR的戰(zhàn)略目標(biāo)有三個(gè):
-
首先要培養(yǎng)人才,主要是具有國(guó)際視野的頂級(jí)架構(gòu)師、未來(lái)的CTO;
-
第二是實(shí)現(xiàn)核心的技術(shù)突破;
-
第三是是希望AIR研發(fā)的技術(shù)能用到產(chǎn)業(yè),給產(chǎn)業(yè)帶來(lái)重大的影響。
????????我們選擇了三個(gè)方向作為突破點(diǎn):第一個(gè)是智慧交通,第二智慧物聯(lián)IoT,第三智慧醫(yī)療。重要的還是ABCD(AI、大數(shù)據(jù)、云計(jì)算、設(shè)備)四個(gè)橫向的技術(shù)領(lǐng)域作為基石。
2.2 AI帶來(lái)的生物數(shù)字化
-
我們首先是經(jīng)歷內(nèi)容數(shù)字化,后來(lái)到企業(yè)數(shù)字化,現(xiàn)在進(jìn)入物理世界的數(shù)字化,和生物世界的數(shù)字化。我們的身體、大腦、器官、細(xì)胞、蛋白質(zhì)和基因等都在數(shù)字化。
????????AI在極大加速生命健康和生物醫(yī)藥領(lǐng)域的快速發(fā)展。以新藥研發(fā)為例,目前要開(kāi)發(fā)一種新藥需要投入超過(guò)十幾年的周期,花費(fèi)數(shù)十億美元,周期很長(zhǎng)、費(fèi)用極高。這樣巨大的投入顯然會(huì)對(duì)醫(yī)藥行業(yè)帶來(lái)巨大瓶頸,AI正在改變這種狀況。
????????
- 首先在基因編輯方面,AI+CRISPR可以更精準(zhǔn),更快的找到靶點(diǎn)。
- 另外,在大分子、抗體,以及TCR個(gè)性化疫苗和藥物,還有最近AlphaFold在蛋白質(zhì)三維結(jié)構(gòu)解析方面的新進(jìn)展,從序列到到結(jié)構(gòu)功能,AI技術(shù)功不可沒(méi)。
? ? ? ? AIR最近在研究的課題之一,就是怎樣使高通量的生物實(shí)驗(yàn)自動(dòng)化,把干實(shí)驗(yàn)和濕實(shí)驗(yàn)無(wú)縫連接起來(lái),形成閉環(huán),真正地加速整個(gè)制藥和生命科學(xué)的發(fā)展。現(xiàn)在AI算法還是輔助,主要還是靠生物的濕實(shí)驗(yàn)。未來(lái)會(huì)有一種新的模式是AI驅(qū)動(dòng)的,完全自動(dòng)化所有環(huán)節(jié)的濕實(shí)驗(yàn),里面沒(méi)有任何人的參與,這個(gè)是比較困難的,也是一種新的嘗試。
????????在這點(diǎn)上一個(gè)非常形象的例子就是新冠疫苗的開(kāi)發(fā)周期大幅度縮減。中國(guó)科學(xué)家在新冠病毒出現(xiàn)之后的第一時(shí)間,2020年1月份就找到了病毒基因的序列,三個(gè)月之后,蛋白質(zhì)的結(jié)構(gòu)就被解析出來(lái)了,此后一個(gè)月,病毒和人的交互的方式也解析出來(lái)了,去年底疫苗進(jìn)入臨床實(shí)驗(yàn),今年開(kāi)始大規(guī)模使用,不管是滅活疫苗,還是mRNA疫苗,這可能是人類(lèi)歷史上最快的一次用人工智能加速疫苗開(kāi)發(fā)的例子。
?????????AIR彭健教授將遷移學(xué)習(xí)模型用做藥物臨床前的評(píng)估,和精準(zhǔn)臨床實(shí)驗(yàn)的設(shè)計(jì)。
????????我們知道人類(lèi)很多疾病樣本數(shù)據(jù)很少,但卻積累了很多動(dòng)物數(shù)據(jù),用動(dòng)物數(shù)據(jù)模型加上目前已有的人類(lèi)腫瘤細(xì)胞系上的藥物數(shù)據(jù),運(yùn)用可解釋型的機(jī)器學(xué)習(xí)能很快遷移到人體內(nèi)的藥效預(yù)測(cè)任務(wù)上。
????????從結(jié)果可以看到,彭健教授這種遷移學(xué)習(xí)方式對(duì)于三陰型乳腺癌患者設(shè)計(jì)的藥物醫(yī)藥可信度提高5倍左右。
????????彭健教授團(tuán)隊(duì)還把幾何深度學(xué)習(xí)用到AI抗體的開(kāi)發(fā)。???????
????????目前雖然蛋白質(zhì)序列大幅度被解析出來(lái)了,但是其本身的形狀幾何結(jié)構(gòu)還有很多的變化,他們想做的就是把蛋白質(zhì)表面的幾何表征用深度學(xué)習(xí)方法去表示出來(lái),然后做抗體親和力預(yù)測(cè)。?
????????彭健教授最近也取得了一些新的進(jìn)展,他創(chuàng)建的Helixon公司與清華大學(xué)醫(yī)學(xué)院一起合作研發(fā)出全球首個(gè)AI設(shè)計(jì)的新冠抗體,這其實(shí)是一種新范式。病毒本身是一直在變化的,但通過(guò)綜合分析抗體與抗原的相互作用,有效設(shè)計(jì)抗體可變區(qū)氨基酸序列,這樣的抗體本身也是相對(duì)比較穩(wěn)定,且對(duì)德?tīng)査柗ā①が數(shù)韧蛔冎昃哂懈咝Ш蛷V譜的病毒中和效果。
????????AIR蘭艷艷教授帶領(lǐng)的學(xué)生在基因測(cè)序方面做了很多新的工作,并在今年的創(chuàng)新工場(chǎng)Deecamp競(jìng)賽中獲得了冠軍。
????????我們已知基因10%是編碼的,90%是未編碼的,他們利用基因里的未編碼部分,將這些數(shù)據(jù)用前沿的預(yù)訓(xùn)練技術(shù)構(gòu)造了一個(gè)全新的模態(tài)。
2.3 AI和生物的壁壘
-
人工智能和生命科學(xué)方面盡管有很多可以合作的地方,但是也有很多壁壘,兩個(gè)行業(yè)是兩類(lèi)不同的語(yǔ)言體系,兩類(lèi)不同的科學(xué)家,很重要的是怎么樣能把這兩個(gè)行業(yè)無(wú)縫連接起來(lái)。
2.3.1 AI賦能生命健康
????????AI賦能生命健康領(lǐng)域包括三個(gè)層次:AI基礎(chǔ)設(shè)施建設(shè)、數(shù)據(jù)平臺(tái)搭建,以及AI算法引擎設(shè)計(jì)。
????????最好的人工智能賦能生命科學(xué)的例子就是蛋白質(zhì)預(yù)測(cè)模型AlphaFold2。AlphaFold2能夠成功滿(mǎn)足幾個(gè)條件:
-
第一點(diǎn),它是一個(gè)well-defined problem,從蛋白質(zhì)的氨基酸的序列到三維的結(jié)構(gòu)的mapping;
-
第二點(diǎn),30年前就開(kāi)始的CASP競(jìng)賽,每次競(jìng)賽有標(biāo)準(zhǔn)的數(shù)據(jù)集,每次解析出的蛋白質(zhì)序列,大家都可以公開(kāi)上傳;
-
第三點(diǎn),數(shù)據(jù)本身是well-structured,AI新算法可以直接使用。
3 總結(jié)
-
我們現(xiàn)在整個(gè)生物世界在走向數(shù)字化、自動(dòng)化,也包括智能的科學(xué)計(jì)算,像分子動(dòng)力學(xué),薛定諤方程等,都會(huì)和AI相輔相成。
????????這些進(jìn)展,我們整個(gè)生命科學(xué)的生物制藥會(huì)更加快速精準(zhǔn)、更安全、更經(jīng)濟(jì)、更加普惠。但很多的挑戰(zhàn)我們沒(méi)有講,比如算法的透明性、可解釋性、隱私安全、倫理等,這些事情都需要我們關(guān)注。我相信未來(lái)十年是整個(gè)生物制藥和人工智能融合的大好時(shí)機(jī),也是行業(yè)發(fā)展的最大的機(jī)遇
《新程序員》:云原生和全面數(shù)字化實(shí)踐50位技術(shù)專(zhuān)家共同創(chuàng)作,文字、視頻、音頻交互閱讀總結(jié)
以上是生活随笔為你收集整理的【量子位节选摘抄】张亚勤:未来10年AI+生物制药大有可为,我们正开展破壁计划的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: PYTORCH笔记 actor-crit
- 下一篇: python 笔记:csv 读写