【行业进展】AI:新药研发的新纪元
楊皓博
大學生,計算機視覺方向
作者 | 楊皓博(微信號Midlurker2017)
編輯 | 楊皓博
01
這個世界沒有藥神,但是有AI
口碑俱佳《我不是藥神》前段時間火熱上映,很多人懷著看喜劇的心情走進了電影院,結果卻心情復雜地擦干眼淚出來。電影給我們帶來了很多感動、深思,同時讓更多人眼球投向了醫療、制藥領域。
電影中呂受益想活著,聽孩子叫聲"爸爸"。
老奶奶想活著,三年把房子"吃"沒了。
依然記得那幾句話...
"這世界有一種病沒藥,就是窮病。"
"你能保證永遠不得病嗎?"
"他才二十歲"
"他只是想活著,犯了什么罪"
很多人觀影后認為藥廠定"天價藥物",錯在藥廠可他們不知藥廠每款成功的藥品的研發成本,包括之前失敗品,平均一款的上市需要十來年和幾十上百億,如此巨額的研發成本,只能專賣20年,銷售峰期不過六七年,藥廠不僅要收回成本,還要賺出下一款藥品的費用,藥價不高不行啊。斯坦福大學醫學院院長米納教授說過:“今天一款新藥從關于它的第一批最重要的論文發表,到藥品上市,大約需要20年的時間,在這過程中全部的科研投入至少為20億美元。”所以藥物價格昂貴怪不了藥企,加上醫療資源不平衡,這是中國醫藥行業普遍的問題。
這個世界上本沒有藥神,但是有AI
AI可能是降低藥品價格的合理途徑之一,新藥研發普遍存在著效率低下、時間密集、不斷試錯的創新過程,AI能為其帶來顯著改觀。這正是許多人工智能專家所強調的價值。
02
AI藥品研發技術
AI在靶點的發現
?
?
新藥研發的目標是找到可調控機體生物學功能的實體物質,如小分子、大分子或生物活體等。而實體物質的發現首先要精準的找到疾病相關的靶點[1],接著通過靶點進行藥物研發設計,然而傳統的新藥研發缺乏優質靶點,一旦出現一個獲得臨床驗證的新靶點,疊羅漢式的前仆后繼并不鮮見,研發成本也是瘋狂增加。在制藥界這般尷尬的境遇下,志在尋找新靶點的人工智能的出現,?綜合計算化學、物理學以及結構生物學的相關知識,進行有效的小分子(或者大分子)的篩選與設計,從這個角度人工智能的相關技術將大量應用于疾病的靶點預測、高通量數據的分析以及系統生物學的建模過程中。
如Revolutionizing Precision Oncology through Collaborative Proteogenomics and Data Sharing[2]這篇論文中就提出使用了高通量組學數據的分析技術以及人工智能的相關建模方法,來挖掘和分析腫瘤相關的突變位點。
Machine Learning Identifies Stemness Features Associated with Oncogenic Dedifferentiation[3]這篇論文中提出用機器學習的方法來評估致癌性去分化程度同時可以鑒定新靶點和相對可行的針對腫瘤分化的靶向療法。
大家感興趣可以看看上文中兩篇論文,里面詳細介紹了人工智能技術與復雜疾病靶點分析的方方面面研究。除了以上應用之外人工智能中自然語言處理技術(NLP)可以常見的即利用人工智能分析海量的文獻、專利和臨床結果,找出潛在的、被忽視的通路、蛋白和機制等與疾病的相關性,從而提出新的可供測試的假說,以期望發現新機制和新靶點。
小樣本數據挖掘
?
?
由于近年來深度學習對藥物研究領域也做出了巨大的貢獻,是因為深度學習這種layer-wise的學習模式,天然適合對圖像這種low-level feature的樣本進行表征學習。通過逐層的網絡學習,深度學習可自動學習圖像的High-level feature,一定程度上避免了人工進行特征工程(Feature Engineering)的繁瑣過程。如近年來發展的弱監督學習、小樣本學習(one/few-shot learning)乃至零樣本學習(zero-shot learning)也逐漸在藥物研發領域應用。
例如最近斯坦福大學的Vijay Pande教授嘗試用one-shot learning來進行low data drug discovery[4]
圖中為小分子編碼成一種適合于one-shot?prediction的形式的神經網絡。
文章中介紹了用于藥物發現的低數據學習的任務,并給出了一種學習此類模型的體系結構。
上圖為每個模型訓練的分數,報告的數字是均值和標準差。隨機度超過支持集的選擇,20個支持集重復實驗。附錄包含所有未執行的Sider任務的結果。 s.每一行中平均值最高的結果將被高亮顯示。表示法10/10?表示支持10個正面的例子和10個負面的例子。
Tox21.Tox21包括與人類毒性相關的12個核受體測定。文中訓練了Tox21數據集收集的模型,并對SIDER集合的預測精度進行了評估。請注意,這些集合大致不同, Tox21檢測結果進行核受體檢測,Sider測定真實患者的不良反應。
上圖為其余測定結果。在表6, 7和8中報告了每一個毒性檢測的結果。
再如Molecular de-novo design through deep reinforcement learning[5]將強化學習用于小分子生成設計
如圖是使用SVM分類器通過在Scikit-learn中建立在訓練集上作為DRD2活動的預測模型,來預測對生物靶標具有活性的分子。
在最近6月份The rise of deep learning in drug discovery[6]這篇論文當中詳細的介紹了當前深度學習在新藥研發的主要應用以及新藥研發未來發展,感興趣大家可以自行了解~這些論文當中主要是藥物研發領域面向小樣本進行的有益嘗試。
總的來說,人工智能在新藥研發當中有很大的前景其原因如下:(1)人工智能在藥物靶點的發現有巨大突破(2)小樣本學習的發展是人工智能發展的重要方向。
03
制藥公司對AI的應用
3.1羅氏基因泰克
?
?
羅氏基因泰克與醫療行業數據化分析公司GNS Healthcare達成協議,使用 GNS 的 AI 平臺分析已知療法在腫瘤學中的功效(主要利用貝葉斯概率推測腫瘤學中的療法功效)。GNS Healthcare能把大數據、機器學習和仿真技術結合起來判斷疾病預后效果,從而輔助醫療供應商進行市場決策。
3.2 強生
?
?
強生與英國AI技術開發和應用公司BenevolentAI達成新藥研發合作。其核心技術是一個叫做JACS (Judgment Augmented Cognition System,判斷加強認知系統)的人工智能系統。JACS在運算中從論文、臨床試驗中提取大量的數據,提取推動藥物研發的知識,提出新的可被驗證的假設,加速新藥研發。強生把一些尚處于試驗中的小分子化合物轉交給了BenevolentAI,進行新藥挖掘開發。
3.3?MSD
?
?
默沙東與美國的Atomwise合作共同構建AtomNet技術平臺,它每天使用大量的深度學習算法和超級計算機工具分析數百萬的潛在療法,從而加快藥物研發進程。主要針對的是新藥的有效性和安全性預測。
3.4 輝瑞
?
?
輝瑞通過IBM的Watson機器人來對大量的文本數據進行快速分析,使用大量實驗室數據、臨床報告,用來尋找潛在藥物,也就是上文中提到的使用NLP分析海量文本數據發現疾病靶點。此外,輝瑞也將VR技術帶入新藥研發領域,探索VR技術在藥物研發的可能性。
3.5 GSK
?
?
GSK與指導藥物研發的初創公司Exscientia在藥物研發達成戰略合作,Exscientia 通過AI藥物研發平臺為GSK的10個疾病靶點開發創新小分子藥物,并且針對這些靶點藥物發現臨床候選藥物。
04
總結
AI技術可應用于藥物研發的各個層面(這里特指靶點篩選,小分子篩選、設計、合成,成藥性評估等實驗驗證前階段。大分子藥物設計較為復雜,不在此次討論范疇),各個大型制藥公司也是積極使用AI應用于新藥研發。
參考文獻:
[1]https://en.wikipedia.org/wiki/Biological_target#Drug_targets
[2]Rodriguez H, Pennington S R. Revolutionizing Precision Oncology through Collaborative Proteogenomics and Data Sharing[J]. Cell, 2018, 173(3):535–539.
[3]Machine Learning Identifies Stemness Features Associated with Oncogenic Dedifferentiation
[4]Altaetran H, Ramsundar B, Pappu A S, et al. Low Data Drug Discovery with One-Shot Learning.[J]. Acs Central Science, 2017, 3(4):283.
[5]Olivecrona M, Blaschke T, Engkvist O, et al. Molecular de-novo design through deep reinforcement learning[J]. Journal of Cheminformatics, 2017, 9(1):48.
[6]Chen H, Engkvist O, Wang Y, et al. The rise of deep learning in drug discovery[J]. Drug Discovery Today, 2018.
更多,歡迎到知乎專欄去投稿與交流。
打一個小廣告,我的計算機視覺公開課《AI 圖像識別項目從入門到上線》上線了,將講述從零基礎到完成一個實際的項目到微信小程序上線的整個流程,歡迎交流捧場。
如果想加入我們,后臺留言吧
微信
Longlongtogo
公眾號內容
1 圖像基礎|2 深度學習|3 行業信息
往期開源框架
【開源框架】從Google百度到微博,優酷騰訊到抖音,這些爬蟲你用過了嗎?
[caffe解讀] caffe從數學公式到代碼實現4-認識caffe自帶的7大loss
【開源框架】一文道盡主流開源框架中的數據增強
往期綜述
【技術綜述】有三說GANs(上)
【技術綜述】深度學習自動構圖研究報告
為了壓榨CNN模型,這幾年大家都干了什么
往期學員分享
【技術綜述】人臉顏值研究綜述
【技術綜述】人臉年齡估計研究現狀
【技術綜述】計算機審美,學的怎么樣了?
總結
以上是生活随笔為你收集整理的【行业进展】AI:新药研发的新纪元的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 28岁以后,我不抱大腿,我就是大腿
- 下一篇: 【行业进展】国内自动驾驶发展的怎么样了?