文|動脈網(wǎng)
7月12日,英偉達(dá)宣布向Recursion投資5000萬美元,以加速人工智能藥物發(fā)現(xiàn)領(lǐng)域的突破性基礎(chǔ)模型。此舉引發(fā)了業(yè)內(nèi)的廣泛關(guān)注,和二級市場相關(guān)標(biāo)的股價的暴漲。
實際上,英偉達(dá)布局AI制藥的節(jié)奏,是稍顯遲疑的。早在2018年,英偉達(dá)推出專門針對醫(yī)療場景的Clara平臺。隨后,Clara從影像學(xué)AI研究工具逐步拓展邊界,開始涉足基因組學(xué)。Clara平臺很快成為新藥研發(fā)中的高效工具,它可以用于藥物設(shè)計,通過不同AI生成分子,來完成蛋白質(zhì)生成、分子生成與對接等任務(wù),甚至可以預(yù)測蛋白質(zhì)和分子的三維相互作用,從而優(yōu)化藥物在體內(nèi)的作用方式。
到2023年3月,英偉達(dá)已經(jīng)與包括新藥研發(fā)在內(nèi)的全球100多家企業(yè)就Clara模型合作。但投向Recursion的5000萬美元,卻是英偉達(dá)在全球AI制藥領(lǐng)域的第一筆直接投資。這家成立于2013年的老牌AI制藥企業(yè),主要運用細(xì)胞的纖維圖像特征來進(jìn)行藥物篩選,底層邏輯與一眾同行相差很大。
Recurison的特點在于,通過干濕實驗閉環(huán)高通量地并行多個試驗。首先,在實驗室里通過各種方式使人體細(xì)胞生病,拍攝這些生病的細(xì)胞。然后,讓機器學(xué)習(xí)程序來學(xué)習(xí)這些生病細(xì)胞與健康細(xì)胞的區(qū)別。最后,將各種藥物作用于患病細(xì)胞,通過機器學(xué)習(xí)程序來判斷細(xì)胞是否回歸健康狀態(tài),從而判斷藥物的作用效果。
在Recurison的AI制藥流程中,細(xì)胞層面的基礎(chǔ)研究是關(guān)鍵一環(huán)。這背后,是一種從復(fù)雜的生命現(xiàn)象本質(zhì)出發(fā)去尋找靶點、開發(fā)藥物的邏輯。在傳統(tǒng)用藥物研發(fā)數(shù)據(jù)訓(xùn)練的AI制藥模型稍顯疲態(tài)的當(dāng)下,將AI制藥的鏈條再延長,正在成為一種新的思路。
消失的DSP-1181與跑不動的AI新藥
2022年夏天剛到,在資本市場聚光燈下狂奔不到2年后,AI制藥迎來首度降溫。除了大范圍趨冷的外部環(huán)境外,被寄予厚望的超級明星產(chǎn)品高調(diào)進(jìn)入臨床試驗階段,卻迅速遭遇滑鐵盧,踩下了AI制藥發(fā)展的一腳急剎車。
2022年7月,由于臨床試驗I期不符合預(yù)期標(biāo)準(zhǔn),住友制藥宣布停止DSP-1181的開發(fā)。隨即,DSP1181從Exscientia、住友制藥的官方網(wǎng)站上雙雙消失。自此,開發(fā)世界上首個由AI設(shè)計的藥物分子的嘗試,以失敗告終。
早在2014年,Exscientia的自動生成化合物的技術(shù),和基于知識的人工智能預(yù)測模型,令住友制藥十分青睞,雙方隨即達(dá)成合作。住友制藥成為全球最早與AI公司展開合作的制藥公司之一。在此后的多年間,住友制藥和Exscientia共同發(fā)力,最終選定開發(fā)用于治療精神疾病的單胺G蛋白偶聯(lián)受體(GPCR)藥物。
合作中,住友制藥的化學(xué)團隊合成Exscientia提出的化合物,藥理學(xué)團隊對這些化合物進(jìn)行評估,兩家公司一起共享活性數(shù)據(jù),繼續(xù)改進(jìn)藥物?;贓xscientia的AI算法模型,雙方在不到1年的時間里測試合成了多達(dá)350種化合物,DSP-1181是項目啟動以來合成的第350種化合物。彼時,行業(yè)內(nèi)完成這項工作的平均耗時超過5年。
此外,雙方還在在項目過程中合成類似物。住友制藥的化學(xué)家同步合成了Exscientia提出的化合物中間體,還設(shè)計和合成了一些具有假定藥理學(xué)數(shù)據(jù)的化合物,并將這些數(shù)據(jù)輸入Exscientia的預(yù)測模型。其中包括為優(yōu)化化合物結(jié)構(gòu)提供重要構(gòu)效關(guān)系的化合物,這進(jìn)一步加快了藥物發(fā)現(xiàn)周期,并使公司在短時間內(nèi)發(fā)現(xiàn)DSP-1181。
2020年初,Exscientia高調(diào)宣布,其與日本住友制藥合作開發(fā)的DSP-1181,進(jìn)入I期臨床試驗。DSP-1181啟動臨床試驗之初,住友制藥非常興奮,忍不住夸贊Exscientia采用的創(chuàng)新方法將對中樞神經(jīng)系統(tǒng)藥物做出巨大貢獻(xiàn)。
對于DSP-1181的失敗終局,有研究者指出,根本原因在于藥物分子本身不夠創(chuàng)新。
美國化學(xué)文摘社(CAS)的托德·威爾斯(Todd Wills),曾對DSP-1181進(jìn)行了詳細(xì)分析,發(fā)現(xiàn)DSP-1181作用的受體,是抗精神病藥物非常重要的經(jīng)典靶點。換言之,DSP-1181的開發(fā),其實并沒有偏離最初的靶點。而在對DSP-1181的專利系統(tǒng)研究后,Wills發(fā)現(xiàn),DSP-1181分子與氟哌啶醇非常相似,后者是FDA在1967年批準(zhǔn)的典型抗精神病藥物。從這個意義上講,Exscientia很可能在一個長期發(fā)現(xiàn)的分子骨架上進(jìn)行優(yōu)化。
DSP-1181的失敗,給AI制藥的高光時刻蒙上了陰影,卻也給這個行業(yè)帶來關(guān)鍵的轉(zhuǎn)折。在那以后,人們談及AI制藥,除了算法、數(shù)據(jù)之外,也逐步偏重實驗室里的開創(chuàng)新研究。
走過了早期技術(shù)、數(shù)據(jù)積累階段的迷茫,對于如今的AI制藥而言,構(gòu)建一支臨床試驗管線,并不太不稀奇。據(jù)智藥局統(tǒng)計,由冰洲石生物、銳格醫(yī)藥、英矽智能、紅云生物等國內(nèi)AI制藥企業(yè)開發(fā)的新藥管線,紛紛進(jìn)入臨床試驗階段。6月末,英矽智能更是在全球率先完成了AI藥物INS018_055在II期臨床試驗的首位患者給藥。
真正難的是,如何將臨床試驗推進(jìn)下去,許多AI藥物被卡在I期臨床試驗。另據(jù)智藥局統(tǒng)計,在全球80條獲批臨床的AI藥物管線中,只有29條研發(fā)管線推進(jìn)到臨床試驗Ⅱ期,沒有AI藥物管線進(jìn)入了更后期的階段。
蒙眼狂奔10年后,AI制藥開始有點跑不動。除了倒在I期臨床試驗的DSP-1181外,此前不久,另一家英國AI制藥頭部企業(yè)Benevolent AI也宣布,一款用于治療特應(yīng)性皮炎的候選藥物在二期臨床試驗中未能達(dá)到次要療效終點。而大刀闊斧做AI新藥的英矽智能,在談及II期臨床試驗時,表現(xiàn)得極為慎重。
奮力的單點突破
盡管已經(jīng)幾起幾落,對于AI制藥,行業(yè)內(nèi)卻尚形成沒有明確的定義。人們把利用機器學(xué)習(xí)、深度學(xué)習(xí)、自然語言處理、知識圖譜等人工智能(AI)技術(shù)來進(jìn)行藥物化學(xué)分子分析、靶點發(fā)現(xiàn)、化合物篩選,甚至臨床試驗研究等新藥研發(fā)相關(guān)工作的嘗試,即為AI制藥。
在很多場合,AI制藥被視為提升新藥研發(fā)效率的終極解決方案。但脫離了嚴(yán)格制藥邏輯的AI技術(shù),是以一種相互割裂的方式,在單點突破新藥研發(fā)中的核心環(huán)節(jié)。
具體而言,在上一階段的探索中,AI制藥被用來完成發(fā)現(xiàn)新靶點、篩選化合物這兩件極繁瑣,卻極重要的工作。
一方面,人們希望依托AI制藥強大的計算、分析能力,來發(fā)現(xiàn)充分挖掘難成藥靶點的潛能,繞開同質(zhì)化的紅海競爭。數(shù)據(jù)統(tǒng)計,在人類蛋白質(zhì)組中,難成藥靶點占了75%以上,一半以上的人類疾病,在臨床上尚無藥可醫(yī)。而對于被驗證有效的靶點,比如PD-1、GLP-1等,則往往短期內(nèi)涌入數(shù)百家藥企,爭相開發(fā)。
至今,AI制藥已經(jīng)被用來替代常規(guī)新藥研發(fā)中的許多環(huán)節(jié)。比如靶點確認(rèn),這是藥物開發(fā)中的關(guān)鍵步驟,也是最復(fù)雜的步驟之一。現(xiàn)階段,被用于新藥研發(fā)的大多數(shù)靶點是蛋白質(zhì)。在基于AI的靶點發(fā)現(xiàn)中,研究者首先從蛋白質(zhì)的序列、結(jié)構(gòu)、功能中提取原始特征,隨后通過機器學(xué)習(xí)的方法,構(gòu)建準(zhǔn)確、穩(wěn)定的蛋白質(zhì)模型,最后用這一模型進(jìn)行靶點功能的推斷、預(yù)測和分類。這已經(jīng)成為AI靶點研究的重要手段。
除了結(jié)構(gòu)學(xué)數(shù)據(jù)外,從患者的樣本中、海量的生物醫(yī)學(xué)資料中提取基因組學(xué)、蛋白質(zhì)組學(xué)、代謝組學(xué)等多組學(xué)數(shù)據(jù),借助深度學(xué)習(xí)來分析非疾病和疾病狀態(tài)之間的差異,也可用來發(fā)現(xiàn)對疾病有影響的蛋白質(zhì)。
另一方面,AI技術(shù)可能簡化藥物篩選、合成,降低成本。對于篩選出來得化合物,往往還需要進(jìn)行溶解度、活性/選擇性、毒性、代謝、藥代動力/藥效以及可合成性等維度條件。這將涉及反復(fù)多次的實驗過程,費時費力,抬高臨床前研究成本。而這種高度重復(fù)、涉及大量計算的工作,正是計算機程序所擅長。
在這個過程中,AI技術(shù)用來實現(xiàn)分子生成,即讓機器學(xué)習(xí)的方法來產(chǎn)生新的小分子。具體而言,AI可以通過對海量的化合物或者藥物分子的學(xué)習(xí),獲得化合物分子結(jié)構(gòu)和成藥性方面的規(guī)律,進(jìn)而根據(jù)這些規(guī)律生成很多自然界從未存在過的化合物作為候選藥物分子,有效構(gòu)建擁有一定規(guī)模且高質(zhì)量的分子庫。
此外,AI技術(shù)還被用來完成化學(xué)反應(yīng)設(shè)計和化合物篩選。目前,AI正在取得進(jìn)展的化學(xué)領(lǐng)域之一是對化學(xué)反應(yīng)和合成路線進(jìn)行建模和預(yù)測?;贏I技術(shù),將分子結(jié)構(gòu)映射為可以由機器學(xué)習(xí)算法處理的形式,根據(jù)已知化合物的結(jié)構(gòu),形成多條合成路線,并推薦最佳合成路線。反過來,在給定反應(yīng)物的情況下,深度學(xué)習(xí)、遷移學(xué)習(xí)可以預(yù)測化學(xué)反應(yīng)結(jié)果。AI技術(shù)甚至還可用來探索新的化學(xué)反應(yīng)。在化合物篩選中,AI技術(shù)被用來對化合物的化學(xué)結(jié)構(gòu)與生物活性之間的關(guān)系進(jìn)行建模,預(yù)測化合物的作用機制。
可以說,在每一個獨立的節(jié)點上,AI制藥都已經(jīng)做到很出色。但這種出色,很難延續(xù)到計算機軟件之外。除了跑不動的臨床試驗,AI制藥在藥企內(nèi)部頗受詬病,已經(jīng)是公開的現(xiàn)象。在動脈網(wǎng)的訪談中,被AI制藥工程師吐槽分子活性低、制作周期長,被藥物化學(xué)專家嫌棄技術(shù)平臺操作困難,幾乎成了很多AI制藥企業(yè)躲不開的宿命。
回過頭看,AI制藥與藥企之間形成鴻溝,一個不可忽視的原因在于,前者追求效率,通過壓縮開發(fā)時間來驗證自身價值,而后者則強調(diào)品質(zhì),要經(jīng)過反復(fù)論證,來選定好的標(biāo)的,再推進(jìn)。從某種意義上講,AI制藥走的是直線,奮力向前跑,而新藥研發(fā)的過程則更像一個閉環(huán),可以推翻、再重來。
而AI制藥的切實落地,或許需要停下單點突破的嘗試,轉(zhuǎn)而融入新藥研發(fā)的閉環(huán)思路。
回歸做藥的真規(guī)則
“越來越多的藥企在搭建自動化的實驗室,”一位投資人告訴動脈網(wǎng),“在藥物發(fā)現(xiàn)、化學(xué)合成等環(huán)節(jié)引入AI技術(shù),幾乎成為創(chuàng)新藥企業(yè)的標(biāo)配?!备袕臉I(yè)者表示,如果自動化的智能實驗室提升新藥研發(fā)效率的功能被驗證,將引發(fā)大藥企的新一輪基建高潮。
動脈網(wǎng)整理公開數(shù)據(jù)發(fā)現(xiàn),過去2年間,AI制藥企業(yè)紛紛斥資建設(shè)自動化實驗室,Exscientia、Relay therapeutics、Instro、BenevolentAI、晶泰科技、英矽智能等領(lǐng)先的AI制藥企業(yè)相繼構(gòu)建了干濕閉環(huán)的實驗室環(huán)境,而輝瑞、阿斯利康、禮來等跨國藥企也紛紛為基于AI技術(shù)的藥物研發(fā)自動化實驗室買單。
比如,在位于瑞典哥德堡的AstraZeneca iLab,阿斯利康探索構(gòu)建全自動藥物化學(xué)實驗室,將新藥研發(fā)的設(shè)計、制造、測試、分析(DMTA)閉環(huán)與AI新藥研發(fā)企業(yè)Molecular AI的技術(shù)平臺無縫集成。其中,AI技術(shù)主要完成DMTA閉環(huán)中的設(shè)計、分析環(huán)節(jié),利用AI和機器學(xué)習(xí),來幫助化學(xué)家更快地做出更好的決策,實現(xiàn)化學(xué)家與計算機的有效交互,從而加快化學(xué)空間的探索和潛在新藥分子的設(shè)計。
再如,輝瑞則與晶泰科技合作,利用“AI預(yù)測+實驗驗證”方法來加速新藥研發(fā),后者在上海建立了自動化實驗室。
“藥物的開發(fā)是一個多維同步優(yōu)化的過程,”有從業(yè)者向動脈網(wǎng)表示,新藥研發(fā)的數(shù)據(jù)規(guī)模極大,類型、結(jié)構(gòu)也頗為復(fù)雜,構(gòu)建干濕實驗室閉環(huán),可以更高效地完成設(shè)計、驗證的虛幻。
一方面,藥企形成了更體系化的數(shù)據(jù)管理方式。傳統(tǒng)的藥物研發(fā),即以實驗科學(xué)為主。在過往的新藥研發(fā)中,數(shù)據(jù)的記錄、治理和儲存方式,都以實驗為核心,需要根據(jù)實驗需求動態(tài)調(diào)整。換言之,數(shù)據(jù)只是實驗的副產(chǎn)品。而AI作為虛擬科學(xué)、計算科學(xué)和數(shù)據(jù)科學(xué)范疇內(nèi)的方法,數(shù)據(jù)的重要性不言而喻。這就要求,藥企在藥物研發(fā)中,嚴(yán)格規(guī)范數(shù)據(jù)的格式、標(biāo)準(zhǔn)、質(zhì)量、數(shù)量等。
另一方面,AI制藥企業(yè)的算法模型也得以針對性地優(yōu)化,而不是簡單地調(diào)用。AI與制藥這一傳統(tǒng)行業(yè)的核心業(yè)務(wù)深度融合,強調(diào)深刻的行業(yè)理解力和更高的技術(shù)準(zhǔn)確率。除了從大量的存量論文、實驗數(shù)據(jù)中挖掘新知識,還要具備充分發(fā)掘提煉實時實驗數(shù)據(jù)的能力,并根據(jù)數(shù)據(jù)反饋,優(yōu)化模型、迭代算法。
“除了算法模型、數(shù)據(jù),AI制藥越來越多關(guān)注生物學(xué)層面的問題?!绷硪晃粡臉I(yè)者指出。誠然,單純依靠實驗本身,只能驗證成形的假設(shè),而AI制藥面對的,卻是一個更加復(fù)雜的體系,有許多問題仍然未知。近年來,基于表型的藥物發(fā)現(xiàn)方式開始受到關(guān)注,即直接使用生物系統(tǒng)進(jìn)行新藥篩選。
生命科學(xué)的問題何其錯綜復(fù)雜!比做一個有專利分子更底層的邏輯是,對生物學(xué)機理的理解,可以破解AI制藥的最終難題。行業(yè)里的新變化,或許代表著AI制藥運行模式的某種正轉(zhuǎn)變,從基于藥企實驗室的數(shù)據(jù)、臨床數(shù)據(jù)、理想生物學(xué)模型做相對割裂的獨立開發(fā),向上游回溯,去用數(shù)學(xué)方法嘗試從生物學(xué)視角解構(gòu)疾病機理,以終為始地去找尋藥物。
而這個過程,無疑會涉及更龐大的數(shù)據(jù)分析、計算,這也是英偉達(dá)這樣具備掌控算力的企業(yè)深度參與其中的重要原因?!安荒苡玫途S模型解釋高維問題,只有建立對極其復(fù)雜體系理解的工具,才可以解答生命科學(xué)的復(fù)雜問題?!眻D靈·達(dá)爾文實驗室副主任,哲源科技聯(lián)合創(chuàng)始人趙宇博士表示。
對于AI制藥而言,單點突破的運行模式,已經(jīng)在某種意義上被證偽,但行業(yè)的生長曲線始終向上。