圖片來源@視覺中國
文 | 同寫意,作者 | Daisy,編輯 | 于靖
2月14日,百度宣布完成對醫(yī)療信息化數(shù)據(jù)提供商GBI的并購,期望結(jié)合“文心一言”,利用AI技術(shù)為醫(yī)療垂直行業(yè)助力,以實現(xiàn)“AI+醫(yī)療大數(shù)據(jù)智能化全鏈條洞察”。
GBI的服務(wù)客戶不僅覆蓋禮來、賽諾菲、輝瑞等跨國藥企,也包括信達(dá)生物、復(fù)星醫(yī)藥、基石藥業(yè)等創(chuàng)新藥企業(yè)和藥明康德等CRO企業(yè)。隨著GBI的加入、“文心一言”的發(fā)布在即,百度跨入制藥行業(yè)并不是多么難以預(yù)料的事情。
早在2020年,百度就成立百圖生科,專攻AI制藥。2022年,百圖生科透露,其將基于生物計算引擎de novo設(shè)計全新蛋白質(zhì)藥物。其實不只是百度,更多的科技公司對于這種結(jié)合表現(xiàn)出濃厚興趣。
如果說,過去幾年是以AlphaFold為代表的產(chǎn)品挑動業(yè)界的情緒,那么當(dāng)下,ChatGPT似乎將“大行其道”。2月,隨著ChatGPT在國內(nèi)的熱度走高,業(yè)界對AI制藥產(chǎn)生了更多的遐想。
ChatGPT是一款基于AI技術(shù)驅(qū)動的自然語言處理工具,檢索信息并綜合處理的能力讓人驚訝。比爾·蓋茨稱,ChatGPT等模型在全球范圍內(nèi)開啟了一種新形式的革命。Forbes上的一篇文章也寫道,ChatGPT等先進的生成式AI工具將深刻變革醫(yī)療健康領(lǐng)域。
我們走到AI制藥的關(guān)鍵節(jié)點了嗎?或許需要放置在更廣泛的背景下討論。
雖然AI制藥“熱潮”在去年似乎有所退卻,但縱觀全球,該領(lǐng)域還是取得了許多里程碑進展。
7月,DeepMind在官網(wǎng)公布,其與歐洲生物信息研究所(EMBL-EBI)合作,利用蛋白結(jié)構(gòu)AI預(yù)測算法AlphaFold成功預(yù)測了來自100萬個物種的約2億種蛋白質(zhì)結(jié)構(gòu),幾乎涵蓋了地球上所有已知的蛋白質(zhì)。
11月,Meta(前身為Facebook)的研究人員使用AI僅花了2周時間預(yù)測了來自細(xì)菌、病毒和其他尚未表征的微生物約6億種蛋白質(zhì)的結(jié)構(gòu)。
此外,Science和Nature Biotechnology也分別報道了利用AI生產(chǎn)全新蛋白和預(yù)測蛋白結(jié)構(gòu)的新技術(shù)。
融資方面,雖增速放緩,但依舊吸引著大量資本的投入。
根據(jù)智藥局不完全統(tǒng)計,2022年全年AI+藥物研發(fā)相關(guān)融資總事件達(dá)144起(2021年是73起),總金額為62.02億美元(2021年總金額為42億美元)。
得益于AI制藥的蓬勃發(fā)展,2022年,眾多MNC不斷加碼與AI企業(yè)的合作,以期利用AI技術(shù)為自身研究添磚加瓦。
其中最大的訂單來自賽諾菲與Exscientia的合作,潛在總額高達(dá)53億美元。作為頭部AI制藥公司,Exscientia此前已與拜耳、BMS、華東醫(yī)藥等多家跨國藥企建立合作。此次與賽諾菲簽約也成為Exscientia有史以來單筆最高的訂單。
此外,賽諾菲還與Atomwise建立了合作,將利用后者AtomNet平臺進行計算發(fā)現(xiàn)和研究多達(dá)5個藥物靶點。
來自國內(nèi)的AI制藥公司英矽智能也官宣了與賽諾菲的合作。賽諾菲將利用英矽智能的Pharma.AI藥物發(fā)現(xiàn)平臺,推進基于不超過6個創(chuàng)新靶點的候選藥物研發(fā),總潛在價值達(dá)12億美元。
與賽諾菲同樣大力布局AI賽道的還有禮來,在TOP10 AI合作中也占據(jù)了三席。
![]()
國內(nèi)另一AI制藥公司晶泰科技,也在去年與新加坡國家藥物研發(fā)平臺實驗藥物研發(fā)中心(EDDC)、 齊魯制藥、啟德醫(yī)藥、正大天晴、青煜醫(yī)藥、聯(lián)邦制藥、華潤醫(yī)藥研究院、楊森制藥等達(dá)成或進一步擴大學(xué)術(shù)或商業(yè)合作,開發(fā)藥物涉及新型ADC、抗腫瘤小分子新藥等。
除了尋求合作之外,很多制藥公司已經(jīng)開始建立內(nèi)部AI能力,GSK在2017年成立了內(nèi)部AI部門,成為“第一個吃螃蟹的人”;2019年,諾華宣布成立AI創(chuàng)新實驗室,并選擇微軟作為其AI戰(zhàn)略和數(shù)據(jù)科學(xué)合作伙伴;羅氏、拜耳等公司也都開始嘗試。
據(jù)市場研究機構(gòu)Research and Markets發(fā)布的一份報告預(yù)測,全球醫(yī)療保健市場的AI規(guī)模預(yù)計將從2020年的42億美元增長到2025年的272億美元,年復(fù)合增長率為45.3%。
AI與制藥已有諸多交叉,而ChatGPT這類語言生成模型的巨大突破,讓研究者開始探索能否在生物制藥領(lǐng)域搭建類似的AI模型。生成式AI因其在靶點發(fā)現(xiàn)上的優(yōu)異表現(xiàn)引起了業(yè)界的興趣。
生成式AI技術(shù)始于2014年,誕生于Yoshua Bengio與Ian Goodfellow發(fā)表的開創(chuàng)性論文“生成對抗網(wǎng)絡(luò)(GAN)”。如今,生成式AI已被用于縮短各種用途的藥物設(shè)計周期,減少了制藥行業(yè)的藥物研發(fā)成本和時間。
從條件來說,生成式AI模型通常要在大型數(shù)據(jù)集上進行訓(xùn)練學(xué)習(xí),并使用機器學(xué)習(xí)算法生成與訓(xùn)練數(shù)據(jù)相似的新內(nèi)容。比較有代表性的生成式AI模型包括DALL-E、DALL-E2、ProGen以及ChatGPT等。該算法的突破也意味著AI開始走向了創(chuàng)造新內(nèi)容的發(fā)展路徑。
那么,生成式AI能否為生物醫(yī)藥帶來創(chuàng)造性變革?
Gartner分析師Brian Burke表示,制藥公司正在使用生成式AI設(shè)計針對疾病的蛋白質(zhì)模型的特性或功能。“幾乎所有大型制藥公司和許多小型制藥初創(chuàng)公司都在致力于生成式人工智能,它已經(jīng)開發(fā)了幾年。一些藥物現(xiàn)在正在進行臨床試驗。這將是制藥行業(yè)的重大轉(zhuǎn)變。”
早在2019年,研究人員發(fā)表在ACS Central Science上的一篇論文中就描述了如何使用ChatGPT識別新的抗菌藥物。該研究表明,ChatGPT在藥物發(fā)現(xiàn)中的應(yīng)用可以幫助藥物研發(fā)人員更快速、高效地開發(fā)新的化合物。
劍橋大學(xué)的研究人員已經(jīng)利用ChatGPT確定了一個治療阿爾茨海默病的新靶點;舊金山加利福尼亞大學(xué)的研究人員也通過ChatGPT分析電子健康記錄,識別了現(xiàn)實環(huán)境中存在的潛在藥物間相互作用關(guān)系。
ChatGPT之外,英矽智能剛于本月宣布其新冠小分子藥物ISM3312正式獲批進入臨床,這是英矽智能第二款使用生成式AI設(shè)計的小分子藥物。
去年12月,Meta AI利用其基于2.5億條天然蛋白質(zhì)序列的預(yù)訓(xùn)練語言模型,生成了228條蛋白質(zhì)序列,其中152條序列能夠進行可溶性表達(dá),且蛋白序列的新穎性極佳。
Salesforce Research在Nature Biotechnology上發(fā)表的一篇文章也力證了生成式AI制藥的可能性:通過ProGen模型進行蛋白質(zhì)生成的工作,該模型生成的具備特定屬性的蛋白序列多樣性強,且生成的酶能夠展現(xiàn)出與天然酶相似的活性。
除了藥物發(fā)現(xiàn)外,生成式AI在藥物設(shè)計、劑量選擇等藥物開發(fā)環(huán)節(jié)中也為提高效率、完善治療效果扮演著令人驚喜的角色。
根據(jù)公開數(shù)據(jù),去年生成式AI領(lǐng)域投資超過13.7億美元。預(yù)計到2040年,生成式AI可能會為醫(yī)療健康行業(yè)帶來1萬億美元的價值。
在制藥領(lǐng)域,生成式AI可能在某種程度上可以幫助發(fā)現(xiàn)靶點、生成分子,甚至產(chǎn)生一些之前未曾考慮過的新想法。業(yè)界也不僅僅滿足于其在藥物發(fā)現(xiàn)階段的成功,但將其應(yīng)用到其他環(huán)節(jié)還需要很多的研究和探索。
以ChatGPT舉例,一方面,它是基于大數(shù)據(jù)大模型,核對事實能力有限,更適合比較寬泛的邏輯梳理和信息歸納。然而,生物醫(yī)藥領(lǐng)域?qū)ι伤惴ǖ慕Y(jié)果有更高、更具體的要求,需要更精確的產(chǎn)出(比如同時具有多個特定性質(zhì)的小分子或者蛋白質(zhì)片段),以ChatGPT目前的能力還無法勝任。
另一方面,基礎(chǔ)數(shù)據(jù)源無法得到保證。首當(dāng)其沖的是準(zhǔn)確性,ChatGPT沒有接受過整個生物醫(yī)學(xué)數(shù)據(jù)庫的培訓(xùn),也沒有經(jīng)過生物醫(yī)學(xué)專家的測試或培訓(xùn),所以AI系統(tǒng)的響應(yīng)未必正確。臨床部分,雖然ChatGPT可以進行一些醫(yī)學(xué)檢查,但AI工具具體的應(yīng)用范圍以及在通過監(jiān)管機構(gòu)認(rèn)可等方面還需要更多討論。此外,全球能否公開真實數(shù)據(jù)也還要打個問號。更重要的是,人類對醫(yī)學(xué)仍然知之甚少。
晶泰科技聯(lián)合創(chuàng)始人賴力鵬也曾表示,如何開源分享私有數(shù)據(jù)、防止濫用和數(shù)據(jù)偏見也都是類似生成式AI工具應(yīng)用在生命科學(xué)領(lǐng)域中需要面對的問題。
而對于大分子藥物能否利用生成式AI迅速生成,這個問題也仍然無解。
晶泰科技的一篇文章解釋了一些原因:一是沒有滿足常規(guī)的以靶點為對象的藥物設(shè)計理念,二是沒有納入對多種成藥性目標(biāo)(如免疫原性、理化性質(zhì))的考量。換句話說,上述技術(shù)可以一鍵生成接近“天然”、可以正常折疊表達(dá)的蛋白,并使其符合某種寬泛要求(如具備溶菌酶活性),但還不足以成藥。
除了數(shù)據(jù)訓(xùn)練外,研發(fā)費用和時間精力也是不菲的一項投入,對于應(yīng)用于醫(yī)療這一細(xì)分賽道眾多且精細(xì)度高的領(lǐng)域更是如此。
另外,去年底由Facebook母公司Meta的Galactica生成式系統(tǒng)引發(fā)了大家對版權(quán)、剽竊等原創(chuàng)性問題的討論,也為這類模型的發(fā)展添上了一些不穩(wěn)定因素。該模型使用學(xué)術(shù)論文作為數(shù)據(jù)集進行訓(xùn)練,然而該系統(tǒng)按要求生成的文章實際上完全虛假。Meta幾天后不得不撤回了這一系統(tǒng)。
從長遠(yuǎn)來看,生成式AI仍然具備顛覆現(xiàn)有AI的能力,而要獲得更加通用、好用的模型,還需要更多領(lǐng)域相關(guān)的數(shù)據(jù)積累和算法創(chuàng)新。同時,由于相關(guān)方向跨學(xué)科的性質(zhì),各專業(yè)的科學(xué)家需要通力合作,以期產(chǎn)生新的變革。
說到底,AI只是一個輔助工具,即使幫助我們提高了尋找到靶點的概率,但成藥的困難依舊,創(chuàng)新藥仍然是一條漫長的“打怪升級”之路。
參考文獻:
快報
根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機號后發(fā)表評論