文|動(dòng)脈網(wǎng)
一如當(dāng)年深度學(xué)習(xí)的火熱,新興的大模型正以肉眼可見的速度席卷醫(yī)療行業(yè)。不到半年時(shí)間,已有不少頭部醫(yī)院上線這項(xiàng)新興技術(shù),主動(dòng)開啟了醫(yī)療人工智能次世代的探索。
此形勢(shì)下,不少研究機(jī)構(gòu)都對(duì)醫(yī)療大模型的前景給予肯定。一如ChatGPT、 Sora的勝利,他們相信醫(yī)療大模型能比深度學(xué)習(xí)更快實(shí)現(xiàn)規(guī)?;涞?,更有效地推動(dòng)醫(yī)院智能發(fā)展。
然而,醫(yī)療決策恪守循證原則,使得現(xiàn)有的垂直大模型無法復(fù)制通用大模型成就之路。一方面,現(xiàn)階段的AI能夠處理的模態(tài)有限,很難做到同一個(gè)真正醫(yī)生那樣通過綜合信息進(jìn)行綜合決策,亦無法準(zhǔn)確獨(dú)立地給出做出決策的具體過程。
另一方面,醫(yī)療機(jī)構(gòu)非常重視數(shù)據(jù)的隱私保護(hù),數(shù)據(jù)能不出院就不出院。這意味著需求方必須斥資自配算力,才能滿足大模型的正常運(yùn)營。
IBM Watson的退場(chǎng)曾對(duì)整個(gè)生命科學(xué)領(lǐng)域予以警示:在面對(duì)一種可能的新興技術(shù)時(shí),我們不能單單借助非醫(yī)療行業(yè)的“主觀印象”判斷該技術(shù)的顛覆性及可用性,還需考慮其應(yīng)用于醫(yī)療領(lǐng)域后,如何切入診療流程、如何面臨審評(píng)審批、如何實(shí)現(xiàn)商業(yè)化等實(shí)際問題。
那么,如今的醫(yī)療大模型是否能夠突破這些考驗(yàn),找到屬于自己的商業(yè)化道路?
醫(yī)療IT:大模型落地的最佳場(chǎng)景
無論是過去的機(jī)器學(xué)習(xí)、后續(xù)的深度學(xué)習(xí)還是如今的生成式AI及大語言模型,AI的本質(zhì)都是一種“工具的工具”,通過“賦能”謀求實(shí)現(xiàn)價(jià)值的路徑。
要讓這樣一個(gè)新的工具在醫(yī)院生根,必須找到其服務(wù)的工具,并盡可能“無感”地融入醫(yī)生的工作流中。繁忙的工作中,醫(yī)生不會(huì)喜歡在使用某項(xiàng)軟件時(shí)還要先調(diào)用另一軟件作為支持。
此外,“高頻”也是醫(yī)療大模型發(fā)揮價(jià)值的必要條件。一個(gè)理想的醫(yī)療大模型應(yīng)能自行提取、處理、分析各類數(shù)據(jù),實(shí)時(shí)質(zhì)控醫(yī)院各個(gè)醫(yī)療流程,并以最小成本滿足醫(yī)生所有非診療外需求。如果大模型不能高頻地做好這些工作,就談不上為醫(yī)院賦能,自然沒有醫(yī)院會(huì)為其買單。
偌大的醫(yī)院之中,尋找滿足上述要求的場(chǎng)景并不困難。實(shí)際上,NLP時(shí)代的人工智能們已為大模型應(yīng)用的落地打好樣板。
預(yù)問診是一個(gè)典型的大模型可以發(fā)揮額外效力的場(chǎng)景。過去,互聯(lián)網(wǎng)技術(shù)與NLP一直在合力幫助醫(yī)生脫離這一耗時(shí)但必要的流程,但受限于智能化程度,很多時(shí)候算法不能清晰地提取患者的主訴,也不能精準(zhǔn)回答患者就醫(yī)過程中遇到的問題。
相比之下,大模型的邏輯分析優(yōu)勢(shì)能夠很好地從多輪對(duì)話中整合數(shù)據(jù),提取有用的信息,進(jìn)而給出符合患者意圖、完整有效的建議。
病歷書寫亦是一個(gè)大模型可以高頻發(fā)揮價(jià)值的場(chǎng)景。在醫(yī)生的日常工作中,病歷的理解與書寫是一個(gè)極為重復(fù)耗時(shí)的過程,而大模型能將醫(yī)生從這些繁瑣的工作中抽離出來,幫助他們發(fā)揮更大的價(jià)值。
雖然這些應(yīng)用早已存在于醫(yī)院之中,但并不妨礙大模型以更高效率、更低價(jià)值的方式將其重做一遍。同時(shí),也正是因?yàn)獒t(yī)生熟悉這些場(chǎng)景,大模型才能在不改變工作流程的前提下深度融入其中,謀求規(guī)?;涞?。
醫(yī)學(xué)影像:富足但遙不可及
既然文本類的醫(yī)療垂直大模型可以借用已有的成熟場(chǎng)景與需求快速實(shí)現(xiàn)突破,那么多模態(tài)的醫(yī)療垂直大模型是否也能在機(jī)器學(xué)習(xí)深度覆蓋的影像領(lǐng)域中生根?
在回答這個(gè)問題前,我們首先需要確定此類大模型應(yīng)用在醫(yī)療場(chǎng)景中所扮演的角色。
如果它希望替代現(xiàn)有影像科、臨床科室的AI輔助診斷工具,那么短期之內(nèi)顯然不會(huì)有太大作為。
輔助診斷產(chǎn)品與輔助治療類產(chǎn)品嚴(yán)格依賴于臨床證據(jù),要求算法能夠復(fù)現(xiàn)給出的結(jié)果,并能給出相應(yīng)的證據(jù)。以目前垂直大模型的應(yīng)用情況,它雖能夠根據(jù)輸入需求給出一個(gè)確定的輸出結(jié)果,但同一需求的多次輸入時(shí)常缺乏一致性。換句話說,當(dāng)輸入影像過于復(fù)雜且追求精度時(shí),大模型無法精準(zhǔn)復(fù)現(xiàn)給出的答案。
即便確有人工智能企業(yè)能夠攻克上述技術(shù)難題,也還會(huì)市場(chǎng)準(zhǔn)入環(huán)節(jié)中停滯一段時(shí)間。這是因?yàn)楝F(xiàn)有的審評(píng)審批文件中并未涉及大模型相關(guān)產(chǎn)品的審批要點(diǎn)。
過去影像AI企業(yè)為通過深度學(xué)習(xí)產(chǎn)品的審批曾與器審中心進(jìn)行了長(zhǎng)達(dá)數(shù)年的磨合,新的算法即便能夠快人一步,但估摸也需花上至少一年。
如果它定位于病理科等綜合性科室或是科研場(chǎng)景中,那么這類大模型現(xiàn)階段確實(shí)存在規(guī)模落地的可能。
目前,已有企業(yè)針對(duì)病理領(lǐng)域開發(fā)出相應(yīng)的垂直大模型。這類大模型可根據(jù)圖像事實(shí)給出結(jié)果,如組織分布情況、鏡下檢查描述等;或?qū)︶t(yī)生病理診斷的結(jié)論進(jìn)行建議(不能直接提供結(jié)論),理論上可以替代機(jī)器學(xué)習(xí)支撐的病理輔助診斷軟件,提高醫(yī)生診斷效率,降低診斷過程中漏診誤診。
針對(duì)AI難以避免的“黑盒子”問題,有的病理垂直大模型企業(yè)還在大模型中加了一個(gè)額外的邏輯底層,用于排除大模型生成結(jié)果時(shí)可能出現(xiàn)的“幻想”及展示大模型的決策路徑。通過這種方式,該企業(yè)可能可以解決人工智能的可溯源、可解釋問題。
科研場(chǎng)景是目前多模態(tài)醫(yī)療大模型最有可能規(guī)?;涞氐膱?chǎng)景。
過去已經(jīng)獲證的基于深度學(xué)習(xí)的AI產(chǎn)品能夠?qū)Ψ巍⑿?、腦等特定臟器中的特定病灶進(jìn)行精準(zhǔn)勾畫,而大模型打破了這一限制。
如今,一些影像AI企業(yè)開發(fā)的大模型可對(duì)任意醫(yī)學(xué)影像中任意病灶進(jìn)行勾畫標(biāo)注,有效提升了醫(yī)學(xué)科研效率,且能使醫(yī)生能夠以低成本方式,快速執(zhí)行一些非主流病種的研究。
醫(yī)院是應(yīng)用大模型最好的場(chǎng)景,但并非商業(yè)化的最好場(chǎng)景
由于文本大模型的能力特征與醫(yī)院信息化需求高度契合,因而許多頭部醫(yī)療IT企業(yè)借道自有的醫(yī)院管理系統(tǒng),迅速完成了大模型的部署。但對(duì)于非醫(yī)療IT頭部公司及多模態(tài)大模型而言,他們沒有這樣一個(gè)落足點(diǎn)可供應(yīng)用的快速落地,如何化解入局難題?
總結(jié)現(xiàn)有大模型公司布局方式,大家破局的方式大概可分為兩種。如果要與老牌醫(yī)療IT公司競(jìng)爭(zhēng)市場(chǎng),許多企業(yè)可以把大模型做成一個(gè)獨(dú)立的產(chǎn)品,外掛至信息化系統(tǒng)。這種方式雖會(huì)略微增加醫(yī)生的操作負(fù)擔(dān),但由于不少軟件也是通過這種方式落地,因而增加的繁瑣流程仍在醫(yī)生可接受的范圍之內(nèi)。
如果放棄醫(yī)院作為大模型的直接支付方,大模型的落地更有難度,但也更具想象力。譬如,企業(yè)可以尋求醫(yī)療器械、商業(yè)保險(xiǎn)等公司合作,圍繞大模型構(gòu)建生態(tài),通過為終端提供智慧賦能的方式實(shí)現(xiàn)落地。通過這種方式,大模型的支付方由醫(yī)院變成了B端,創(chuàng)業(yè)公司可以在快速規(guī)?;耐瑫r(shí)規(guī)避一定的落地風(fēng)險(xiǎn)。
百度健康去年發(fā)布了一款基于大模型的AI藥品說明書,它既支持患者閱讀藥品說明,亦支持患者通過文字、語音的方式向 AI 藥品說明書進(jìn)行提問。通過這種方式,患者不僅節(jié)省了閱讀資料耗費(fèi)的時(shí)間,還能直接獲取準(zhǔn)確的說明書信息,尤其利于不便閱讀紙質(zhì)讀物的老年人。
不過,百度健康并不指望能夠通過C端實(shí)現(xiàn)盈利。它在意的是使用過程中產(chǎn)生的“藥企與患者重要的溝通渠道”。譬如,百度可幫助藥企獲取已有藥物的用法、用量、用藥禁忌的信息,進(jìn)而指導(dǎo)后續(xù)藥物的開發(fā),進(jìn)而從藥企那里收獲大模型的價(jià)值。
多模態(tài)大模型方面,一個(gè)典型的案例來自于國際光學(xué)科技企業(yè)EVIDENT與深思考的合作。具體而言,EVIDENT的顯微鏡、相機(jī)硬件產(chǎn)品與深思考的垂直大模型Dongni進(jìn)行結(jié)合,雙方聯(lián)合打造了“慧眼”人工智能平臺(tái)。該平臺(tái)可以在顯微鏡下通過AI技術(shù)來輔助醫(yī)生進(jìn)行判讀以及遠(yuǎn)程交流,為病理科醫(yī)生提供便利的輔助工具,達(dá)到提質(zhì)增效。
上文已經(jīng)提到,多模態(tài)大模型想要直接進(jìn)入臨床場(chǎng)景幾乎沒有可能,但通過與設(shè)備廠商的合作,他們可以繞開各類準(zhǔn)入環(huán)節(jié)發(fā)揮輔助價(jià)值,并在B端建立新的付費(fèi)路徑。
給大模型一些時(shí)間
回到最初的問題,當(dāng)下已有不少醫(yī)療大模型能夠完成了規(guī)?;涞?,且能實(shí)現(xiàn)了一定程度的商業(yè)化。但這些應(yīng)用有些分散、未成體系、深度也有待提高,企業(yè)通過它們能夠觸及到的市場(chǎng)規(guī)模總額有限,因而還不足以證明這項(xiàng)技術(shù)已經(jīng)找到了自己的商業(yè)化道路。
因此,對(duì)于眾多醫(yī)療大模型公司而言,當(dāng)下最重要的還是進(jìn)一步強(qiáng)化大模型對(duì)于多模態(tài)數(shù)據(jù)的處理能力。理想狀態(tài)下的多模態(tài)大模型,不應(yīng)只是對(duì)各類醫(yī)療數(shù)據(jù)進(jìn)行分類處理,更能提取各模態(tài)數(shù)據(jù)的關(guān)鍵之處,給出綜合性的建議。
需要注意的是,絕大多數(shù)企業(yè)從接觸到應(yīng)用大模型不足一年,因此未能找到“殺手級(jí)應(yīng)用”也是情理之中。
打通這條新的道路任重道遠(yuǎn),好在他們還有充分時(shí)間。