文 | 動(dòng)脈網(wǎng)
沒(méi)有什么技術(shù)能像大語(yǔ)言模型一般,能在破圈之后如此迅速地接入各行各業(yè)。但未等到他們找到合適的商業(yè)路徑,行業(yè)已圍繞參數(shù)、成本、性能等要素開(kāi)始內(nèi)卷,深陷算力“堆積”。
今年1月,橫空出世的DeepSeek-R1改寫(xiě)了過(guò)去一年由GPT們主導(dǎo)的游戲規(guī)則。創(chuàng)新的模型架構(gòu)與訓(xùn)練優(yōu)化策略之下,DeepSeek向業(yè)界證實(shí):有限規(guī)模的參數(shù)也能創(chuàng)造高性能的通用模型。
除了打破“算力壟斷”,DeepSeek參數(shù)高效微調(diào)(PEFT)、混合專(zhuān)家架構(gòu)(MoE)等創(chuàng)新設(shè)計(jì)還成功降低了大模型的“入場(chǎng)門(mén)檻”。
低成本疊加“國(guó)產(chǎn)”標(biāo)簽,國(guó)內(nèi)大量頂級(jí)醫(yī)院,前沿醫(yī)療科技企業(yè)迅速展開(kāi)部署,甚至是醫(yī)保局都在高調(diào)宣布接入DeepSeek,將大模型再度推至風(fēng)口浪尖。
究竟跟風(fēng)還是新的路徑?動(dòng)脈網(wǎng)近日與已接入DeepSeek的科技醫(yī)療企業(yè)們進(jìn)行了對(duì)話,逐一回答“DeepSeek在醫(yī)療領(lǐng)域的真實(shí)價(jià)值”“DeepSeek在醫(yī)院的應(yīng)用方式”及“基于DeepSeek-R1的醫(yī)療場(chǎng)景應(yīng)用開(kāi)發(fā)現(xiàn)狀”三個(gè)問(wèn)題。
低成本算力需求下,基層醫(yī)療成為新落地可能?
遠(yuǎn)在DeepSeek-R1誕生之前,國(guó)內(nèi)已有醫(yī)院部署通用模型,主動(dòng)開(kāi)啟了生成式AI的探索之旅。
由于臨床相關(guān)的數(shù)據(jù)不能脫離院區(qū),當(dāng)時(shí)的大模型只能通過(guò)封裝入院。這里問(wèn)題在于:大部分醫(yī)院擁有的資源環(huán)境基本是面向通用計(jì)算的CPU,少有醫(yī)院有面向圖形處理和并行計(jì)算的GPU資源,很難提供充足算力。
算力的困境緊扣成本。眾多醫(yī)院中,佼佼者有能力花大價(jià)錢(qián)上全套的GPU,將通用模型完整搬入院內(nèi),服務(wù)全院系統(tǒng);少部分能對(duì)模型進(jìn)行精簡(jiǎn),使其特定的科室受益。
當(dāng)絕大部分醫(yī)療機(jī)構(gòu)不能自由配置大模型、開(kāi)發(fā)相關(guān)臨床應(yīng)用時(shí),醫(yī)療大模型的從業(yè)公司也不過(guò)好過(guò)。缺乏充足的買(mǎi)方,他們很難在大模型方向上進(jìn)行持續(xù)的高額研發(fā)投入。
DeepSeek-R1的出現(xiàn)打破了這一現(xiàn)狀。借助創(chuàng)新架構(gòu)與開(kāi)源代碼,它從根本上解決了通用模型的部署、運(yùn)行產(chǎn)生的成本問(wèn)題。
福鑫科創(chuàng)CEO吳笛表示:由于DeepSeek-R1采用的是混合專(zhuān)家架構(gòu)(MoE),每次推理時(shí)僅激活約370億參數(shù)(總參數(shù)6710億),避免了傳統(tǒng)稠密模型必須全參數(shù)激活的高昂計(jì)算成本,理論上能在節(jié)省40%以上算力消耗的前提下保持推理的精度。若企業(yè)需要擴(kuò)展模型規(guī)模,也無(wú)需線性增加算力投入即可補(bǔ)全模型能力。
DeepSeek、GPT o1 、GPT o3 mini能力對(duì)比
(輸入價(jià)格僅統(tǒng)計(jì)Cache Hit下標(biāo)準(zhǔn)時(shí)段的價(jià)格,數(shù)據(jù)來(lái)源:動(dòng)脈網(wǎng)、深透智醫(yī))
更為重要的是,DeepSeek擁有非常友善的MIT license協(xié)議,允許用戶(hù)本地化部署,自由使用、復(fù)制、修改和分發(fā)軟件,也鼓勵(lì)了企業(yè)在產(chǎn)品中采用和集成,鼓勵(lì)合作和創(chuàng)新,從而推動(dòng)整個(gè)生態(tài)系統(tǒng)的發(fā)展。
這種開(kāi)放的生態(tài)系統(tǒng)使得普通醫(yī)療機(jī)構(gòu)能夠根據(jù)自身的業(yè)務(wù)需求,開(kāi)發(fā)出更符合實(shí)際應(yīng)用場(chǎng)景的醫(yī)療大模型。若只是部署一些蒸餾得到的100B參數(shù)量以?xún)?nèi)的小模型,不少基層醫(yī)療手中的集成顯卡都能帶動(dòng)模型順利運(yùn)行。
“在我們同區(qū)域型醫(yī)療機(jī)構(gòu)的溝通中發(fā)現(xiàn),他們的訴求其實(shí)更加明確,希望能將DeepSeek的推理能力用在基層,因?yàn)槟抢镒钊蹦軌蛱幚韽?fù)雜能力的醫(yī)生。”
總的來(lái)說(shuō),DeepSeek-R1的價(jià)值在于降低了大模型應(yīng)用的門(mén)檻,開(kāi)辟了新的落地市場(chǎng),同時(shí)加速了垂直應(yīng)用的誕生。這個(gè)過(guò)程中,這一新興模型給予了醫(yī)療大模型走向商業(yè)化的可能。
醫(yī)療機(jī)構(gòu)如何用好DeepSeek?
當(dāng)計(jì)劃部署大模型的醫(yī)院及從事大模型開(kāi)發(fā)的醫(yī)生個(gè)體日趨增多,醫(yī)療IT產(chǎn)業(yè)中處于上游位置的眾多企業(yè)也隨之活躍了起來(lái)。
據(jù)衛(wèi)寧健康CTO趙大平介紹,DeepSeek-R1出現(xiàn)后,國(guó)內(nèi)的主流部署模式可簡(jiǎn)單劃分為三種。首先他們可以快速?gòu)脑贫恕⒃炊讼螺d模型,快速完成部署,主要適用于已有顯卡設(shè)備的大型醫(yī)院。若醫(yī)院沒(méi)有運(yùn)算需要的顯卡,他們可以去云端租用設(shè)備。同時(shí),也有部分民營(yíng)醫(yī)院選擇訂閱的方式實(shí)現(xiàn)部署,主要服務(wù)于特定科室。
此外,風(fēng)口之下亦催生了不少制造大模型一體機(jī)的企業(yè)。但在趙大平看來(lái),醫(yī)院要想實(shí)現(xiàn)大模型的有效運(yùn)行,首先要將其與醫(yī)院信息系統(tǒng)本身進(jìn)行融合,其次信息系統(tǒng)本身要盡量使用支持AI運(yùn)行的智能架構(gòu)。
畢竟,大模型一體機(jī)雖然能夠通過(guò)外掛的方式實(shí)現(xiàn)一部分交互能力,但很難與醫(yī)院已有的幾十套系統(tǒng)進(jìn)行充分?jǐn)?shù)據(jù)交換。除非能夠?qū)崿F(xiàn)“模型+應(yīng)用”的一體式解決方案,否則很難滿(mǎn)足醫(yī)院多元的需求。
那么,理想狀態(tài)下醫(yī)院應(yīng)該如何部署大模型?趙大平認(rèn)為:伴隨大模型的不斷深入,未來(lái)醫(yī)院的配置方式一定是多元混合的?!搬t(yī)院可能會(huì)配置一個(gè)大模型及一些服務(wù)細(xì)分科室的小模型。大模型用于需要推理、思考、診斷的大型交互場(chǎng)景,小模型用于強(qiáng)調(diào)規(guī)則、強(qiáng)調(diào)判斷、矯正以及簡(jiǎn)單生成的場(chǎng)景,在滿(mǎn)足需求的同時(shí)實(shí)現(xiàn)最經(jīng)濟(jì)最高效的應(yīng)用?!?/p>
“進(jìn)一步延伸,醫(yī)院中存在很多移動(dòng)化的場(chǎng)景,如果我們能將手機(jī)上的小模型建立起來(lái),那么現(xiàn)有醫(yī)療流程中的大量工作可以向移動(dòng)端轉(zhuǎn)移,極大提升醫(yī)療效率?!?/p>
再談醫(yī)生及其他試圖主動(dòng)開(kāi)發(fā)臨床應(yīng)用的個(gè)體。
DeepSeek爆火的同時(shí),各式教程順勢(shì)而出,鋪天蓋地,鼓勵(lì)用戶(hù)獨(dú)立配置、訓(xùn)練模型。但在醫(yī)療領(lǐng)域,DeepSeek的出現(xiàn)雖然降低了模型訓(xùn)練的各項(xiàng)門(mén)檻,但本地化訓(xùn)練私有模型需要經(jīng)過(guò)數(shù)據(jù)準(zhǔn)備與處理、模型選擇與配置、模型訓(xùn)練、模型評(píng)估與調(diào)優(yōu)、模型部署與集成五個(gè)步驟,仍需要研究人員具備一定的技術(shù)功底。
“現(xiàn)在的很多大模型的應(yīng)用開(kāi)發(fā)程度不高,很多醫(yī)院的研究機(jī)構(gòu)在買(mǎi)了卡配置了模型之后都想立馬搭建一個(gè)特定場(chǎng)景的應(yīng)用,但在實(shí)際操作時(shí)會(huì)發(fā)現(xiàn)不具備相應(yīng)的開(kāi)發(fā)能力。要實(shí)現(xiàn)醫(yī)生個(gè)體的廣泛使用,并以此取得研究成果,我們還需等待服務(wù)方對(duì)UI進(jìn)行升級(jí),進(jìn)一步簡(jiǎn)化大模型應(yīng)用的開(kāi)發(fā)路徑。”
換句話說(shuō),企業(yè)與醫(yī)療機(jī)構(gòu)共同進(jìn)行垂直模型開(kāi)發(fā),仍是醫(yī)療AI的主旋律。
DeepSeek下,醫(yī)療場(chǎng)景應(yīng)用開(kāi)啟革新?
DeepSeek-R1雖在醫(yī)療領(lǐng)域?qū)崿F(xiàn)了大規(guī)模部署,但上線時(shí)間較短,在應(yīng)用場(chǎng)景的開(kāi)拓方面,它暫未突破大模型已有應(yīng)用范疇,更加聚焦于部署訓(xùn)練成本的降低與文本處理效率的提升。最初階段中,著力于互聯(lián)網(wǎng)醫(yī)療的一批大模型企業(yè)最先受益。
譬如,騰訊健康通過(guò)騰訊云接入DeepSeek系列,再結(jié)合自研的混元大模型,迅速完成了對(duì)智能導(dǎo)診、預(yù)問(wèn)診、健康問(wèn)答、影像報(bào)告解讀及質(zhì)控等醫(yī)療服務(wù)的迭代,并加速幫助全國(guó)超過(guò)1000家醫(yī)院快速升級(jí)智能應(yīng)用。
目前,騰訊的“深圳醫(yī)?!睉?yīng)用其智能客服已搭載了最新AI大模型。用戶(hù)可以自由地選擇擅長(zhǎng)推理的DeepSeek,或者可以多維度理解問(wèn)題的騰訊混元,無(wú)論是咨詢(xún)"生育津貼怎么算"這類(lèi)復(fù)雜政策,還是詢(xún)問(wèn)"門(mén)診特定病種如何認(rèn)定"等專(zhuān)業(yè)問(wèn)題,融合后的大模型都能結(jié)合具體參保情況,給出精準(zhǔn)到位且具備“Think”的解答,在回復(fù)用戶(hù)的同時(shí)幫助用戶(hù)理解問(wèn)題。
當(dāng)DeepSeek積累的醫(yī)療數(shù)據(jù)日益增多,它在醫(yī)院場(chǎng)景中的應(yīng)用優(yōu)勢(shì)也開(kāi)始逐步顯露。得益于在提示詞方面的要求顯著降低與思維鏈技術(shù)賦能,DeepSeek有效提升了AI在臨床診斷中的透明度與可解釋性,并能幫助醫(yī)生更為高效地與模型溝通。
舉個(gè)例子,醫(yī)生過(guò)去使用大模型生成手術(shù)方案,需要完整清晰地寫(xiě)明過(guò)往病史、手術(shù)情況等信息,而使用DeepSeek時(shí)只用輸入一些關(guān)鍵信息,模型會(huì)在“Think”的過(guò)程中自主填補(bǔ)相關(guān)信息。
此外,醫(yī)療推理講究循證過(guò)程,DeepSeek不僅能夠提供有效的診療建議,更能詳細(xì)闡明其背后的推理過(guò)程,包括診斷依據(jù)、用藥選擇和檢查項(xiàng)目等。這種透明化極大化解了醫(yī)生對(duì)AI系統(tǒng)的猜忌,為醫(yī)患溝通提供了清晰的依據(jù),進(jìn)而促進(jìn)了AI技術(shù)在臨床中的更廣泛應(yīng)用。
“很多醫(yī)生都非常關(guān)注模型‘think’的過(guò)程,他們會(huì)大致掃一眼Deepseek的邏輯,這是一種重要的交互,能讓醫(yī)生產(chǎn)生信任?!?/p>
到目前為止,已有不少醫(yī)院上線了大模型相關(guān)應(yīng)用。以醫(yī)療文書(shū)書(shū)寫(xiě)為例,福鑫科創(chuàng)、衛(wèi)寧健康等企業(yè)都開(kāi)發(fā)了類(lèi)似應(yīng)用。以福鑫科創(chuàng)為例,該公司與武漢協(xié)和醫(yī)院、武漢大學(xué)中南醫(yī)院等醫(yī)院落地門(mén)診、住院多個(gè)場(chǎng)景的AI生成式電子病歷系統(tǒng),嘗試提高醫(yī)生的書(shū)寫(xiě)病歷效率。
傳統(tǒng)的醫(yī)生在門(mén)診看診場(chǎng)景中,單個(gè)患者就診時(shí)長(zhǎng)按照10分鐘計(jì)算,一般用于書(shū)寫(xiě)電子病歷的時(shí)間在5分鐘,開(kāi)藥、開(kāi)檢查的時(shí)間在3分鐘,真正用于問(wèn)診的時(shí)間也平均只有2分鐘。有了AI之后,AI會(huì)實(shí)時(shí)記錄醫(yī)患的對(duì)話,并將其轉(zhuǎn)化為醫(yī)學(xué)術(shù)語(yǔ),按照門(mén)診電子病歷模板自動(dòng)書(shū)寫(xiě)電子病歷,省下電子病歷的書(shū)寫(xiě)時(shí)間。
“按照一個(gè)醫(yī)生每天看診50個(gè)病人計(jì)算,每天可以至少節(jié)省1個(gè)多小時(shí)的書(shū)寫(xiě)病歷時(shí)間,若醫(yī)院將節(jié)省的時(shí)間用于看診更多的患者,那大模型可以為醫(yī)院創(chuàng)造實(shí)實(shí)在在的經(jīng)濟(jì)價(jià)值?!币蚨趨堑芽磥?lái),這是目前價(jià)值最高,相對(duì)容易落地的場(chǎng)景。
由于DeepSeek模型本身沒(méi)有投喂過(guò)CT、MR相關(guān)影像數(shù)據(jù),企業(yè)開(kāi)發(fā)相關(guān)應(yīng)用時(shí)需要自行建立影像數(shù)據(jù)集并構(gòu)建模型。因而相較于各類(lèi)文本工具,醫(yī)學(xué)影像領(lǐng)域展開(kāi)基于DeepSeek大模型研究相對(duì)較少。
目前,深智透醫(yī)在內(nèi)部工具層面對(duì)DeepSeek進(jìn)行了部分探索。譬如,他們將DeepSeek用于影像數(shù)據(jù)多模態(tài)標(biāo)準(zhǔn)化和增強(qiáng),利用圖像數(shù)據(jù)+meta data非圖像數(shù)據(jù)(EMR、HIS\RIS、DICOM header等有大量語(yǔ)言信息)提高成像內(nèi)容及命名的一致性,優(yōu)化下游應(yīng)用(例如hanging protocol等更準(zhǔn)確一致可以提高醫(yī)生效率)。
而在質(zhì)控?cái)?shù)據(jù)分析方面,深智透醫(yī)則在嘗試借助大模型提升醫(yī)學(xué)影像質(zhì)量控制、異常識(shí)別能力、工作流問(wèn)題交互能力。
需要注意的是,雖然基于DeepSeek進(jìn)行的影像學(xué)研究頗為有限,但行業(yè)對(duì)于影像大模型已實(shí)現(xiàn)大量研究成果。部分企業(yè)基于GPT等模型建立起了影像基座模型,并在臨床試驗(yàn)中證實(shí)了LLM對(duì)于醫(yī)學(xué)影像診斷的準(zhǔn)確率、效率提升。伴隨DeepSeek能力的進(jìn)一步增強(qiáng),這些企業(yè)亦有可能慢慢轉(zhuǎn)至國(guó)產(chǎn)通用模型。
再談醫(yī)院場(chǎng)景之外的藥物研發(fā),這里同樣是各類(lèi)大模型的重要競(jìng)技場(chǎng)。
目前,深智透醫(yī)已在嘗試使用DeepSeek處理醫(yī)學(xué)影像標(biāo)準(zhǔn)化問(wèn)題,進(jìn)而在醫(yī)藥研發(fā)試驗(yàn)中更好地解決影像數(shù)據(jù)質(zhì)控等問(wèn)題。據(jù)深智透醫(yī)CEO宮恩浩透露,該企業(yè)已簽約一批國(guó)際藥廠,優(yōu)化他們已有研發(fā)中的影像試驗(yàn)數(shù)據(jù)。
還有一些模型雖然沒(méi)用DeepSeek,但也采用了類(lèi)似的創(chuàng)新技術(shù)。
例如,百圖生科的xTrimo系列大模型同樣采用了Moe框架,其V3版本可處理DNA、RNA、蛋白質(zhì)、細(xì)胞、化合物-蛋白互作、蛋白-蛋白互作及生命系統(tǒng)等七大模態(tài)數(shù)據(jù),可實(shí)現(xiàn)從堿基對(duì)到細(xì)胞集群的全尺度建模,進(jìn)而賦能抗體和細(xì)胞基因療法藥物領(lǐng)域、靶點(diǎn)發(fā)現(xiàn)方面、微生物等領(lǐng)域的科學(xué)研究。
不過(guò)也需注意,無(wú)論是醫(yī)療機(jī)構(gòu)相關(guān)的賦能,還是藥物研發(fā)的前沿探索,開(kāi)發(fā)者們使用DeepSeek等大模型幾乎都是在原有場(chǎng)景中進(jìn)行升級(jí),尚未能開(kāi)發(fā)出顛覆已有場(chǎng)景的應(yīng)用,談不上革新。好在DeepSeek- R1的上線僅有不足兩個(gè)月的時(shí)間,伴隨時(shí)間的推移,我們很有可能目睹來(lái)自醫(yī)療AI的驚喜。
無(wú)遠(yuǎn)弗屆
雖說(shuō)DeepSeek-R1的出現(xiàn)極大程度推進(jìn)了醫(yī)療領(lǐng)域?qū)τ诖竽P偷膽?yīng)用深度,但理性來(lái)講,要在醫(yī)院日常之中用上大模型,仍然需要等待不少時(shí)日。
首先,解決復(fù)雜問(wèn)題需要大模型像醫(yī)生一樣結(jié)合患者的各模態(tài)數(shù)據(jù),進(jìn)行綜合推斷。但在“Think”過(guò)程中,DeepSeek時(shí)常會(huì)陷入一種可能無(wú)限循環(huán)的情況,導(dǎo)致出現(xiàn)大量無(wú)關(guān)于問(wèn)題本身的答案。對(duì)醫(yī)療這樣嚴(yán)肅、高頻的領(lǐng)域,必須消除這些場(chǎng)景幻覺(jué)才能有望規(guī)?;涞?。
其二,DeepSeek擁有的“國(guó)產(chǎn)”身份證明使其更受?chē)?guó)內(nèi)醫(yī)療機(jī)構(gòu)的青睞,但要規(guī)模應(yīng)用,仍需符合醫(yī)學(xué)數(shù)據(jù)隱私與安全合規(guī)。因而需要DeepSeek出臺(tái)更完善的數(shù)據(jù)脫敏、加密技術(shù),確?;颊邤?shù)據(jù)安全。
其三,DeepSeek解決的是過(guò)往大模型欠缺的產(chǎn)品質(zhì)量和性能問(wèn)題,未能找到“殺手級(jí)應(yīng)用”推動(dòng)醫(yī)療機(jī)構(gòu)主動(dòng)付費(fèi)。就目前來(lái)看,AI的付費(fèi)邏輯還是和用戶(hù)認(rèn)知及產(chǎn)品本身方向是否能真實(shí)降本增效創(chuàng)收賦能有關(guān)。因此,DeepSeek要想規(guī)模落地,一是提升醫(yī)院與醫(yī)生的接受度,二是要在傳統(tǒng)AI的基礎(chǔ)上進(jìn)一步提升。至于誰(shuí)付費(fèi)這一問(wèn)題,從AI近十年的發(fā)展看,基層醫(yī)療比等級(jí)醫(yī)院更為需要大模型的支持。
第四,DeepSeek的技術(shù)突破并非不可復(fù)制。如今,GPT的部分版本已將模型訓(xùn)練成本大幅壓縮,逼近DeepSeek水平,且在邏輯推理能力方面不斷提升。這需要DeepSeek進(jìn)一步鞏固優(yōu)勢(shì),在實(shí)際臨床問(wèn)題方面做出成果。
盡管挑戰(zhàn)重重,我們依然能夠從中看到很多積極的東西。畢竟,大量醫(yī)療企業(yè)與醫(yī)療機(jī)構(gòu)的加入必將生成更多的垂直應(yīng)用,拓寬大模型商業(yè)化的可能。
同時(shí),DeepSeek等模型自身的潛力也不容忽視。按照現(xiàn)有大模型的迭代速度,每三個(gè)月通用模型都將完成一波全面迭代?;蛟S在2025年之中,我們便能目睹某一大模型脫穎而出,逐一攻克上述問(wèn)題,與眾多醫(yī)療科技企業(yè)一同開(kāi)啟醫(yī)療大模型的新圖景。