正在閱讀:

國(guó)內(nèi)排名前100的頂級(jí)醫(yī)院,都在自研什么大模型?

掃一掃下載界面新聞APP

國(guó)內(nèi)排名前100的頂級(jí)醫(yī)院,都在自研什么大模型?

大模型進(jìn)入??茖2r(shí)代。

圖片來源:界面圖庫

文 | 動(dòng)脈網(wǎng)

從未有創(chuàng)新技術(shù)能如大語言模型一般,能在短短數(shù)月穿透醫(yī)療體系,引得醫(yī)院主動(dòng)、迅速、成規(guī)模地引入。

截至2025年4月30日,統(tǒng)計(jì)第三方榜單中國(guó)內(nèi)排名前100的醫(yī)院,已有98家對(duì)外宣稱完成了大模型部署。

在這之中,有38家醫(yī)院在通用模型的基礎(chǔ)上進(jìn)一步展開研發(fā),打造出55個(gè)符合自身需求的垂直醫(yī)療模型。

從“買方”轉(zhuǎn)變?yōu)椤把邪l(fā)方”,醫(yī)生已成為“AI制造”群體中至關(guān)重要的一員。

百強(qiáng)醫(yī)院公開發(fā)布的垂直大模型

(截至2025年4月30日,醫(yī)院排名來源于“2022屆中國(guó)醫(yī)院競(jìng)爭(zhēng)力春季榜”)

大模型進(jìn)入??茖2r(shí)代

2022年末,OpenAI憑借GPT3.5點(diǎn)燃大模型的戰(zhàn)火后,國(guó)內(nèi)醫(yī)療領(lǐng)域已經(jīng)掀起多輪“百模大戰(zhàn)”。

但由于GPT時(shí)代高昂的部署成本及調(diào)用成本,國(guó)內(nèi)只有少數(shù)頂級(jí)醫(yī)院完成了大模型的本地化部署,絕大多數(shù)模型均由企業(yè)開發(fā),訓(xùn)練數(shù)據(jù)主要為醫(yī)療相關(guān)的文本數(shù)據(jù),沒有觸及醫(yī)院多模態(tài)臨床數(shù)據(jù)的內(nèi)核。

因此,這個(gè)時(shí)代誕生的大量大模型具備同質(zhì)化高、臨床相關(guān)弱的缺點(diǎn),鮮有模型能夠?yàn)獒t(yī)院帶來增量?jī)r(jià)值,因而未能在醫(yī)療領(lǐng)域掀起太大漣漪。

DeepSeek-R1的橫空出世可以視作醫(yī)療大模型發(fā)展的關(guān)鍵轉(zhuǎn)折點(diǎn)。創(chuàng)新架構(gòu)下,DeepSeek大幅降低了大模型的使用門檻。醫(yī)院只需支付數(shù)十萬元的費(fèi)用便能本地部署大模型,并對(duì)此進(jìn)行個(gè)性化定制,即便是未曾接觸過大模型的醫(yī)院,也不愿錯(cuò)過這一機(jī)遇。

圖片.png

醫(yī)院垂直模型開發(fā)時(shí)間分布(單位:個(gè);截至2025年4月30日)

相較于企業(yè),醫(yī)院能夠調(diào)用的醫(yī)療數(shù)據(jù)體量更龐大,模態(tài)更多元,模型的功能也能更貼近臨床的真實(shí)需求。因此,誕生于DeepSeek流行后的醫(yī)院主導(dǎo)的大模型(部署的通用模型可能是DeepSeek外的其他模型)開始朝專病??瓢l(fā)展,能夠處理的多模態(tài)的醫(yī)學(xué)數(shù)據(jù),直切臨床問題。

譬如,北京協(xié)和醫(yī)院今年2月發(fā)布的“協(xié)和·太初”便是首個(gè)罕見病領(lǐng)域的人工智能大模型,可用于輔助醫(yī)生快速準(zhǔn)確地識(shí)別診斷罕見病,破解罕見病診療全國(guó)范圍內(nèi)同質(zhì)性差的難題。

該大模型基于我國(guó)罕見病知識(shí)庫的多年積累和中國(guó)人群基因檢測(cè)數(shù)據(jù)建立,醫(yī)生向模型輸入“發(fā)現(xiàn)孩子從2歲起發(fā)育、語言和動(dòng)作都明顯落后,交流也無法完成”等癥狀后,僅需數(shù)秒AI便會(huì)給出“需警惕罕見遺傳性疾?。ㄈ缋滋鼐C合征、天使綜合征等)或復(fù)雜神經(jīng)發(fā)育障礙”的判斷,并給出就診科室、補(bǔ)充檢查等醫(yī)學(xué)建議。

中山大學(xué)附屬第一醫(yī)院與神州醫(yī)療共同研發(fā)的全球首個(gè)腹膜透析大模型則是聚焦腹膜透析這一細(xì)分場(chǎng)景。該模型采用DHC+DeepSeek雙引擎架構(gòu),能對(duì)臨床文本、影像、病理、基因、時(shí)序數(shù)據(jù)等進(jìn)行深度理解和融合分析捕捉腹膜透析的相關(guān)信息,為醫(yī)生提供診斷分析、治療方案推薦、隨訪建議和風(fēng)險(xiǎn)預(yù)測(cè)等功能,進(jìn)而為尿毒癥等患者緩解治療比例低、社會(huì)回歸率低等問題。

類似的垂直模型還有很多。動(dòng)脈網(wǎng)據(jù)公開資料統(tǒng)計(jì),國(guó)內(nèi)目前已有專病??拼怪蹦P?2個(gè),覆蓋心血管病、腎病、胸痛、咽喉病變、皮膚病、肝癌等病種,骨科、放射科、病理科、眼科、麻醉科等科室,甚至還專為消化內(nèi)鏡、心超等設(shè)備,以及手術(shù)風(fēng)險(xiǎn)評(píng)估、感染控制等環(huán)節(jié)訓(xùn)練大模型。

圖片3.png

國(guó)內(nèi)專病??拼怪蹦P蛥R總(截至2025年4月30日)

同時(shí),垂直大模型的功能也隨醫(yī)生的加入不斷擴(kuò)展。最初的大模型應(yīng)用主要以患者服務(wù)為主,用生成式AI的多輪對(duì)話能力為患者提供更好的診前、診后服務(wù)。常見于智能預(yù)問診、智能導(dǎo)診、智能隨訪等應(yīng)用中,是對(duì)過去AI的一次升級(jí)。

而如今,醫(yī)院在采用大模型優(yōu)化患者就醫(yī)體驗(yàn)的同時(shí),也希望大模型能夠更好地服務(wù)于醫(yī)生群體,實(shí)現(xiàn)輔助決策、輔助診斷等功能,提供更為優(yōu)質(zhì)、更為高效的醫(yī)療服務(wù)。亦有少量醫(yī)院在探索大模型在醫(yī)學(xué)教育、醫(yī)院管理、科學(xué)研究中的應(yīng)用可能,期望能夠由數(shù)字化醫(yī)院轉(zhuǎn)變?yōu)橹悄芑t(yī)院,從源頭上解決醫(yī)療資源缺失、科研產(chǎn)出有限等問題。

圖片.png

醫(yī)院垂直模型職能分布(截至2025年4月30日)

需要注意的是,雖然百強(qiáng)醫(yī)院都完成了通用模型的部署,但上文展示的垂直模型主要由排名前50的醫(yī)院開發(fā)。換句話說,垂直大模型的研發(fā)非??简?yàn)醫(yī)院的整體實(shí)力,不僅需要在研發(fā)過程中保證深度的醫(yī)工融合,還得有能力承擔(dān)研發(fā)過程中的精力與費(fèi)用,這筆費(fèi)用算下來相當(dāng)昂貴。

醫(yī)療大模型最為花錢的部分在于算力與數(shù)據(jù)。同深度學(xué)習(xí)時(shí)代輔助診斷類AI的訓(xùn)練邏輯相似,好的醫(yī)療大模型需要做好醫(yī)療數(shù)據(jù)方面的工作,有效整合電子健康記錄(EHR)、影像數(shù)據(jù)(DICOM)、實(shí)驗(yàn)室報(bào)告等數(shù)據(jù),確保數(shù)據(jù)多樣性。

此外,數(shù)據(jù)的清洗與標(biāo)注也同樣重要。要確保大模型在后續(xù)使用中具備客觀的生成結(jié)果質(zhì)量,開發(fā)者們必須在前期數(shù)據(jù)治理工作,剔除異常實(shí)驗(yàn)室值、錯(cuò)誤電子病歷等重復(fù)、缺失或錯(cuò)誤數(shù)據(jù)。

以影像大模型為例,訓(xùn)練一個(gè)某垂直領(lǐng)域的影像大模型理論上至少需要數(shù)千張經(jīng)過分類和標(biāo)注的影像,且影像來源需要多元,盡可能收集不同分期、不同年齡的患者影像數(shù)據(jù),保證大模型的魯棒性。

如果訓(xùn)練模型使用的影像太少,大模型在實(shí)際使用時(shí)就容易出現(xiàn)幻覺,為了回答問題去編造一些不存在的東西。臨床之中,這樣的模型無法成規(guī)模地應(yīng)用下去。

醫(yī)院主導(dǎo)開發(fā),垂直模型仍需企業(yè)助力

除了醫(yī)療大模型功能與價(jià)值產(chǎn)生路徑上的變化,醫(yī)院的開發(fā)模型也在不斷擴(kuò)展。

上述提及的55個(gè)大模型中,醫(yī)院合作企業(yè)一起研發(fā)依然是主流,有超過一半的項(xiàng)目采用這一模式進(jìn)行開發(fā)。

但從數(shù)據(jù)可以看出,2025年2月開始,醫(yī)院合作學(xué)校、科研機(jī)構(gòu)的項(xiàng)目數(shù)量開始激增。尤其是醫(yī)院獨(dú)立開發(fā)這一模式(包括醫(yī)院間的合作),已占比接近25%,成為僅次于合作企業(yè)開發(fā)的重要模式。

這意味著:醫(yī)院正在醫(yī)療大模型的能力躍遷中發(fā)揮愈發(fā)重要的作用。

圖片.png

醫(yī)療垂直模型開發(fā)模式分布(截至2025年4月30日)

不過,由于大多數(shù)醫(yī)院缺乏兼具工程與醫(yī)學(xué)能力的跨專業(yè)人才,醫(yī)院與企業(yè)的聯(lián)合開發(fā)模型依然會(huì)是未來的主流。

畢竟,訓(xùn)練模型需要以此完成數(shù)據(jù)準(zhǔn)備與處理、模型選擇與配置、模型訓(xùn)練、模型評(píng)估與調(diào)優(yōu)、模型部署與集成五個(gè)步驟。相較于獨(dú)立開發(fā),醫(yī)生提供領(lǐng)域知識(shí)與標(biāo)注數(shù)據(jù)、AI工程師則負(fù)責(zé)技術(shù)實(shí)現(xiàn)的分工形式或許更能契合當(dāng)下醫(yī)院的需求。

此外,企業(yè)的介入還能幫助醫(yī)院更好地從商業(yè)化的角度規(guī)劃大模型的未來迭代路徑,推動(dòng)相關(guān)科研轉(zhuǎn)化的實(shí)現(xiàn)。畢竟,當(dāng)這些成果得到充分地共享,它的價(jià)值才能最大化地展示出來。

現(xiàn)階段,華為、中國(guó)電信、訊飛醫(yī)療、衛(wèi)寧健康、福鑫科創(chuàng)、神州醫(yī)療等企業(yè)已經(jīng)廣泛參與到了醫(yī)療垂直大模型的開發(fā)中,取得了一定成果。伴隨醫(yī)院大模型應(yīng)用場(chǎng)景的進(jìn)一步擴(kuò)大,更多中小企業(yè)亦可與醫(yī)院達(dá)成合作,共同開發(fā)細(xì)分場(chǎng)景下的醫(yī)療垂直大模型。

邁向下一個(gè)時(shí)代,醫(yī)療大模型還需邁過三道坎

雖說醫(yī)院這一角色的介入已為醫(yī)療大模型帶來長(zhǎng)足的發(fā)展,但要跨越時(shí)代,更深入地應(yīng)用大模型,這一行業(yè)至少還需邁過三道坎。

■ 醫(yī)院大模型訓(xùn)練集的局限性

現(xiàn)階段醫(yī)院開發(fā)大模型采用的多是醫(yī)院自身長(zhǎng)期積累的數(shù)據(jù)集。吸納這些數(shù)據(jù)后的大模型能夠較好地處理常見的患者,但面對(duì)一些復(fù)雜、少見的病灶,大模型很容易因?yàn)閿?shù)據(jù)的缺失而產(chǎn)生幻覺。要解決這一問題,醫(yī)院在培育大模型時(shí)應(yīng)盡可能采用多個(gè)地域、多家醫(yī)院的數(shù)據(jù)組成訓(xùn)練集。

目前,已有不少醫(yī)院開始組建專病聯(lián)盟,共同開發(fā)醫(yī)療垂直大模型。這種模式不僅可以保障大模型的準(zhǔn)確率和魯棒性,還能提高醫(yī)療數(shù)據(jù)的復(fù)用率,讓這些治理后的數(shù)據(jù)能夠充分發(fā)揮價(jià)值。

■ 大模型的形態(tài)暫無定論

到目前為止,行業(yè)圍繞大模型的討論主要集于它的功能,鮮有人去探討它的形態(tài)。當(dāng)垂直大模型作為一個(gè)商業(yè)產(chǎn)品走出醫(yī)院時(shí),我們必須確定它的形態(tài),是單純的軟件應(yīng)用,還是需要經(jīng)歷審評(píng)審批的醫(yī)療器械。

今年3月31日,國(guó)家藥監(jiān)局發(fā)布了《關(guān)于優(yōu)化全生命周期監(jiān)管 支持高端醫(yī)療器械創(chuàng)新發(fā)展的舉措(征求意見稿)》,公開征求多病種AI、大模型等新興技術(shù)準(zhǔn)入方式的意見,先行一步為大模型的發(fā)展樹立道標(biāo)。

文件提到要研究制定多病種、大模型人工智能領(lǐng)域相關(guān)技術(shù)指導(dǎo)原則或者審評(píng)要點(diǎn);簡(jiǎn)化核心算法不變而算法性能優(yōu)化人工智能醫(yī)療器械產(chǎn)品變更注冊(cè)要求;探索完善采用測(cè)評(píng)數(shù)據(jù)庫開展人工智能醫(yī)療器械性能評(píng)價(jià)要求。

這或許意味著,醫(yī)院這波新興的輔助診斷、輔助決策模型未來將被視作醫(yī)療器械,經(jīng)過嚴(yán)苛的準(zhǔn)入審查方能進(jìn)入市場(chǎng)進(jìn)行流通。

■ 潛在的安全性問題

到目前為止醫(yī)療行業(yè)尚未曝出大模型相關(guān)的數(shù)據(jù)安全問題,但風(fēng)險(xiǎn)從未遠(yuǎn)離過這一領(lǐng)域。

醫(yī)療數(shù)據(jù)承載著患者的基因信息、病史記錄等高度敏感內(nèi)容,一旦泄露,將對(duì)個(gè)人隱私構(gòu)成嚴(yán)重威脅,甚至可能引發(fā)基因歧視、保險(xiǎn)欺詐等連鎖風(fēng)險(xiǎn)。

由于現(xiàn)階段醫(yī)院部署的大模型大多來自開源項(xiàng)目,相關(guān)代碼的修改可能會(huì)引入后門程序或者安全漏洞。如果醫(yī)院系統(tǒng)架構(gòu)缺陷或數(shù)據(jù)傳輸加密不足,那么這些數(shù)據(jù)便會(huì)被暴露于網(wǎng)絡(luò)攻擊之下,面臨非法獲取和濫用的風(fēng)險(xiǎn)。

因此,在醫(yī)療領(lǐng)域應(yīng)用開源AI系統(tǒng)時(shí),醫(yī)院及企業(yè)最好對(duì)這些風(fēng)險(xiǎn)進(jìn)行全面評(píng)估,采取嚴(yán)格的安全措施,確保系統(tǒng)的安全性和數(shù)據(jù)的保密性。只有做好醫(yī)療數(shù)據(jù)安全方面的保障,醫(yī)療大模型才存在持續(xù)發(fā)展下去的可能。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

評(píng)論

暫無評(píng)論哦,快來評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

國(guó)內(nèi)排名前100的頂級(jí)醫(yī)院,都在自研什么大模型?

大模型進(jìn)入??茖2r(shí)代。

圖片來源:界面圖庫

文 | 動(dòng)脈網(wǎng)

從未有創(chuàng)新技術(shù)能如大語言模型一般,能在短短數(shù)月穿透醫(yī)療體系,引得醫(yī)院主動(dòng)、迅速、成規(guī)模地引入。

截至2025年4月30日,統(tǒng)計(jì)第三方榜單中國(guó)內(nèi)排名前100的醫(yī)院,已有98家對(duì)外宣稱完成了大模型部署。

在這之中,有38家醫(yī)院在通用模型的基礎(chǔ)上進(jìn)一步展開研發(fā),打造出55個(gè)符合自身需求的垂直醫(yī)療模型。

從“買方”轉(zhuǎn)變?yōu)椤把邪l(fā)方”,醫(yī)生已成為“AI制造”群體中至關(guān)重要的一員。

百強(qiáng)醫(yī)院公開發(fā)布的垂直大模型

(截至2025年4月30日,醫(yī)院排名來源于“2022屆中國(guó)醫(yī)院競(jìng)爭(zhēng)力春季榜”)

大模型進(jìn)入??茖2r(shí)代

2022年末,OpenAI憑借GPT3.5點(diǎn)燃大模型的戰(zhàn)火后,國(guó)內(nèi)醫(yī)療領(lǐng)域已經(jīng)掀起多輪“百模大戰(zhàn)”。

但由于GPT時(shí)代高昂的部署成本及調(diào)用成本,國(guó)內(nèi)只有少數(shù)頂級(jí)醫(yī)院完成了大模型的本地化部署,絕大多數(shù)模型均由企業(yè)開發(fā),訓(xùn)練數(shù)據(jù)主要為醫(yī)療相關(guān)的文本數(shù)據(jù),沒有觸及醫(yī)院多模態(tài)臨床數(shù)據(jù)的內(nèi)核。

因此,這個(gè)時(shí)代誕生的大量大模型具備同質(zhì)化高、臨床相關(guān)弱的缺點(diǎn),鮮有模型能夠?yàn)獒t(yī)院帶來增量?jī)r(jià)值,因而未能在醫(yī)療領(lǐng)域掀起太大漣漪。

DeepSeek-R1的橫空出世可以視作醫(yī)療大模型發(fā)展的關(guān)鍵轉(zhuǎn)折點(diǎn)。創(chuàng)新架構(gòu)下,DeepSeek大幅降低了大模型的使用門檻。醫(yī)院只需支付數(shù)十萬元的費(fèi)用便能本地部署大模型,并對(duì)此進(jìn)行個(gè)性化定制,即便是未曾接觸過大模型的醫(yī)院,也不愿錯(cuò)過這一機(jī)遇。

圖片.png

醫(yī)院垂直模型開發(fā)時(shí)間分布(單位:個(gè);截至2025年4月30日)

相較于企業(yè),醫(yī)院能夠調(diào)用的醫(yī)療數(shù)據(jù)體量更龐大,模態(tài)更多元,模型的功能也能更貼近臨床的真實(shí)需求。因此,誕生于DeepSeek流行后的醫(yī)院主導(dǎo)的大模型(部署的通用模型可能是DeepSeek外的其他模型)開始朝專病??瓢l(fā)展,能夠處理的多模態(tài)的醫(yī)學(xué)數(shù)據(jù),直切臨床問題。

譬如,北京協(xié)和醫(yī)院今年2月發(fā)布的“協(xié)和·太初”便是首個(gè)罕見病領(lǐng)域的人工智能大模型,可用于輔助醫(yī)生快速準(zhǔn)確地識(shí)別診斷罕見病,破解罕見病診療全國(guó)范圍內(nèi)同質(zhì)性差的難題。

該大模型基于我國(guó)罕見病知識(shí)庫的多年積累和中國(guó)人群基因檢測(cè)數(shù)據(jù)建立,醫(yī)生向模型輸入“發(fā)現(xiàn)孩子從2歲起發(fā)育、語言和動(dòng)作都明顯落后,交流也無法完成”等癥狀后,僅需數(shù)秒AI便會(huì)給出“需警惕罕見遺傳性疾?。ㄈ缋滋鼐C合征、天使綜合征等)或復(fù)雜神經(jīng)發(fā)育障礙”的判斷,并給出就診科室、補(bǔ)充檢查等醫(yī)學(xué)建議。

中山大學(xué)附屬第一醫(yī)院與神州醫(yī)療共同研發(fā)的全球首個(gè)腹膜透析大模型則是聚焦腹膜透析這一細(xì)分場(chǎng)景。該模型采用DHC+DeepSeek雙引擎架構(gòu),能對(duì)臨床文本、影像、病理、基因、時(shí)序數(shù)據(jù)等進(jìn)行深度理解和融合分析捕捉腹膜透析的相關(guān)信息,為醫(yī)生提供診斷分析、治療方案推薦、隨訪建議和風(fēng)險(xiǎn)預(yù)測(cè)等功能,進(jìn)而為尿毒癥等患者緩解治療比例低、社會(huì)回歸率低等問題。

類似的垂直模型還有很多。動(dòng)脈網(wǎng)據(jù)公開資料統(tǒng)計(jì),國(guó)內(nèi)目前已有專病??拼怪蹦P?2個(gè),覆蓋心血管病、腎病、胸痛、咽喉病變、皮膚病、肝癌等病種,骨科、放射科、病理科、眼科、麻醉科等科室,甚至還專為消化內(nèi)鏡、心超等設(shè)備,以及手術(shù)風(fēng)險(xiǎn)評(píng)估、感染控制等環(huán)節(jié)訓(xùn)練大模型。

圖片3.png

國(guó)內(nèi)專病??拼怪蹦P蛥R總(截至2025年4月30日)

同時(shí),垂直大模型的功能也隨醫(yī)生的加入不斷擴(kuò)展。最初的大模型應(yīng)用主要以患者服務(wù)為主,用生成式AI的多輪對(duì)話能力為患者提供更好的診前、診后服務(wù)。常見于智能預(yù)問診、智能導(dǎo)診、智能隨訪等應(yīng)用中,是對(duì)過去AI的一次升級(jí)。

而如今,醫(yī)院在采用大模型優(yōu)化患者就醫(yī)體驗(yàn)的同時(shí),也希望大模型能夠更好地服務(wù)于醫(yī)生群體,實(shí)現(xiàn)輔助決策、輔助診斷等功能,提供更為優(yōu)質(zhì)、更為高效的醫(yī)療服務(wù)。亦有少量醫(yī)院在探索大模型在醫(yī)學(xué)教育、醫(yī)院管理、科學(xué)研究中的應(yīng)用可能,期望能夠由數(shù)字化醫(yī)院轉(zhuǎn)變?yōu)橹悄芑t(yī)院,從源頭上解決醫(yī)療資源缺失、科研產(chǎn)出有限等問題。

圖片.png

醫(yī)院垂直模型職能分布(截至2025年4月30日)

需要注意的是,雖然百強(qiáng)醫(yī)院都完成了通用模型的部署,但上文展示的垂直模型主要由排名前50的醫(yī)院開發(fā)。換句話說,垂直大模型的研發(fā)非常考驗(yàn)醫(yī)院的整體實(shí)力,不僅需要在研發(fā)過程中保證深度的醫(yī)工融合,還得有能力承擔(dān)研發(fā)過程中的精力與費(fèi)用,這筆費(fèi)用算下來相當(dāng)昂貴。

醫(yī)療大模型最為花錢的部分在于算力與數(shù)據(jù)。同深度學(xué)習(xí)時(shí)代輔助診斷類AI的訓(xùn)練邏輯相似,好的醫(yī)療大模型需要做好醫(yī)療數(shù)據(jù)方面的工作,有效整合電子健康記錄(EHR)、影像數(shù)據(jù)(DICOM)、實(shí)驗(yàn)室報(bào)告等數(shù)據(jù),確保數(shù)據(jù)多樣性。

此外,數(shù)據(jù)的清洗與標(biāo)注也同樣重要。要確保大模型在后續(xù)使用中具備客觀的生成結(jié)果質(zhì)量,開發(fā)者們必須在前期數(shù)據(jù)治理工作,剔除異常實(shí)驗(yàn)室值、錯(cuò)誤電子病歷等重復(fù)、缺失或錯(cuò)誤數(shù)據(jù)。

以影像大模型為例,訓(xùn)練一個(gè)某垂直領(lǐng)域的影像大模型理論上至少需要數(shù)千張經(jīng)過分類和標(biāo)注的影像,且影像來源需要多元,盡可能收集不同分期、不同年齡的患者影像數(shù)據(jù),保證大模型的魯棒性。

如果訓(xùn)練模型使用的影像太少,大模型在實(shí)際使用時(shí)就容易出現(xiàn)幻覺,為了回答問題去編造一些不存在的東西。臨床之中,這樣的模型無法成規(guī)模地應(yīng)用下去。

醫(yī)院主導(dǎo)開發(fā),垂直模型仍需企業(yè)助力

除了醫(yī)療大模型功能與價(jià)值產(chǎn)生路徑上的變化,醫(yī)院的開發(fā)模型也在不斷擴(kuò)展。

上述提及的55個(gè)大模型中,醫(yī)院合作企業(yè)一起研發(fā)依然是主流,有超過一半的項(xiàng)目采用這一模式進(jìn)行開發(fā)。

但從數(shù)據(jù)可以看出,2025年2月開始,醫(yī)院合作學(xué)校、科研機(jī)構(gòu)的項(xiàng)目數(shù)量開始激增。尤其是醫(yī)院獨(dú)立開發(fā)這一模式(包括醫(yī)院間的合作),已占比接近25%,成為僅次于合作企業(yè)開發(fā)的重要模式。

這意味著:醫(yī)院正在醫(yī)療大模型的能力躍遷中發(fā)揮愈發(fā)重要的作用。

圖片.png

醫(yī)療垂直模型開發(fā)模式分布(截至2025年4月30日)

不過,由于大多數(shù)醫(yī)院缺乏兼具工程與醫(yī)學(xué)能力的跨專業(yè)人才,醫(yī)院與企業(yè)的聯(lián)合開發(fā)模型依然會(huì)是未來的主流。

畢竟,訓(xùn)練模型需要以此完成數(shù)據(jù)準(zhǔn)備與處理、模型選擇與配置、模型訓(xùn)練、模型評(píng)估與調(diào)優(yōu)、模型部署與集成五個(gè)步驟。相較于獨(dú)立開發(fā),醫(yī)生提供領(lǐng)域知識(shí)與標(biāo)注數(shù)據(jù)、AI工程師則負(fù)責(zé)技術(shù)實(shí)現(xiàn)的分工形式或許更能契合當(dāng)下醫(yī)院的需求。

此外,企業(yè)的介入還能幫助醫(yī)院更好地從商業(yè)化的角度規(guī)劃大模型的未來迭代路徑,推動(dòng)相關(guān)科研轉(zhuǎn)化的實(shí)現(xiàn)。畢竟,當(dāng)這些成果得到充分地共享,它的價(jià)值才能最大化地展示出來。

現(xiàn)階段,華為、中國(guó)電信、訊飛醫(yī)療、衛(wèi)寧健康、福鑫科創(chuàng)、神州醫(yī)療等企業(yè)已經(jīng)廣泛參與到了醫(yī)療垂直大模型的開發(fā)中,取得了一定成果。伴隨醫(yī)院大模型應(yīng)用場(chǎng)景的進(jìn)一步擴(kuò)大,更多中小企業(yè)亦可與醫(yī)院達(dá)成合作,共同開發(fā)細(xì)分場(chǎng)景下的醫(yī)療垂直大模型。

邁向下一個(gè)時(shí)代,醫(yī)療大模型還需邁過三道坎

雖說醫(yī)院這一角色的介入已為醫(yī)療大模型帶來長(zhǎng)足的發(fā)展,但要跨越時(shí)代,更深入地應(yīng)用大模型,這一行業(yè)至少還需邁過三道坎。

■ 醫(yī)院大模型訓(xùn)練集的局限性

現(xiàn)階段醫(yī)院開發(fā)大模型采用的多是醫(yī)院自身長(zhǎng)期積累的數(shù)據(jù)集。吸納這些數(shù)據(jù)后的大模型能夠較好地處理常見的患者,但面對(duì)一些復(fù)雜、少見的病灶,大模型很容易因?yàn)閿?shù)據(jù)的缺失而產(chǎn)生幻覺。要解決這一問題,醫(yī)院在培育大模型時(shí)應(yīng)盡可能采用多個(gè)地域、多家醫(yī)院的數(shù)據(jù)組成訓(xùn)練集。

目前,已有不少醫(yī)院開始組建專病聯(lián)盟,共同開發(fā)醫(yī)療垂直大模型。這種模式不僅可以保障大模型的準(zhǔn)確率和魯棒性,還能提高醫(yī)療數(shù)據(jù)的復(fù)用率,讓這些治理后的數(shù)據(jù)能夠充分發(fā)揮價(jià)值。

■ 大模型的形態(tài)暫無定論

到目前為止,行業(yè)圍繞大模型的討論主要集于它的功能,鮮有人去探討它的形態(tài)。當(dāng)垂直大模型作為一個(gè)商業(yè)產(chǎn)品走出醫(yī)院時(shí),我們必須確定它的形態(tài),是單純的軟件應(yīng)用,還是需要經(jīng)歷審評(píng)審批的醫(yī)療器械。

今年3月31日,國(guó)家藥監(jiān)局發(fā)布了《關(guān)于優(yōu)化全生命周期監(jiān)管 支持高端醫(yī)療器械創(chuàng)新發(fā)展的舉措(征求意見稿)》,公開征求多病種AI、大模型等新興技術(shù)準(zhǔn)入方式的意見,先行一步為大模型的發(fā)展樹立道標(biāo)。

文件提到要研究制定多病種、大模型人工智能領(lǐng)域相關(guān)技術(shù)指導(dǎo)原則或者審評(píng)要點(diǎn);簡(jiǎn)化核心算法不變而算法性能優(yōu)化人工智能醫(yī)療器械產(chǎn)品變更注冊(cè)要求;探索完善采用測(cè)評(píng)數(shù)據(jù)庫開展人工智能醫(yī)療器械性能評(píng)價(jià)要求。

這或許意味著,醫(yī)院這波新興的輔助診斷、輔助決策模型未來將被視作醫(yī)療器械,經(jīng)過嚴(yán)苛的準(zhǔn)入審查方能進(jìn)入市場(chǎng)進(jìn)行流通。

■ 潛在的安全性問題

到目前為止醫(yī)療行業(yè)尚未曝出大模型相關(guān)的數(shù)據(jù)安全問題,但風(fēng)險(xiǎn)從未遠(yuǎn)離過這一領(lǐng)域。

醫(yī)療數(shù)據(jù)承載著患者的基因信息、病史記錄等高度敏感內(nèi)容,一旦泄露,將對(duì)個(gè)人隱私構(gòu)成嚴(yán)重威脅,甚至可能引發(fā)基因歧視、保險(xiǎn)欺詐等連鎖風(fēng)險(xiǎn)。

由于現(xiàn)階段醫(yī)院部署的大模型大多來自開源項(xiàng)目,相關(guān)代碼的修改可能會(huì)引入后門程序或者安全漏洞。如果醫(yī)院系統(tǒng)架構(gòu)缺陷或數(shù)據(jù)傳輸加密不足,那么這些數(shù)據(jù)便會(huì)被暴露于網(wǎng)絡(luò)攻擊之下,面臨非法獲取和濫用的風(fēng)險(xiǎn)。

因此,在醫(yī)療領(lǐng)域應(yīng)用開源AI系統(tǒng)時(shí),醫(yī)院及企業(yè)最好對(duì)這些風(fēng)險(xiǎn)進(jìn)行全面評(píng)估,采取嚴(yán)格的安全措施,確保系統(tǒng)的安全性和數(shù)據(jù)的保密性。只有做好醫(yī)療數(shù)據(jù)安全方面的保障,醫(yī)療大模型才存在持續(xù)發(fā)展下去的可能。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。