界面新聞記者 | 張熹瓏
3月的廣州剛經(jīng)歷完一波倒春寒,連日的陰雨和大風下,氣溫不斷下探。
但并沒有影響這座城市人工智能企業(yè)的“溫度”。最忙的一天,陳天接待了五、六波參觀者,有來了解發(fā)展狀況的政府部門人員,也有前來尋求合作機會的學校和醫(yī)院。這些造訪者身份各不相同,但目的指向同一個——如何在下游場景中應(yīng)用大模型。
陳天是廣州云蝶科技有限公司的創(chuàng)始人之一,現(xiàn)擔任公司CTO。這家年輕的公司成立僅六年,大模型產(chǎn)品已經(jīng)實現(xiàn)盈利。隨著旗下云蝶行知大模型在去年7月通過大模型備案,商業(yè)問詢明顯增加。該大模型是國內(nèi)首個專注于教研科研的行業(yè)大模型。
但真正的“大模型熱”高峰出現(xiàn)在春節(jié)前后。DeepSeek一度“重創(chuàng)”美國科技股,各地“新春第一會”和政府工作報告紛紛喊話發(fā)展人工智能。字節(jié)、月之暗面、智譜華章、騰訊等密集發(fā)布新產(chǎn)品,再塑國內(nèi)大模型格局。
杭州、深圳無疑是這場熱潮最具風頭的弄潮兒。深圳背靠騰訊、華為、比亞迪等龍頭,實現(xiàn)大模型產(chǎn)業(yè)鏈的多點開花;杭州依靠浙江大學、之江實驗室、阿里巴巴等創(chuàng)新主體,在通用大模型上異軍突起;上海一直以人工智能為先導產(chǎn)業(yè),密集出臺政策打造“模都”。
相較之下,廣州的聲量并不大。無論是杭州、深圳為AI產(chǎn)業(yè)站臺的討論,還是京滬在“大模型第一城”的較量,公開的討論中都默認將廣州排除在比較對象之外。
但這不意味這個城市無意進入這個賽道。事實上,2020年,粵港澳大灣區(qū)發(fā)展拉開序幕時,廣東省大灣區(qū)領(lǐng)導小組以1號文形式,將琶洲規(guī)劃為廣州市人工智能與數(shù)字經(jīng)濟試驗區(qū)核心片區(qū)。
琶洲位于廣州海珠區(qū)東部。去年來,海珠主動競逐大模型賽道,在市級支持下建設(shè)全國首個人工智能大模型應(yīng)用示范區(qū)。這是國內(nèi)首次用這種形式重點發(fā)展大模型應(yīng)用。

高樓林立的琶洲,聚集著一批龍頭企業(yè)總部和其大模型項目,包括夸克大模型、唯品會“朝徹大模型”、致景科技服裝AI大模型、趣丸科技大模型等,應(yīng)用于日常辦公、電商購物、文旅等場景。
目前,海珠區(qū)落地行業(yè)大模型120個,引育大模型備案項目7個,算法備案項目114個,集聚泛人工智能企業(yè)超7000家。
在備受關(guān)注的通用大語言模型上,廣州沒有多少水花。眼下,這座城市發(fā)展大模型的策略是,從通用走向垂域,更精準地鎖定細分行業(yè)的需求,要成為“垂類模型之都”。

老牌工業(yè)區(qū)轉(zhuǎn)身
將地圖定位至廣州海珠區(qū)——這是城市中部的一個島區(qū),東西走向、四面環(huán)江。3月后,小島的東部忙碌起來——從每年一屆的家博會、建博會,到即將到來的廣交會,比起“海珠”,國內(nèi)外采購商更熟知的名詞是“廣交會展館”。
第三產(chǎn)業(yè)是海珠區(qū)的支柱。截至2024年末,第三產(chǎn)業(yè)的經(jīng)濟比重超過八成。
但最早期,海珠區(qū)不以第三產(chǎn)業(yè)見長。上世紀50年代起,廣州通用機器廠、廣州造船廠、廣州鍋爐廠等30多家大中型工業(yè)企業(yè)陸續(xù)落地,這里形成規(guī)模宏大的工業(yè)區(qū);改革開放后,承接香港和發(fā)達國家的產(chǎn)業(yè)轉(zhuǎn)移,廣州市南方制漆廠、廣州百事可樂汽水廠等布局在海珠區(qū),這里進一步發(fā)展為廣州的老牌工業(yè)區(qū)。第二產(chǎn)業(yè)的經(jīng)濟比重一度超過40%。
不過,老工業(yè)區(qū)的標簽很快成為過去式。在珠三角一體化規(guī)劃和廣州城市功能提升的背景下,現(xiàn)代服務(wù)業(yè)逐漸成為廣州產(chǎn)業(yè)結(jié)構(gòu)調(diào)整的方向。2008年后,海珠區(qū)按照全市“退二進三”的產(chǎn)業(yè)結(jié)構(gòu)調(diào)整思路對傳統(tǒng)工業(yè)企業(yè)進行關(guān)停或搬遷,萬寶冰箱、五羊摩托、廣州鍋爐廠、廣州造紙廠等一批重點工業(yè)企業(yè)遷離海珠。
“上世紀80年代靠工業(yè),90年代靠房地產(chǎn)的海珠區(qū),在南拓背景下靠什么發(fā)展?這已經(jīng)成為目前擺在海珠區(qū)面前最嚴峻的問題。”廣州市社會科學院曾在相關(guān)研究中提到。
城央土地有限,海珠區(qū)瞄準了總部經(jīng)濟。2015年前后,琶洲再開發(fā)拉開序幕,圍繞數(shù)字經(jīng)濟,海珠區(qū)以“產(chǎn)業(yè)先行”思路開展用地招商,不以土地財政為首要考慮條件,讓利吸引產(chǎn)業(yè)龍頭拍地建設(shè)總部型物業(yè)。騰訊、抖音、阿里巴巴、唯品會、螞蟻、科大訊飛等總部大樓接連亮燈。

引入“外援”為后續(xù)AI生態(tài)提供了基礎(chǔ)。繼阿里夸克團隊、唯品會等大模型團隊后,佳都科技也在海珠區(qū)成立了子公司,聚焦佳都知行大模型的技術(shù)研發(fā)和大規(guī)模落地應(yīng)用,該大模型是國內(nèi)首個交通行業(yè)大模型。
“做大模型是一個‘扎堆’的事情,就像北京做大模型要去海淀區(qū)。海珠區(qū)初步形成了大模型的聚集氛圍,也有不少互聯(lián)網(wǎng)代表公司,不管是前沿信息交流還是商務(wù)洽談,這邊都有優(yōu)勢?!奔讯伎萍际紫?span>AI科學家王凱向界面新聞表示。
針對海珠區(qū)的商業(yè)落地,佳都科技在去年完成了慧行大模型的備案,針對底層技術(shù)進行了升級,訓練效率提升了兩到三倍,推理的算力需求則降低了一個數(shù)量級。
這樣來看,海珠區(qū)的發(fā)展路徑跟杭州較為相似,經(jīng)歷了從“電商之都”向“大模型之都”的轉(zhuǎn)變,數(shù)字經(jīng)濟、產(chǎn)業(yè)互聯(lián)網(wǎng)的生態(tài)為其發(fā)展“模都”提供了基礎(chǔ)。
“大模型是解決問題的,產(chǎn)業(yè)生態(tài)越豐富,就越適合大模型企業(yè)的成長,例如阿里、騰訊具備底層技術(shù)優(yōu)勢,而唯品會等電商產(chǎn)業(yè)對應(yīng)下游用戶,也有發(fā)展大模型的需求?!标愄煺J為。
而原有的制造業(yè)基礎(chǔ)也為大模型提供了落點。海珠區(qū)坐落著國內(nèi)最大紡織商圈,本土企業(yè)致景科技切入服裝AI大模型,基于款式、面料和色彩參數(shù)等行業(yè)大數(shù)據(jù),提供設(shè)計、生產(chǎn)、營銷等各環(huán)節(jié)的預測和建議。

但不可否認,廣州大模型產(chǎn)業(yè)仍被杭州拉開了明顯距離。
“廣州和杭州有一定的相似性,都是商貿(mào)流通的重要城市。但這個過程中,杭州發(fā)展出以阿里巴巴為代表的電商生態(tài),B端、C端沉淀了大量數(shù)據(jù),為發(fā)展AI做了鋪墊。而廣州主打?qū)I(yè)市場,也就是廠家到零售端中間的批發(fā)模式,保守于這種模式的紅利讓廣州錯過了抓住互聯(lián)網(wǎng)鏈接新渠道的機會。這種現(xiàn)場交易也不記錄數(shù)據(jù),廣州也因此缺乏大數(shù)據(jù)學習的基礎(chǔ)?!?span>中山大學軟件工程學院產(chǎn)業(yè)數(shù)字化服務(wù)中心主任、中世數(shù)字經(jīng)濟研究院執(zhí)行院長戴欣認為。
戴欣表示,這也反映了廣州存在的問題——此前本土對創(chuàng)新性的引領(lǐng)不明顯,在支撐原創(chuàng)上乏善可陳,這種積累也無法短期投資來彌補,需要找到錯位發(fā)展的賽道。
應(yīng)用端錯位發(fā)展
模型研發(fā)依賴大量基礎(chǔ)學科研究,對人力、電力、算力要求高,是廣州短期內(nèi)難以追趕的領(lǐng)域。這座城市瞄準應(yīng)用端錯位競爭,對標垂類大模型,海珠區(qū)選準AI+教育、醫(yī)療、新型工業(yè)化、游戲等11個重點方向。
2024年3月,《廣州市支持海珠區(qū)建設(shè)人工智能大模型應(yīng)用示范區(qū)實施方案》正式印發(fā)實施,這是國內(nèi)首個聚焦行業(yè)大模型產(chǎn)業(yè)發(fā)展的方案,在應(yīng)用數(shù)量上有明確指標:到2026年,推動大模型在8個以上行業(yè)深度應(yīng)用,推廣典型應(yīng)用場景不少于30個、儲備算法超5000個,帶動示范區(qū)主營業(yè)務(wù)收入超5000億元。
“今年我們的課題就放在這一領(lǐng)域,發(fā)展思路也一直是往垂直方向走。”海珠區(qū)科工商信局局長麥錳錳表示,海珠區(qū)計劃將人工智能與傳統(tǒng)產(chǎn)業(yè)進一步“黏合”起來,讓大模型落地盈利,計劃新引育大模型項目超100個,完成大模型內(nèi)測超50個、上線運營超30個。

“對廣州來說,探索小場景、小模型的方式更現(xiàn)實。大模型原生底層的技術(shù)研發(fā)是上海、杭州等長三角城市的強項,短期內(nèi)難以被反超。但是具體賽道應(yīng)用上廣州是可以突破的?!庇捎诠ぷ麝P(guān)系,科大訊飛華南有限公司副總經(jīng)理惲風靜常年往返于珠三角和長三角。地域優(yōu)勢的差異也讓公司將不同板塊劃分給不同城市——合肥及周邊更多承擔技術(shù)研發(fā),廣州、深圳以產(chǎn)品和市場運營為主。
海珠區(qū)也在國內(nèi)首創(chuàng)規(guī)劃一個示范區(qū)發(fā)展大模型應(yīng)用的模式。惲風靜看來,這種形式有幾個好處:更專注具體場景的應(yīng)用落地,面向市場主體和場景的開放度也更高;另外,能給予相應(yīng)政策性的鼓勵和支持,并搭建政企合作的平臺。
在AI行業(yè),應(yīng)用場景落地已進入紅利兌現(xiàn)期。過去一年,海珠區(qū)超50家大模型企業(yè)實現(xiàn)盈利,產(chǎn)業(yè)規(guī)模破30億元,包括多面科技的獵聘大模型、樹根互聯(lián)的根靈工業(yè)大模型、動悅信息大模型等。
陳天提到,一方面,政策對備案大模型、備案算法有相應(yīng)補貼,例如算法券,此外政府也組建算力資源提供支持。這都有助于降低企業(yè)成本。
過去數(shù)年間,海珠已在數(shù)據(jù)、算法、算力方面奠定基礎(chǔ)。如數(shù)據(jù)方面,海珠區(qū)是全省唯一的“數(shù)據(jù)經(jīng)紀人”“首席數(shù)據(jù)官”“數(shù)據(jù)生產(chǎn)要素統(tǒng)計核算”創(chuàng)新改革“三試點”單位,在全國率先開展數(shù)據(jù)要素市場化配置改革,已推薦9家企業(yè)成為廣東省數(shù)據(jù)經(jīng)紀人,區(qū)縣級數(shù)量全省最多。
算力支撐方面,海珠實現(xiàn)算力超1800P、可調(diào)度算力超4900P,后續(xù)還將實現(xiàn)可調(diào)度算力18000P。通過政府牽頭、企業(yè)投資,建設(shè)了琶洲云腦智能計算中心等基礎(chǔ)設(shè)施,并引導琶洲實驗室、百度飛槳賦能中心等設(shè)施升級擴容。
百度飛槳是百度用時15年開發(fā)的深度學習框架,2023年4月在廣州落成人工智能產(chǎn)業(yè)賦能中心,自建有算力中心12.69P,主要用于自有模型的訓練和推理。百度飛槳廣州中心副主任陳云峰告訴界面新聞,廣州中心聚焦大模型在垂直行業(yè)的落地,中心已完成工業(yè)質(zhì)檢大模型、檢察院大模型、法院大模型、高校大模型的訓練和應(yīng)用。
大模型行業(yè)不是單純的市場行為,作為各地押注的新興賽道之一,其中也夾雜了政府的期待。這個背景下,G端市場被率先打開。
教育被視為大模型最重要的應(yīng)用場景之一??拼笥嶏w去年在海珠區(qū)建設(shè)大模型示范區(qū)的契機下跟海珠區(qū)教育局簽訂了戰(zhàn)略合作關(guān)系,在廣州市第五中學等學校規(guī)模化應(yīng)用了科大訊飛星火教師助手,這是基于星火教育領(lǐng)域?qū)俅竽P烷_發(fā)的場景模型,可以分析老師在課堂教學環(huán)節(jié)中的教學用語,提供教研循證的課堂數(shù)據(jù)分析和針對性的教學改進建議。
云蝶行知大模型也指向教育,為教師提供備課輔助、論文輔助、課題申報輔助、行政公文輔助等教學輔助服務(wù)。陳天透露,此大模型今年預計投放到超過300所付費學校,用戶(含試用)超10萬,單品營收超過5000萬元。
“新事物打開市場并不容易,政府牽頭開放場景,舉辦對接會、介紹對應(yīng)公司座談,這樣省去了我們很多協(xié)調(diào)成本?!标愄焯岬?,公司的教育類客戶和醫(yī)療類客戶,不少就來自上述渠道。
佳都科技則結(jié)合海珠區(qū)交通路網(wǎng)開展大模型輔助信控優(yōu)化,改變了以往交通信號燈靠人力調(diào)優(yōu)的模式,業(yè)務(wù)范圍覆蓋整個區(qū)。
王凱介紹道,通過觀察路面交通實時擁堵狀況和異常事件,可進行片區(qū)級的交通信號燈優(yōu)化配置。另一方面,通過大模型可以實現(xiàn)秒級異常交通事件檢測,在海珠區(qū)超過30個路視頻監(jiān)控接入了多模態(tài)的視覺大模型,進行24小時實時分析。截止到2024年年末,AI大模型可在30秒內(nèi)發(fā)現(xiàn)異常交通事件并輸出告警,事件識別準確率超80%。
去年開通的廣州11號線環(huán)線中,同樣運用了佳都科技基于大模型的超寫實數(shù)字客服,1比1一復刻了廣州地鐵工作人員的形象,可以解答乘客任何關(guān)于11號線的問題。

發(fā)展盈利大模型
不管是教育、交通還是醫(yī)療領(lǐng)域,現(xiàn)下海珠區(qū)的大模型場景以G端為主。戴欣認為,這是政府相對可控的資源,更容易放開。
一個行業(yè)場景打通后,市場的買單行為也隨之增加,在海珠區(qū)打樣的場景率先產(chǎn)品化。繼海珠區(qū)之后,佳都科技也中標了廣州花都區(qū)的交通聯(lián)動系統(tǒng)項目,金額達3.1億元。王凱透露,11號線的超寫實數(shù)字人,其他城市的地鐵站也有意引入。
但企業(yè)的商業(yè)版圖不止于此,這些公司也在謀求B端和C端市場。
畢竟押注大模型就是一項“燒錢”的活。以科大訊飛為例,2024年上半年扣非后歸母凈利潤為虧損4.83億元,虧損擴大的主因是大模型相關(guān)投入增加。
2024年7月,海珠放話發(fā)展“最盈利大模型”,探索出符合自身發(fā)展的盈利模式,逐漸實現(xiàn)商業(yè)閉環(huán)。
“盈利主要是兩方面,一個是成本,一個是市場?!标愄焱嘎?,云蝶科技在今年才開始融資,前五年都是自我造血。
DeepSeek的爆火讓外界看見國產(chǎn)大模型撼動全球行業(yè)格局的可能性,但行業(yè)對“小算力、高性能”并不陌生,海珠區(qū)很多行業(yè)大模型企業(yè)都在采用這一模式。
“最初做行業(yè)模型時,我們就提出知識蒸餾KTD架構(gòu),這是一個大模型垂類訓練的架構(gòu),可以快速以較低成本訓練某個領(lǐng)域的小模型,快速從一個行業(yè)遷移到其他行業(yè),形成對應(yīng)的解決方案?!标愄旄嬖V界面新聞。
AI技術(shù)中,蒸餾是一種模型壓縮和優(yōu)化的方法,能將一個大型、復雜的模型的知識傳遞給一個更小、更簡單的模型。陳天提到,同時配合知識圖譜和GPT技術(shù),確保輸出的可靠性。
“DeepSeek把很多精力花在怎樣用更少資源、更高效率訓練一款新模型,以及一款模型訓練出來后用更少算力做推理,我們的思路也是一樣的?!蓖鮿P說。

佳都科技創(chuàng)造了“模型沙盒”體系,慧行大模型也基于此進行研發(fā)。王凱解釋道,沙盒會不斷更新,過去的實驗規(guī)律和結(jié)論可以沉淀在沙盒里,要做新模型時可以從中查找最優(yōu)策略和參數(shù)配置,從而降低訓練成本。
王凱表示,公司已經(jīng)沉淀了一個預訓練的基座,只需要少量樣本做微調(diào),就可以結(jié)合具體場景快速生成對應(yīng)模型算法。此前,廣州交通部門需要定制專門針對非機動車識別的算法,基于預訓練基座,不到一周就實現(xiàn)交付。如果沒有該基座,可能需要兩個月。
2024年,佳都科技將知行大模型迭代升級至V2.0。王凱提到,多模態(tài)是一個突破,該體系涵蓋了視覺大模型、多模態(tài)大模型和時空決策大模型,更多模態(tài)才有可能實現(xiàn)更全面的預測預警,解決更復雜的問題。像海珠區(qū)的信號燈調(diào)優(yōu),就運用了時空檢測大模型,得以對下一個周期、下一個階段的路面交通流進行預測。
陳天目前正在跟兩家醫(yī)療類企業(yè)接洽,科研領(lǐng)域會率先落地,醫(yī)生可以借助大模型生成的文獻綜述快速了解前沿動態(tài)??祻秃蟮碾S訪也有望實現(xiàn),通過機器人的自動電話采集病人情況、分析和歸類。此外,將大模型搭載到鼠標和學習機上,云蝶科技要打開個人市場。
“今年會從兩個角度去拓展,第一個是場景,從教育拓展到醫(yī)療、工業(yè)。第二是技術(shù)深挖,目前更多是文本大模型,未來要研究多模態(tài)大模型,進行大模型和邊緣硬件的結(jié)合。”陳天說。
科大訊飛也在加碼C端應(yīng)用。目前,政府端采購比重在四至五成,C端約兩成。惲風靜認為,B端、C端場景開放才是形成商業(yè)閉環(huán)、解決大規(guī)模落地的關(guān)鍵所在。
惲風靜設(shè)想,未來學生都有自主學習AI助手。學習助手目前更多裝載在AI學習機上,未來可能安裝在PC端或家長手機端,更精準識別知識薄弱點并推送對應(yīng)教學資源、形成錯題庫,甚至協(xié)助學生進行自批改。
但不可否認,打開這個市場也有不少挑戰(zhàn),如受收費敏感性、家長輿情影響,學生個性化學習路徑和方式也不在當下學校或教育局的授課方案內(nèi)。但惲風靜仍強調(diào),“從應(yīng)用主體來看,以學生為中心、發(fā)展個性化學習是一個趨勢,C端市場的潛力將超過B端或G端?!?/p>