文 | 產(chǎn)業(yè)家 斗斗
編輯 | 皮爺
政企領域,似乎正在成為AI落地的又一標的。
幾個最新的動態(tài)是:新華三針對政企客戶發(fā)布私域大模型“百業(yè)靈犀”LinSeer、中國電科發(fā)布專為黨政企行業(yè)用戶服務的AIGC大模型“小可”、百應科技發(fā)布政務行業(yè)專有大模型“萬機”……百度智能云、阿里云、三六零、科大訊飛、商湯等也都在針對政企客戶,發(fā)布了相關產(chǎn)品和解決方案。
這一趨勢同樣發(fā)生在海外。有消息稱微軟正在使用其 Azure 云服務把 OpenAI 的強大的語言生成模型引入政府機構,這些模型包括 OpenAI 最新、最先進的大型語言模型(LLM)GPT-4以及 GPT-3。
然而,從國內(nèi)發(fā)布政企大模型的各大廠商的動作來看,并未有較多的落地案例。背后的原因有很多,一是產(chǎn)品發(fā)布時間短,無法及時得到較大反饋;二是由大模型引起的AI熱潮還處于爆發(fā)期,政企對于合作廠商的選擇還需考量。
除了這些因素之外,幾個關鍵的問題是,這些廠商針對政企客戶發(fā)布的AI產(chǎn)品,真的是政企所需要的嗎?再或者,于政企而言,其需要什么樣的AI產(chǎn)品與服務?
一、政企市場,“觀望”AI
“我們接觸的客戶都在探索這方面的內(nèi)容,政企會有這方面的訴求?!蹦硺I(yè)內(nèi)人士告訴產(chǎn)業(yè)家,“但對于AI大模型在政企領域的應用,大家都處于觀望+探索的階段?!?/p>
在國內(nèi),政企普遍體量大、業(yè)務復雜、定制化要求高,有著沉重的IT建設包袱,各部門、業(yè)務之間難以協(xié)同,數(shù)據(jù)壁壘也難以打破,這使得政企的數(shù)字化轉型困難重重。
而大模型可以把人與人、人與機器之間的交互過程數(shù)據(jù)完整的沉淀下來,讓它自主學習進步,持續(xù)演進。杜絕了過去的煙囪式建設,降本增效的同時還能推動政企數(shù)字化進程。
這種技術應用的趨勢,推動著諸多廠商開始將自身的TOG產(chǎn)品與大模型結合。
不過客觀來看,當下雖然深耕AI產(chǎn)業(yè)鏈的玩家眾多,但在政企領域,出于對算力、行業(yè)專業(yè)度、數(shù)據(jù)安全、國產(chǎn)化等各方因素的考量,廠商難以給出合適的AI解決方案。
AI大模型作為數(shù)字化的新基建,如何賦能行業(yè)仍需不斷探索、實踐。很多企業(yè)也在不斷進行新的嘗試。
周鴻祎曾在微博上發(fā)文表示,“大型企業(yè)或者政府要私有化大模型。即在加入公有GPT知識和能力的基礎上,再訓練一個私有的GPT,只給企業(yè)自己或客戶使用?!?/p>
與周鴻祎有相同見解的,還有新華三安全產(chǎn)品研發(fā)總監(jiān)韓小平。
“政企大模型一方面數(shù)據(jù)不能出域;一方面需要結合其業(yè)務場景數(shù)據(jù)進行喂養(yǎng)訓練,生成實際的業(yè)務場景App?!?/p>
他認為,政企大模型技術本身其實不是唯一考量的因素,更重要的是對用戶業(yè)務的理解。政企AI服務,行業(yè)Know-how仍是關鍵,沒有政企業(yè)務服務經(jīng)驗的廠商,難以結合大模型設計出個性化的解決方案。
兩人都將政企AI大模型的落地方式瞄準了私有化。
二、私有化,會是一個好的選擇嗎?
“全面禁止使用ChatGPT”這句話時不時就會喜提科技榜熱搜,最近一次的主角是三星。
具體源于三星允許半導體部門的工程師使用ChatGPT參與修復源代碼問題。但在過程當中,員工們輸入了機密數(shù)據(jù),包括新程序的源代碼本體、與硬件相關的內(nèi)部會議記錄等數(shù)據(jù)。
起初三星全面禁止使用ChatGPT,自3月11日開始才部分開放給DS部門使用,卻沒想到在短短時間內(nèi)就傳出機密外泄。
諸如此類機密數(shù)據(jù)泄漏事件,層出不窮。
在海外市場,蘋果、三星、摩根大通、花旗銀行等知名企業(yè)都曾明確表示,禁止或限制員工在工作場合使用ChatGPT等大模型產(chǎn)品。
事實上,大模型的底層邏輯是將行業(yè)數(shù)據(jù)標注出來進行深度學習,訓練出專注于某一行業(yè)的垂直模型。這也意味著,企業(yè)的數(shù)據(jù)要集成到通用大模型的數(shù)據(jù)池中。
然而,政企的數(shù)據(jù)大多涉及商業(yè)機密、個人隱私等問題,對數(shù)據(jù)安全要求甚高。
所以,數(shù)據(jù)不出域,成為關鍵。而私有大模型無疑是政企的必選項。
不過,私有化意味著需要政企客戶自己收集數(shù)據(jù)進行訓練。一般情況下,AI決策的及時性和準確性,取決于數(shù)據(jù)質(zhì)量、數(shù)量以及算力。這意味著輸入預訓練模型的數(shù)據(jù)維度、數(shù)量越多,質(zhì)量越高,才能真正發(fā)揮大模型真正價值。
一個有爭議的點是,專業(yè)廠商打造的私有模型,比起通用大模型的能力,能否滿足政企需求。
3月30日,彭博社創(chuàng)始人布隆伯格發(fā)布了一片論文,即BloombergGPT: A Large Language Model for Finance。
在論文中,介紹了其以模3630億token的金融領域數(shù)據(jù)集以及3450億token的通用數(shù)據(jù)集訓練出來的金融大語言模型。并進行金融領域評估與通用領域評估。
結果顯示,在金融領域任務上,該模型綜合表現(xiàn)最好;在通用任務上,該模型的綜合得分同樣優(yōu)于相同參數(shù)量級的其他模型,并且在某些任務上的得分要高于參數(shù)量更大的模型。
這意味著,基于專業(yè)領域語料訓練的大模型,在領域內(nèi)的理解要超過通用大模型。
一個啟示是,在其他特定領域,也可以開發(fā)專用的大語言模型,并且效果可能比通用大模型更好。
然而,這個評估實驗的結論仍無法代表所有行業(yè),有些問題仍需要被正視,例如中外金融數(shù)據(jù)維度、質(zhì)量其實有著較大的差距,該金融模型作為第一個行業(yè)模型,更換不同維度、質(zhì)量的數(shù)據(jù),能否保持其結論的準確性,還未得知。
另外,除政務系統(tǒng)、城市大腦以及金融等數(shù)據(jù)敏感的政企場景,其他終端場景,通用大模型的語料數(shù)據(jù)仍有很大優(yōu)勢。
所以,對于政企而言,其需要的AI服務是能在保證數(shù)據(jù)安全的同時,還可以能集成通用大模型作為能力補充。
三、政企大模型,亦需“群戰(zhàn)”
術業(yè)有專攻,大模型能力同樣如此。
在政務AI大模型應用方面,周鴻祎曾直言,預測未來中國不會只有一個大模型,每個城市、每個政府部門都會有自己的專有大模型。
信創(chuàng)化的浪潮下,全技術棧的國產(chǎn)化已經(jīng)成為服務政企客戶的準入門檻。所以對于政企而言,信創(chuàng)生態(tài)能力成為其選擇廠商的重要標準。
目前來看,能實現(xiàn)全技術棧國產(chǎn)化的AI大模型廠商屈指可數(shù)。能否吸引更多信創(chuàng)伙伴成為關鍵,取長補短,或將實現(xiàn)雙贏。
此外,在國產(chǎn)化的基礎上,不同的場景應用,也需要與不同的廠商合作,例如互聯(lián)網(wǎng)云廠商在終端軟件應用的優(yōu)勢;運營商的網(wǎng)絡優(yōu)勢;華為在芯片、系統(tǒng)上的優(yōu)勢。
除了基于客戶需求的合作,還有來自算力等資源稀缺所帶來的壓力。
AI新一輪熱潮襲來,服務器需要配備大量GPU/NPU/FPGA/ASIC等芯片以支持高算力,但就目前來看,算力不僅價格高昂且資源緊張。
目前,支撐包括ChatGPT大模型在內(nèi)的95%用于機器學習的芯片都是英偉達的A100(或者國內(nèi)使用的替代產(chǎn)品A800),該芯片的單價超過1萬美元。此外,英偉達最新一代的H100芯片的性能也遠超A100,但價格也更高,約合25萬元人民幣。
而在取長補短的AI大模型產(chǎn)業(yè)生態(tài)下,將大幅度杜絕模型的重復搭建、實現(xiàn)數(shù)據(jù)的重復利用,大大節(jié)約算力資源利用率。同時還可以減少政企客戶的AI部署成本。
所以,對于布局政企大模型的廠商而言,在私有化的前提下,通過開源、API接口等形式,以通用大模型和客戶或自身集成的數(shù)據(jù),幫助客戶調(diào)教模型,形成定制化的AI產(chǎn)品,或將推動政企大模型快速落地。
一些廠商也正在驗證了這種路徑的可行性。
例如中國電科面向黨政企,提供“通用智能模型大循環(huán) + 行業(yè)智能模型小循環(huán)”雙循環(huán)、“模型訓練 + 測試評估 + 場景精調(diào) + 可信增強”四階段的行業(yè)應用新范式。
再比如,新華三面向政企發(fā)布的百業(yè)靈犀LinSeer既支持“私域大模型+新華三ICT基礎架構”的模式保障數(shù)據(jù)安全,也支持“客戶自選大模型+新華三ICT基礎架構”的模式滿足多種需求。
政企AI服務的走向逐漸清晰,即政企或許更需要“自助餐”式的服務模式??蛻艨梢赃x擇適合自身需求的芯片、模型技術方、數(shù)據(jù)集成方、軟件廠商等。
經(jīng)歷過多次寒冬的AI,能否抓住這次時代的機遇,仍需時間來驗證。