文|極點商業(yè)評論 楊 銘
編輯|劉珊珊
這可能是張勇全面掌舵阿里巴巴7年以來,事關未來最重要的一次“梭哈”。
“阿里巴巴所有產品將接入通義千問,進行全面改造?!币恢芮暗谋本﹪視h中心,阿里云峰會上,首次以阿里云CEO身份公開亮相的張勇,站在舞臺中央揭開了“通義千問”大模型的面紗。
這是張勇掛帥阿里云后帶來的首個待驗證作品。根據(jù)張勇宣布,天貓、釘釘、高德地圖、淘寶、優(yōu)酷、盒馬等27個阿里集團旗下APP產品,都將接入“通義千問”大模型進行全面改造。
將所有阿里產品聚合同一技術架構下,和2015年張勇剛掌舵阿里時,提出的著名“大中臺,小前臺”組織戰(zhàn)略路徑非常相似——當然如今回頭看去,“大中臺”戰(zhàn)略難言成功,早在2020年張勇就開始自我反思,并在今年史無前例的組織變革中,徹底拆分為“1+6+N”。
如果說當初推出“大中臺”是創(chuàng)新者、引領者,但在如今GPT大模型軍備競賽上,阿里云卻落后了許多,甚至成為模仿者、跟隨者。
不僅是大模型發(fā)布時間晚于國外的OpenAI、微軟、谷歌、Meta,以及國內的百度、華為、商湯,就連阿里云智能首席技術官(CTO)周靖人在峰會上提出的“云智一體”戰(zhàn)略——這一阿里云智能集團強調的戰(zhàn)略方向,其實百度早在2020年就已正式發(fā)布“云智一體”戰(zhàn)略,阿里云相比晚了整整三年。
阿里云為何此時才提出“云智一體”戰(zhàn)略?是“抄作業(yè)”還是“產業(yè)共識”?對于大模型競技場,以及云市場格局而言,又會帶來哪些影響?
01、云智一體,阿里云“抄概念”?
“智能化時代,大家都站在同一條起跑線上?!泵鎸浊四缃吁嗟臅?,張勇表示,除了阿里所有產品都值得用大模型“改造”外,阿里云將開放通義千問能力,接入B端企業(yè)打造專屬大模型。
通過張勇等阿里云高管的演講,可以一窺阿里云的勃勃野心:通過對大模型的“All in”,去押注阿里云,甚至阿里集團的未來。
眾所周知,早年占據(jù)先發(fā)優(yōu)勢的阿里,依靠電商大爆發(fā)站在中國互聯(lián)網(wǎng)巔峰。其進取心、方法論、組織能力、政委體系、使命愿景、價值觀等,影響著無數(shù)企業(yè)家和創(chuàng)業(yè)者。
這也包括2015年,張勇成為阿里集團CEO后,設立的“大中臺、小前臺”戰(zhàn)略,其目的是提升阿里集團整體效率,最大限度減少重復造車輪行為,復用已有能力——盡管“大中臺”并非阿里首創(chuàng),而是來自馬云去芬蘭參觀一家游戲公司后的取經(jīng),但“大中臺”因阿里而火爆,依然被諸多企業(yè)學習和模仿。
近年來,阿里卻創(chuàng)新乏力,不太跟得上市場、大環(huán)境的“進化迭代”,在各種戰(zhàn)場頻繁失利,市值距高峰期縮水近7成。
比如電商領域,京東、拼多多、抖音電商嚴重動搖其基本盤;支付市場,支付寶份額早被微信支付拋下;本地生活領域,從餓了么到飛豬,無力阻擋美團進攻;云計算領域,阿里云增速下滑、高管動蕩,騰訊云、百度智能云、華為云帶來的壓力重重;大文娛上,發(fā)展更是慘淡,收購失敗案例比比皆是。
種種困境下,今年3月28日,阿里迎來史上最大公司組織架構調整。對每年都會進行組織架構調整的阿里來說,調整為“1+6+N”容易,最難的是如何尋找到新的發(fā)展路徑。
當被認為是下一代互聯(lián)網(wǎng)基石,以ChatGPT為代表的AI大模型,被全球所有科技巨頭角逐時,阿里自然也不會錯過,如同張勇在峰會現(xiàn)場做出的預判:當下技術領域,正是對未來10年、20年形成重大歷史契機的關頭。
但如果與OpenAI、微軟、谷歌推出的大模型產品,甚至是百度相比,“通義千問”在外界,被不少人視為一次是“大躍進式”的面世。
按通義千問自己介紹,該項產品由阿里旗下達摩院開發(fā),誕生于2022年11月。今年2月,阿里一名資深技術專家對外爆料,達摩院正在研發(fā)阿里版聊天機器人ChatGPT,阿里隨后確認稱正在內測。4月7日,阿里云突然官宣大模型通義千問邀請測試,此后該內容顯示已被發(fā)布者刪除。4月11日,通義千問在張勇阿里云首秀中高規(guī)格問世。
嚴格來看,“通義千問”技術路線、產品形態(tài)并不存在太多創(chuàng)新。技術路線上,目前已推出產品的有類ChatGPT模式、多模態(tài)混合模式,通義千問類似百度在3月份發(fā)布的文心一言(題外話:古代知名文學理論著作就有文心雕龍、白虎通義),是一款類似ChatGPT的大型預訓練語言模型,具有廣泛的知識儲備和普適性,在訓練過程中學習大量文本數(shù)據(jù),從而具備跨領域知識和語言理解能力,適用于不同場景下的需求。
即便張勇提出,要做幫企業(yè)打造專屬GPT的通用平臺,但事實上,類似“開源”也有云企業(yè)走在前面。今年3月底,百度智能云正式推出“文心千帆”大模型平臺,面向客戶提供企業(yè)級大語言模型服務。
值得注意的是,阿里云也首次明確提出,“云智一體”是其未來戰(zhàn)略。包括阿里云智能首席技術官周靖人以《云智一體,讓智能創(chuàng)新觸手可及》進行演講,以及阿里云智能首席商業(yè)官蔡英華也表示,只有云智一體,才能讓全面產業(yè)智能化。
“云智一體”概念最早由百度提出。2020年5月,百度智能云宣布由CTO王海峰統(tǒng)領實現(xiàn)云與AI及基礎技術體系的統(tǒng)一,明確提出“云智一體”戰(zhàn)略。此后兩年間,以一年一級頻率,百度智能云完成云智一體架構從1.0到3.0的進化。
“云+AI”的融合,其實在國內外云計算公司中已不鮮見。除了百度“云智一體”,微軟提出“office+Teams+Azure”,亞馬遜2022年提出“云、數(shù)、智三位一體”,騰訊云去年提出“云智融合”,京東叫“數(shù)智供應鏈”,阿里云此前也有“云釘一體”——哪怕大家技術路線、概念含義都差不多,都會避諱采用相同的概念。
過去三年,各種場合與財報中,百度都與“云智一體”進行了強綁定。這也讓業(yè)界有所不解,阿里云為何還要在三年后,重新提出“云智一體”概念,是“抄作業(yè)”,還是“產業(yè)共識”?
02、邏輯還需自洽,實測與宣傳差距有點大
無論如何,在業(yè)內人士看來,阿里云的跟進,意味著“云智一體”的打通和融合,已經(jīng)成為產業(yè)共識,也預示著云智一體大產業(yè)機會的到來。
阿里云高管并未具體闡述云智一體具體含義。按照百度此前說法,“云”指的是以云計算為基礎,使企業(yè)在云上像使用“水電煤”一樣方便快捷地接入AI能力;“智”指的是人工智能,通過飛漿、視覺、語言和知識等全棧技術能力,滿足企業(yè)在復雜多變場景下對AI技術的需求。
簡單而言,就是“適合跑AI的云”疊加“懂場景的AI”,共同打造智能時代基礎設施。
“云智一體”概念中,核心是智。多年布局發(fā)展后,云已經(jīng)變成各行各業(yè)基礎設施。而能否提供、輸送全面、便捷高效、穩(wěn)定可靠的AI智能化服務,成為各大科技企業(yè)比拼關鍵。
營收增速下滑,在政企、個人云市場逐漸摸到天花板的阿里云,或許看到的也是同樣機會:憑借“云智一體”差異化打法,百度形成“芯片-框架-大模型-行業(yè)應用”智能化閉環(huán)路徑,幫助百度找到面向未來十年的第二增長曲線??梢哉f,“云智一體”在重塑百度過程中,相當重要。
另外,隨著中國經(jīng)濟社會數(shù)字化轉型加速,萬物互聯(lián)時代到來,“深入產業(yè)、推動產業(yè)智能化升級”明確成為各家云計算戰(zhàn)略重要部分。
這就更離不開通過“云智一體”,去承載大模型算力、解鎖AI生產力——事實上,無論是AI大模型,還是其他云、AI產品矩陣,概念雖然不同,實際上均是基于“云智一體”底座推出。文心一言、通義千問、360智腦、商湯科技如此,更多其他類ChatGPT產品都是如此。
從“極點商業(yè)”實測來看,通義千問給出的回答,整體并不算理想。
通義千問目前只提供文本生成功能,暫無法生成圖片、音頻及視頻內容。自然語言處理、中英文對話等方面,通義千問表現(xiàn)尚可,但在基本事實、時間、計算、推理等需要思考認知和邏輯理解對話上,和其他大模型對比當前差距不小。
“魚香肉絲怎么做”這種千篇一律,在各種模型被廣泛提及的問題,通義千問確實回答得不錯。但是,“極點商業(yè)”以虎撲熱門話題“三國演義為什么只注重刻畫前期混亂時代,而對最后統(tǒng)一過程輕描淡寫?”提問時,通義千問回答是“很抱歉,目前沒有掌握回答技巧”。
相比之下,文心一言則指出,稱“小說主要情節(jié)是描寫三國時期的群雄爭霸,最后統(tǒng)一過程只是其中一個小小情節(jié)。這種處理方式使得小說更加注重于描寫前期混亂時代的歷史背景和人物性格,從而更好地呈現(xiàn)三國時期的歷史和人物。”
“如何看待《生成式人工智能服務管理辦法(征求意見稿)》,擬法ChatGPT提供者應對數(shù)據(jù)來源的合法性負責”問題上,另一AI大模型給予肯定,指出是加強人工智能監(jiān)管方面的重要舉措。而通義千問依然是“沒有學會如何回答”。
涉及基本事實、時間線梳理問題上,通義千問可能還沒明白如何回答。比如,“阿里巴巴過去幾年,經(jīng)歷了哪些負面事件”提問中,通義千問回答不僅是錯誤百出,甚至出現(xiàn)多處杜撰阿里公司事實、時間情況。
“和文心一言相比,通義千問有哪些優(yōu)勢與劣勢”對話中,通義千問又犯了一個事實性的低級錯誤:稱通義千問和文心一言都是阿里巴巴推出的AI預訓練模型。
如此多的低級錯誤,不僅與阿里云率先在國內布局云計算、市場地位不符,更難以承擔阿里所有產品接入重做,為B端企業(yè)打造專屬大模型的野心——畢竟,理解基本邏輯、遵循事實是第一位,如果實測結果不理想,不但會對B端企業(yè)的數(shù)字化布局造成影響,還會帶給釘釘、天貓精靈等用戶不好的體驗。
按照阿里云的布局,智能客服是其重點應用場景——可以幫助阿里突破傳統(tǒng)電商“人找貨”局限,迭代升級為“貨找人”。并且,在酒旅、本地生活等方面,AI大模型也可以精準營銷,滿足更多消費者真實需求。
但是從實測來看,通義千問在智能客服、智能推薦等方面的表現(xiàn),距離商業(yè)化還相當于遙遠。比如“從北京來,去重慶南天湖五一旅游三天”以及“預算6000元,買什么抽油煙機和燃氣灶比較好”問題,通義千問給出的回答,對消費者來說實際參考意義非常小。
值得一提的是,這些問題是“極點商業(yè)”隨便提出,并非刻意為之。此前發(fā)布會上,張勇稱通義千問是“世界首個突破10萬億參數(shù)的AI大模型”。另外,有消息稱阿里還牽頭搭建了國內最大的AI模型服務社區(qū)“魔搭”。那么,通義千問生成式AI的邏輯能力,實際上為何如此孱弱?
03、跟風者不容易,阿里云還差些什么
這涉及“云智一體”的本質——云必須與智真正的更好融合,才能給用戶更好體驗,讓產業(yè)全面邁向智能。
答案或許很簡單,即便阿里云有強大的云計算和AI能力沉淀,但是兩者并未做到很好的融合。另外,數(shù)據(jù)參數(shù)、預訓練數(shù)據(jù)的規(guī)模和質量、數(shù)據(jù)清洗等方面的差距,也直接關系不同大模型的回答結果,這方面阿里云并不具備優(yōu)勢。
有業(yè)內人士表示,過去在一些云廠商內部,AI與云普遍處于兩個不同體系。售賣計算、存儲等資源型產品成為主要商業(yè)模式,導致AI在產業(yè)數(shù)字化轉型、智能化升級過程中無法發(fā)揮出最大價值。
從“極點商業(yè)”了解來看,阿里云就是這樣的典型案例。
很長一段時間以來,阿里的人工智能、云計算處于兩個獨立體系——在阿里內部,研究人工智能的部門一度由阿里人工智能實驗室(AI Labs)和達摩院負責,與阿里云是平行部門。
AI Labs是阿里體系內實驗室,研究語音、語言、機器視覺,后改為天貓精靈事業(yè)部,發(fā)力智能硬件。直到2021年,AI Labs團隊在架構變動中,才整體并入阿里云智能。
研發(fā)通義千問的達摩院,更是設于阿里龐大商業(yè)體系之外的一個獨立研究機構,研究范圍包括數(shù)據(jù)智能、人機自然交互等前沿技術。2021年組織架構升級中,前阿里云總裁張建峰負責的“云與科技板塊”中,包含阿里云、達摩院、釘釘、智能互聯(lián)(天貓精靈)、平頭哥五條線。彼時,雖然達摩院AI技術通過阿里云輸出,但依然是平行的“兄弟部門”。
部門平行外,對阿里云來說影響更大的是連續(xù)數(shù)年高管震蕩。去年5月,達摩院與阿里云出現(xiàn)一系列高管變動,華先勝(達摩院城市大腦實驗室負責人)、金榕(城市大腦高級研究員)、張磊(達摩院AI中心副主任)離職,肖利華(阿里云研究院院長)出走創(chuàng)業(yè)。一夜間,從王堅時期開始耕耘多年的明星項目——達摩院城市大腦實驗室,核心人員幾乎全部流失。
這讓阿里云、達摩院“元氣大傷”,并且加速兩者“分割”。根據(jù)“雷鋒網(wǎng)”此前報道,阿里云和達摩院2021底進行了人員分割,一些達摩院孵化的產品技術被劃出,而達摩院以更為獨立形式運營,承擔起10位數(shù)的營收數(shù)字挑戰(zhàn)——具體方式是,達摩院通過阿里云業(yè)務線對外進行銷售產品,兩者實行雙算模式。
今年1月初,阿里云高層再次人事大變動。張勇親自下場接替張建峰,掌舵阿里云智能總裁,周靖人擔任阿里云智能CTO。但是,隨著“大中臺”的失效,云與AI未來是否得到更好融合,成為疑問。
3月28日“史上最大”組織架構變化后,達摩院、阿里云都被歸到張勇掌舵的云智能集團旗下,但依然分屬不同業(yè)務板塊,在業(yè)務上有一定的獨立性。同時,高管依舊流失,阿里AI大牛賈揚清、阿里M6大模型前帶頭人楊紅霞也已離開。
跟大模型或AI相關核心負責人持續(xù)兩年動蕩,帶來的結果就是,阿里大模型推出遲到,產品能力實際表現(xiàn)更像”趕鴨子上架”。
有人工智能從業(yè)人士透露,一個穩(wěn)定的管理團隊,是產品、技術路線延續(xù)關鍵。該人士舉了一個例子,在百度智能云,百度CTO王海峰+百度技術委員會主席吳華+百度集團副總裁吳甜帶隊的組合,自2019年推出文心大模型ERNIE 1.0系列第一天起,就保持穩(wěn)定,才有了文心系列的持續(xù)迭代。
遺憾的是,對阿里的云和AI業(yè)務而言,頻頻組織架構調整、人員持續(xù)動蕩中,不曾擁有過百度的穩(wěn)定優(yōu)勢。
這在大模型上也有體現(xiàn)。阿里在模型迭代上比百度、華為慢了不止兩年。2019年,當百度、華為推出大模型時,阿里才開始研發(fā)。2021年,其他企業(yè)開始對大模型持續(xù)迭代,阿里才發(fā)布了語言、多模態(tài)大模型,并在去年9月合并為阿里通義大模型。
導致的結果,就是大模型數(shù)據(jù)質量、規(guī)模上的差異?!鞍⒗锎竽P团c業(yè)界或國內領先水平,存在的數(shù)據(jù)參數(shù)、預訓練數(shù)據(jù)質量和數(shù)據(jù)清洗等方面,差距明顯?!盜CT產業(yè)服務平臺“集微網(wǎng)”報道稱。
阿里云CTO周靖人此前也承認,大模型研發(fā)動輒要超千億參數(shù),其難度遠遠超出了單一算法或GPU芯片的簡單堆砌。
其實這種差距在業(yè)界預料中。百度擁有海量C端搜索數(shù)據(jù),騰訊也有十多億用戶微信生態(tài)數(shù)據(jù)沉淀,但阿里擁有最多的是垂直領域的TOB商家客戶數(shù)據(jù)。從通用大模型訓練角度來看,過于商業(yè)化的TOB商家數(shù)據(jù),并不太適合大量加入。
通義千問發(fā)布前,一位阿里云研究院高級專家坦承,在參數(shù)方面,通義千問基于PLUG的模型,參數(shù)在200億-300億,而GPT-3參數(shù)是1750億,同時其主要偏向文本,沒有涉及圖像和視頻;預訓練語料數(shù)據(jù)集方面,在質量和規(guī)模上都比不上OpenAI和百度。
這可能是阿里云“抄作業(yè)”,植入“云智一體”概念的一個原因。畢竟,如同周靖人所表示,當下的AI大模型競爭,本質上就是算力競爭。其比拼的,是一個囊括底層算力、網(wǎng)絡、存儲、大數(shù)據(jù)、AI框架、AI模型等復雜技術的系統(tǒng)性工程,需要的是AI云計算的全棧技術能力。
無論如何,伴隨AI大模型潘多拉魔盒打開,云市場GameChanger已經(jīng)到來。行業(yè)格局大洗牌難以避免,對阿里云這個昔日老大哥而言,從“領先者”變?yōu)椤案L者”,還有多少機會,去重塑行業(yè)規(guī)則?
出品人:黃槍槍