文|新摘商業(yè)評論 南溟
華為終于又透露了大模型的消息。
大模型新產(chǎn)品將于今年7月初發(fā)布,據(jù)了解,這款大模型產(chǎn)品是一款多模態(tài)千億級大模型產(chǎn)品,其客戶主要面向To B/G政企端客戶。
這也讓華為在大模型領(lǐng)域的野心逐漸擺上臺面。
天眼查搜索發(fā)現(xiàn),華為申請注冊了兩枚“HUAWEI NETGPT”商標,國際分類為科學儀器、網(wǎng)站服務(wù),當前商標狀態(tài)為申請中。更有意思的是,華為已成功注冊多枚“盤古”“PANGU”商標。
華為向媒體表示了,最新的大模型不會有“盤古Chat”此類命名,也不“對標”業(yè)界產(chǎn)品。
一系列的大動作讓華為在大模型領(lǐng)域的布局從幕后走到了臺前,面對國內(nèi)大模型領(lǐng)域火熱開賽,阿里,百度,科大訊飛,360等大廠已領(lǐng)先一步參與其中。相比之下,華為攜此前多次提到的盤古亮相,背后也并非一日之功,從云計算技術(shù),到產(chǎn)業(yè)鏈支持,華為參與大模型競爭,也有其自身優(yōu)勢。
華為躍躍欲試大模型
華為大模型最早于2020年11月在華為云內(nèi)部立項成功,2021年4月對外發(fā)布,2022年4月,其升級到2.0版本,目前,AI 大模型中的 NLP 大模型、CV 大模型以及科學計算大模型(氣象大模型)均已被標記為即將上線狀態(tài)。
對于華為盤古大模型,華為內(nèi)部團隊確立了三項最關(guān)鍵的核心設(shè)計原則:一是模型要大,可以吸收海量數(shù)據(jù);二是網(wǎng)絡(luò)結(jié)構(gòu)要強,能夠真正發(fā)揮出模型的性能;三是要具有優(yōu)秀的泛化能力,可以真正落地到各行各業(yè)的工作場景。
據(jù)了解,華為盤古大模型是首個千億參數(shù)中文預(yù)訓練大模型,CV 大模型則首次達到 30 億參數(shù)。盤古 CV 大模型業(yè)界最大 CV 大模型、首次實現(xiàn)兼顧判別與生成能力、在 ImageNet 上小樣本學習能力上的業(yè)界第一。
CV大模型是指用于計算機視覺任務(wù)的大型深度學習模型,通常采用卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)等深度學習算法來實現(xiàn)。
CV大模型的思路是將輸入圖像轉(zhuǎn)換為輸出結(jié)果,例如識別圖像中的物體類別或位置等信息。
近年來,隨著深度學習技術(shù)的發(fā)展和計算能力的提升,CV大模型在計算機視覺領(lǐng)域取得了很多重要成果,例如圖像分類、目標檢測、圖像分割等任務(wù)。
據(jù)華為云官方發(fā)布的消息,目前華為“盤古系列 AI 大模型”基礎(chǔ)層主要包括 NLP 大模型、CV 大模型、以及科學計算大模型等,上層則是與合作伙伴開發(fā)的華為行業(yè)大模型。
群雄逐鹿大模型云計算為AIGC開路
隨著去年ChatGPT的出現(xiàn),大模型對科技社會的顛覆意義讓整個社會陷入“AI焦慮”,焦慮之余,隨之而來的,是國內(nèi)各家大廠紛紛加入大模型戰(zhàn)隊,與其焦慮不如先人一步加入其中。
百度,阿里巴巴,科大訊飛等多家大廠都相繼發(fā)布了自己的大模型,而云作為最前端可以售賣的TOB產(chǎn)品,顯得更為直接。
在百度文心一言發(fā)布兩個多月之后,5月29日,李彥宏宣布百度很快會正式推出文心一言(ERNIE Bot)大模型3.5版本。與此同時,百度還宣布將設(shè)立規(guī)模為10億元的文心投資基金,面向AIGC領(lǐng)域潛力股創(chuàng)企,提供涵蓋資金、技術(shù)、業(yè)務(wù)資源在內(nèi)的全面扶持,持續(xù)關(guān)注AI領(lǐng)域優(yōu)質(zhì)創(chuàng)業(yè)團隊。
李彥宏在演講中表達了對中國大模型領(lǐng)域發(fā)展前景的看法,在他看來:“未來將產(chǎn)生三大產(chǎn)業(yè)機會,分別為新型云計算公司、進行行業(yè)模型精調(diào)的公司,以及基于大模型底座進行應(yīng)用開發(fā)的公司,即應(yīng)用服務(wù)提供商?!?/p>
5月6日,科大訊飛正式對外發(fā)布訊飛星火認知大模型??拼笥嶏w董事長劉慶峰提出未來五年奮斗目標:達到十億用戶、實現(xiàn)千億收入、帶動萬億產(chǎn)業(yè)生態(tài)。
阿里巴巴的通義千問同樣來勢兇猛,不到兩個月的時間,阿里云已經(jīng)對外發(fā)布了通義千問和通義聽悟大模型,在自然語言生成和AI音視頻賽道火速布局,此外像天貓精靈和釘釘應(yīng)用層面的產(chǎn)品也紛紛通過云的底層來實現(xiàn)更好地運轉(zhuǎn)。
大廠動態(tài)頻頻,大模型背后依靠的,是算力,算法和數(shù)據(jù)的支持,這一切,最終都要歸功于大廠云計算的實力。顯然,目前百度,阿里大模型都在為云計算鋪路。
大廠逐鹿大模型時代下,對云計算提出了更多元的要求,云計算的技術(shù)架構(gòu)以及產(chǎn)品布局也會隨著各家大廠大模型產(chǎn)品的調(diào)整而進行相應(yīng)的適配和改變。
同樣大模型的熱點,也為云計算TOB帶來了流量和關(guān)注點,讓原本沒有那么性感的產(chǎn)品讓外界有了更深的認識。
AIGC的發(fā)展需要海量的數(shù)據(jù)資源做支撐,大模型算力需求的算力底座計算資源,網(wǎng)絡(luò)連接,數(shù)據(jù)存儲以及模型管理需求等,都需要云計算做支持。
以ChatGPT為例,其發(fā)布后一度引來巨量訪問,使得其多次出現(xiàn)宕機,這足以見得,大模型對于穩(wěn)定性的需求之高。從算力上來看,云計算能夠借助通用服務(wù)器和專屬硬件為大模型提供更優(yōu)化的計算資源的調(diào)度和管理,以保證良好的運力穩(wěn)定性。
縱觀國內(nèi)已經(jīng)入局大模型的大廠,無一不是在云計算領(lǐng)域有著超前技術(shù)優(yōu)勢的企業(yè)。
攜盤古入場華為新大模型亮點何在
對于中國的大模型,李彥宏認為,中國會有自己的生態(tài)系統(tǒng),擁有自己的大語言模型和基礎(chǔ)模型。中國會出現(xiàn)至少一個、也可能是兩個或三個基礎(chǔ)大模型,可以支持人們開發(fā)各種AI原生應(yīng)用。
基礎(chǔ)大模型是基于更廣泛更全面生態(tài)系統(tǒng)的支持上的,需要強大的數(shù)據(jù)和算力支持。
這一點,華為大模型也有其獨特的優(yōu)勢。
據(jù)華為云官方數(shù)據(jù),目前,華為云AI已在各行業(yè)落地了1000+項目,在大模型方面,華為云的AI技術(shù)多元化項目提供海量數(shù)據(jù)支持,同時,華為云自身有多年的市場積累,在用戶群體的拓展,市場應(yīng)用方面具備深厚的積淀。
從技術(shù)層面來看,華為沖擊大模型的優(yōu)勢同樣突出,據(jù)了解,華為盤古大模型涉及千億參數(shù),為此,華為團隊調(diào)用了超過2000塊的昇騰910,花費2個月時間訓練。昇騰 910是業(yè)界算力最強的AI處理器,基于自研華為達芬奇架構(gòu)3D Cube技術(shù),實現(xiàn)業(yè)界最佳AI性能與能效。
在產(chǎn)業(yè)鏈建設(shè)方面,華為投入大量的財力,以及技術(shù)支持,2022年,華為研發(fā)投入1615億元,約占全年收入的25.1%,管理層表示研發(fā)投資是華為構(gòu)建長期、持續(xù)競爭力的核心。
此前,華為宣布實現(xiàn)自主可控的 MetaERP 研發(fā),并完成對舊ERP系統(tǒng)的替換。6月5日,有消息稱,華為將于6月7日推出全新GaussDB數(shù)據(jù)庫產(chǎn)品,是國內(nèi)首個軟硬協(xié)同全棧自主的數(shù)據(jù)庫。
華為常務(wù)董事、華為云CEO張平安曾表示:“人工智能正對所有行業(yè)產(chǎn)生深遠的影響,我們認為,AI大模型將會重塑各個行業(yè)的數(shù)字化轉(zhuǎn)型和智能升級?!?/p>
華為盤古大模型的問世和發(fā)展,勢必會給整個帶來新的血液,與此同時,華為想要在大模型領(lǐng)域占得領(lǐng)先之地,還需要華為云在技術(shù)、人員、財力等多方面源源不斷的貢獻力量。