文 | 智東西編輯部
智東西3月16日報道,剛剛,百度推出新一代大語言模型文心一言(ERNIE Bot),即日起開啟測試,同時宣布已有超650家伙伴加入文心一言生態(tài),打響全球互聯(lián)網(wǎng)大廠應戰(zhàn)ChatGPT的第一槍。
文心一言能做什么?百度創(chuàng)始人兼董事長李彥宏在現(xiàn)場進行的激情演示,圍繞文學創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理邏輯推算、中文理解、多模態(tài)生成五方面大秀“肌肉”:能幫劉慈欣續(xù)寫《三體》,會幫公司寫新聞,讀得懂“洛陽紙貴”的古文梗,解得了難倒ChatGPT的“雞兔同籠”問題,還能分分鐘幫智能交通峰會生成海報和宣傳視頻……
▲百度創(chuàng)始人兼董事長李彥宏在演示文心一言
李彥宏稱,文心一言對個人的改變也會是巨大的,有機構(gòu)預測,到2030年,人工智能可以將每一個知識工作者的生產(chǎn)力提高4倍以上。很多人的工作性質(zhì)會發(fā)生不可逆轉(zhuǎn)的改變。
會上,百度CTO王海峰宣布,3月16日起,首批用戶即可通過邀請測試碼在文心一言官網(wǎng)體驗產(chǎn)品;百度智能云即將面向企業(yè)客戶開放文心一言API接口調(diào)用服務,3月16日起正式開放預約。這意味了文心一言將立馬接受廣大受眾的真實測評。
▲百度CTO王海峰在講解文心一言相關技術
李彥宏說:“十月懷胎,一朝分娩”。那么文心一言究竟長什么樣?能為各行各業(yè)帶來什么樣的變化?背后又有什么樣的技術邏輯和產(chǎn)業(yè)真相?智東西在文心一言發(fā)布現(xiàn)場為大家?guī)淼谝皇窒ⅰ?/p>
01.文心一言初體驗,五大能力現(xiàn)場演示
一開場,李彥宏就談道自己近期不斷被問,為什么現(xiàn)在發(fā)布文心一言,真的Ready了嗎?
他說,實際上百度過去十幾年一直堅持AI投入,2019年就推出了第一個版本文心大模型,此后每年更新一代。文心一言是百度多年努力的自然延續(xù)。
在簡短介紹了文心一言的誕生背景后,李彥宏迅速進入正題,他從文學創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理邏輯推算、中文理解、多模態(tài)生成五大方面進行了演示。1、文學創(chuàng)作:給《三體》寫總結(jié),還能幫大劉寫一個續(xù)集
首先文心一言展示了文學創(chuàng)作能力,《三體》是非常知名的科幻小說,李彥宏與文心一言就以下五個問題進行了五輪對話(為了方便讀者朋友看清,我們對動圖做了降速處理,文心一言實際的碼字速度飛快~):
《三體》的作者是哪里人?可以總結(jié)一下《三體》的核心內(nèi)容嗎?如果要續(xù)寫的話,可以從哪些角度出發(fā)?
如何從哲學的角度續(xù)寫?
電視劇《三體》演員都有誰?于和偉和張魯一有哪些共同點?于和偉和張魯一誰更高?
可以看到,這一演示體現(xiàn)了文心一言的總結(jié)、分析能力,以及內(nèi)容創(chuàng)作生成能力。
大家知道,生成式AI在回答事實性問題時有時會出錯,我們看到文心一言在幾個實時信息問題的回答上是正確的。李彥宏說,文心一言延續(xù)了百度知識增強的大模型理念,大幅度提升了事實性問題的準確率。而“于和偉和張魯一有哪些共同點”等問題難度更高,體現(xiàn)的是文心一言的推理能力。2、商業(yè)文案創(chuàng)作:給公司起名、腦暴Slogan、秒寫新聞稿
再來試試文心一言在商業(yè)文案創(chuàng)作方向的能力,以常見的公司起名字、寫slogan、寫新聞稿為例。李彥宏向文心一言提了以下問題:
如果要成立一個用大模型服務中小企業(yè)數(shù)字化升級的科技服務公司,可以起個什么公司名?
數(shù)智云圖這個名稱不錯,給我起一個公司的服務Slogan,表達共贏的概念。
幫我生成一篇公司成立的新聞稿,數(shù)智云圖以共贏的服務理念用大模型服務中小企業(yè)數(shù)字化升級。字數(shù)600字。
剛才的演示,展現(xiàn)了文心一言連續(xù)三次內(nèi)容創(chuàng)作生成。
AI要寫好一篇稿子,除了需要準確理解我們的意圖,還要有清晰的表達能力。這背后有一個基礎,就是龐大的數(shù)據(jù)規(guī)模。人類常說“讀萬卷書”,而AI可以說是 “讀書破千億卷”。文心一言大模型的訓練數(shù)據(jù)就包括,萬億級網(wǎng)頁數(shù)據(jù),數(shù)十億的搜索數(shù)據(jù)和圖片數(shù)據(jù),百億級的語音日均調(diào)用數(shù)據(jù),以及5500億事實的知識圖譜等,這讓百度在中文語言的處理上,能夠處于獨一無二的位置。
有研究表明,數(shù)據(jù)規(guī)模足夠大,參數(shù)達到千億級,大模型就可能發(fā)生“智能涌現(xiàn)”,即使在沒有專門訓練過的領域,也能涌現(xiàn)出知識理解和邏輯推理能力。3、數(shù)理邏輯推算:搞定“雞兔同籠”,ChatGPT曾在此“翻車”
我們接下來看文心一言對數(shù)理邏輯推算任務做的怎么樣。
雞兔同籠是鍛煉人類邏輯思維的經(jīng)典題,這個對生成式AI同樣有挑戰(zhàn)。李彥宏問了以下幾個問題:
下面我們來玩一個雞兔同籠的游戲。1只雞有2只腳1個頭,1只兔子有4只腳1個頭。那么,如果有一個籠子里有9個頭,40只腳,應該有多少只雞,多少只兔子?
對于第一道題,文心一言經(jīng)過演算,認為可能是題出錯了。于是李彥宏又重新問了一遍,文心一言不但給出了正確結(jié)果,還詳細給出解題步驟。
可以看出,文心一言能理解題意,并有正確的解題思路,進而像學生做題一樣,按正確的步驟,一步步算出正確答案。
李彥宏說,文心一言已具備了一定的思維能力,能夠?qū)W會數(shù)學推演及邏輯推理這類相對復雜任務。當然,現(xiàn)階段準確率還不是100%,我們還需要給它更多的時間來學習和成長。4、中文理解:讀懂“洛陽紙貴”、解釋經(jīng)濟理論、寫藏頭詩
前面三個例子,李彥宏演示了大語言模型比較常見的優(yōu)勢和能力。下面是關于文心一言的中文理解能力,主要問題如下:
“洛陽紙貴”是什么意思?當時洛陽的紙到底有多貴?
這個成語在現(xiàn)在的經(jīng)濟學原理里,對應的理論是什么?用洛陽紙貴四個字寫一首藏頭詩。
“洛陽紙貴”,“藏頭詩”,這很考驗AI對中文和中國文化的理解。作為扎根于中國市場的大語言模型,文心一言盡力展示了在中文上的優(yōu)勢。
同時李彥宏坦言,文心一言目前對英文語種、代碼場景的訓練還不夠多,表現(xiàn)還不夠好,接下來百度還要加緊訓練,不斷完善這些能力。
5、多模態(tài)生成:秒做海報和視頻,還能講四川話
下面是多模態(tài)生成方向的案例,要知道ChatGPT在升級GPT-4之后才具備多模態(tài)功能,文心一言本次也對次進行了演示。李彥宏的主要要求如下:
請為2023世界智能交通大會創(chuàng)作一張海報。你認為智能交通最適合哪個城市發(fā)展?請用四川話將以上內(nèi)容講出來。
請將以上內(nèi)容生成視頻。于是文心一言生成了以下視頻:
可以看到,在這一段演示中,文心一言生成了文本、圖片、音頻和視頻,展示了多模態(tài)生成能力。
李彥宏稱,目前的版本已經(jīng)能夠生成文字、圖片和語音。生成視頻因為成本比較高,還沒有對所有用戶開放,未來百度會逐步接入。但是熟悉百家號創(chuàng)作的朋友,應該都體驗過這個功能了,每天有幾萬篇文章通過這個能力轉(zhuǎn)成視頻內(nèi)容在百度分發(fā)。多模態(tài)是生成式AI一個明確的發(fā)展趨勢,未來文心一言的多模態(tài)生成能力也會不斷提升。
02.650家伙伴加入文心一言生態(tài)背后六大技術解讀
會上,百度CTO王海峰宣布,3月16日起首批用戶即可通過邀請測試碼,在文心一言官網(wǎng)體驗產(chǎn)品。百度智能云即將面向企業(yè)客戶開放文心一言API接口調(diào)用服務,3月16日起正式開放預約。同時,王海峰公布了文心產(chǎn)業(yè)級知識增強大模型全景圖。
王海峰介紹了文心一言的六項核心技術,分別是有監(jiān)督精調(diào)、人類反饋的強化學習(RLHF)、提示、知識增強、檢索增強、對話增強。
其中前三個都是大型語言模型普遍具備的能力,后面三個技術,則有助于解決AI“胡言亂語”的問題。
知識增強包括知識內(nèi)化和知識外用,把5500億知識圖譜的事實疊加到生成式大模型,不僅將知識融入模型參數(shù),而且模型可以用外部知識,能夠檢查生成內(nèi)容與事實是否相符。
檢索增強將檢索系統(tǒng)與生成模型結(jié)合,先檢索內(nèi)容,再用有用的部分進行生成。對話增強涉及記憶機制、上下文理解、對話規(guī)劃等技術積累。
李彥宏說,剛才展示的這些例子,如果在其他模型上試,很容易出錯,但在文心一言上試都對了。他昨天問文心一言“怎么看GPT-4”,文心一言非常及時地總結(jié)出來相關信息和內(nèi)容。
根據(jù)官方數(shù)據(jù),自2月7日以來,已有650家伙伴宣布加入文心一言生態(tài),AI市場有望迎來迎來新一波爆發(fā)。
以文心一言為代表的大模型產(chǎn)品的誕生,也有望更深刻的改變IT領域的技術范式。
李彥宏談道,傳統(tǒng)IT是“芯片層-框架層-應用層”三層,進入AI時代,IT技術棧變?yōu)榱诵酒瑢?框架層-模型層-應用層四層,以后應用層的搜索、智能信控等各種應用將基于模型來進行開發(fā)。生成式AI是非常耗費算力,四層架構(gòu)之間相互協(xié)同,不斷優(yōu)化將使得效率大大提升,降低成本。尤其是框架層和模型層的協(xié)同,百度在過去幾個月體會到了其中收益。
03.生成式AI開啟新型云計算帶來三大產(chǎn)業(yè)機會
李彥宏認為,生成式AI將催生新產(chǎn)品、新業(yè)態(tài),會有很多創(chuàng)業(yè)和投資機會。
具體來說,生成式大模型的問世會帶來新型云計算、行業(yè)模型精調(diào)、應用開發(fā)三大方面機會。
第一類是新型云計算公司,其主流商業(yè)模式從IaaS(基礎設施即服務)變?yōu)镸aaS(模型即服務)。文心一言,將根本性地改變云計算行業(yè)的游戲規(guī)則。之前企業(yè)選擇云廠商更多看算力、存儲等基礎云服務。未來,更多會看框架好不好、模型好不好,以及模型、框架、芯片、應用這四層之間的協(xié)同。
第二類是進行行業(yè)模型精調(diào)的公司,這是通用大模型和企業(yè)之間的中間層,他們具有行業(yè)Know how,調(diào)用通用大模型能力,為行業(yè)客戶提供解決方案。文心大模型已經(jīng)在電力、金融、媒體等領域,發(fā)布了10多個行業(yè)大模型。在各行各業(yè)都有機會。
第三類是基于大模型底座進行應用開發(fā)的公司,即應用服務提供商。今天,基于文本生成、圖像生成、音頻生成、視頻生成、數(shù)字人、3D等場景,已經(jīng)涌現(xiàn)出很多創(chuàng)業(yè)明星公司,他們可能就是未來的新巨頭。這里面的機會非常多,可以說每家企業(yè)在現(xiàn)在這個階段都有機會。
李彥宏說:“我們相信,人工智能會徹底改變我們今天的每一個行業(yè)。”AI的長期價值,對各行各業(yè)的顛覆性改變,才剛剛開始。未來,將會有更多的殺手級應用、現(xiàn)象級產(chǎn)品出現(xiàn),將會有更多的里程碑事件發(fā)生。
文心一言發(fā)布之后,將建立起真實用戶反饋、開發(fā)者調(diào)用和模型迭代之間的飛輪,效果會迅速提升,給你“士別三日,當刮目相看”的驚喜。
李彥宏認為,文心一言對每一個企業(yè)和每一個人都可能產(chǎn)生巨大的影響,文心一言的定位是一個基礎大模型,在上面可以開發(fā)出適合千行百業(yè)的行業(yè)大模型。它不僅僅會影響到搜索和互聯(lián)網(wǎng)公司,由于超強的自然語言理解、表達、推理能力,讓任何一家公司離自己的客戶更近,從而做出更好的客戶體驗,建立更強的競爭優(yōu)勢。
04.結(jié)語:國產(chǎn)類ChatGPT密集開測生成式AI熱潮爆發(fā)
隨著百度文心一言大模型正式發(fā)布,其與此前清華技術成果轉(zhuǎn)化的公司智譜AI推出了基于千億基座模型的ChatGLM、復旦大學自然語言處理實驗室的對話式AI模型MOSS一起,推動國產(chǎn)類ChatGPT生成式AI熱潮爆發(fā)。
李彥宏坦言:“從文心一言的表現(xiàn)看,某種程度上它具有了對人類意圖的理解能力,回答的準確性、邏輯性、流暢性,都逐漸接近人類水平。但整體而言,這類大語言模型還遠未到發(fā)展完善的階段,它們有時候會有很驚艷的表現(xiàn),但不少場景下,細究起來還有明顯的bug,進步空間很大。未來這段時間文心一言有望飛速發(fā)展,通過定向微調(diào),可以在百度內(nèi)外部各類產(chǎn)品上逐步展示出驚人的親和力,讓每一個產(chǎn)品離自己的用戶和客戶更近?!?/p>
生成式AI已成為當下AI領域的一個兵變必爭之地,技術的產(chǎn)業(yè)化落地和商業(yè)應用將成為決勝關鍵。在國外,微軟旗下OpenAI的ChatGPT、谷歌旗下的PaLM都已開放API,面向辦公協(xié)同工具、社交文娛、智能終端等行業(yè)推動落地集成,這在國內(nèi)也有望掀起一陣趨勢,從而帶來算法、算力及數(shù)據(jù)等多個產(chǎn)業(yè)鏈環(huán)節(jié)的爆發(fā)。