文|獵云網(wǎng) 王非
“全力以赴、堅(jiān)決擁抱”,雷軍為小米大模型發(fā)展定調(diào)。
繼任命欒劍擔(dān)任技術(shù)委員會(huì)AI實(shí)驗(yàn)室大模型團(tuán)隊(duì)負(fù)責(zé)人后,雷軍于4月14日晚間在微博發(fā)文,首度談及小米對(duì)大模型和AIGC的看法。
除了定下發(fā)展基調(diào),雷軍還透露,對(duì)于大模型,小米“正在研發(fā)一些有趣的技術(shù)和產(chǎn)品,等我們打磨好了,再給大家展示。”
事實(shí)上自3月份以來(lái),各路互聯(lián)網(wǎng)大佬和技術(shù)大牛,以及BAT華為360商湯等大廠密集發(fā)聲,雷軍此番表態(tài),可謂“雖遲但到”。
值得注意的是,雷軍在微博提及小米,在AI領(lǐng)域有AI實(shí)驗(yàn)室、小愛(ài)同學(xué)、自動(dòng)駕駛等團(tuán)隊(duì)。
于是,小米在大模型領(lǐng)域的發(fā)力方向,可窺一二。
來(lái)源:微博截圖
出身微軟,欒劍成小米大模型領(lǐng)頭人
4月14日,據(jù)澎湃新聞報(bào)道,小米集團(tuán)發(fā)布內(nèi)部郵件,任命欒劍擔(dān)任技術(shù)委員會(huì)AI實(shí)驗(yàn)室大模型團(tuán)隊(duì)負(fù)責(zé)人,向技術(shù)委員會(huì)副主席、AI實(shí)驗(yàn)室主任王斌匯報(bào)。
公開(kāi)資料顯示,欒劍現(xiàn)任小米技術(shù)委員會(huì)AI實(shí)驗(yàn)室語(yǔ)音生成團(tuán)隊(duì)負(fù)責(zé)人,曾任東芝研究院研究員、微軟工程院高級(jí)語(yǔ)音科學(xué)家、微軟小冰首席語(yǔ)音科學(xué)家及語(yǔ)音團(tuán)隊(duì)負(fù)責(zé)人等職位。
目前,網(wǎng)絡(luò)上關(guān)于欒劍的報(bào)道并不多。在知乎上,他的個(gè)人標(biāo)簽為“小米NlP技術(shù)高級(jí)總監(jiān)”。
2018年5月,知乎官方發(fā)布《我們和微軟小冰發(fā)了一首單曲 | 為「新知青年」而唱》一文后,欒劍本人還贊同了該文章。
據(jù)SegmentFault報(bào)道,2019年11月,在微軟小冰的一場(chǎng)內(nèi)部WorkShop上,時(shí)任微軟小冰首席語(yǔ)音科學(xué)家欒劍與另外兩位“首席科學(xué)家”共同分享了微軟小冰當(dāng)年在自然語(yǔ)言處理、語(yǔ)音學(xué)研究、多模態(tài)生成等領(lǐng)域研究進(jìn)展。
來(lái)源:SegmentFault
彼時(shí),欒劍以《小冰唱歌技術(shù)進(jìn)展》為題演講。他提到,微軟小冰團(tuán)隊(duì)“在語(yǔ)音合成領(lǐng)域大方面的東西可能已經(jīng)解決,但語(yǔ)義理解方面,可能還需要通過(guò)長(zhǎng)時(shí)間的積累和技術(shù)的發(fā)酵。”最終,團(tuán)隊(duì)找到了一個(gè)更有挑戰(zhàn)性的課題——唱歌。做唱歌主要有三個(gè)原因:第一個(gè)原因,唱歌的門(mén)檻比說(shuō)話高;第二唱歌的情感表達(dá)更加豐富激烈;第三它是一個(gè)很重要的娛樂(lè)形式。
值得一提的是,欒劍還在現(xiàn)場(chǎng)分享中提到,深度學(xué)習(xí)其實(shí)在上世紀(jì)90年代就火過(guò)一陣,但那個(gè)時(shí)候卻沒(méi)有取得像今天這么大的成果。他認(rèn)為主要有兩個(gè)主要的原因:
1、因?yàn)橛布夹g(shù)的方法,當(dāng)時(shí)的算力還不夠,現(xiàn)在有GPU,而且GPU還在不斷地升級(jí),所以它的計(jì)算能力在提高;2. 另外一個(gè)很重要的支撐就是數(shù)據(jù),現(xiàn)在有大數(shù)據(jù)的支持,所以才能夠把深度學(xué)習(xí)做得這么好。
隨后,欒劍就從微軟跳槽到了小米,具體時(shí)間不詳。
北京大學(xué)現(xiàn)代信號(hào)與數(shù)據(jù)處理實(shí)驗(yàn)室于2021年5月發(fā)布的文章顯示,2020年5月,小米人工智能部語(yǔ)音技術(shù)總監(jiān)王育軍及其團(tuán)隊(duì)?wèi)?yīng)邀來(lái)校舉行北大&小米技術(shù)交流會(huì)。當(dāng)天,欒劍博士的匯報(bào)題目是《語(yǔ)音生成技術(shù)》,介紹了語(yǔ)音合成的基本概念,并就該領(lǐng)域的關(guān)鍵問(wèn)題展開(kāi)討論。
來(lái)源:北京大學(xué)現(xiàn)代信號(hào)與數(shù)據(jù)處理實(shí)驗(yàn)室
今年以來(lái),ChatGPT爆火后,欒劍也在4月份接連在知乎發(fā)布兩篇文章,分享自己的感悟。
作為“一個(gè)AI領(lǐng)域近20年的從業(yè)者”,欒劍在4月5日發(fā)布的《一個(gè)關(guān)于ChatGPT能力涌現(xiàn)成因的猜想》一文中認(rèn)為,產(chǎn)生“涌現(xiàn)”能力的三要素可總結(jié)為:
大數(shù)據(jù):如果數(shù)據(jù)不夠豐富,就可能也沒(méi)必要挖掘出“概念”與“常識(shí)”;大模型:如果參數(shù)量不夠多,模型沒(méi)有足夠的空間去完成“層級(jí)結(jié)構(gòu)”;多任務(wù):如果任務(wù)比較單一,模型沒(méi)有動(dòng)力去做結(jié)構(gòu)調(diào)整,“平行結(jié)構(gòu)”成為模型的“偷懶”選擇。
隨后在4月8日發(fā)布的《hatGPT的訓(xùn)練過(guò)程對(duì)“雞娃”的啟示》一文中,欒劍“通過(guò)類(lèi)比,嘗試定性地探討兒童教育可以從ChatGPT的訓(xùn)練過(guò)程中得到哪些啟示”。
出身微軟,擁有豐富的AI語(yǔ)音技術(shù)儲(chǔ)備和工作經(jīng)歷,如今擔(dān)任小米大模型團(tuán)隊(duì)負(fù)責(zé)人后,欒劍如何發(fā)揮自身優(yōu)勢(shì),又能與“小愛(ài)同學(xué)”碰撞出怎樣的火花,我們也只能拭目以待。
內(nèi)有千人AI團(tuán)隊(duì),外有金山云護(hù)駕
當(dāng)?shù)貢r(shí)間4月14日,英國(guó)《金融時(shí)報(bào)》援引知情人士消息報(bào)道,特斯拉CEO埃隆 馬斯克(Elon Musk)正在組建人工智能初創(chuàng)公司,為了與ChatGPT的研發(fā)公司OpenAI展開(kāi)競(jìng)爭(zhēng)。
作為中美互聯(lián)網(wǎng)圈,最受矚目的“網(wǎng)紅創(chuàng)始人”。馬斯克都來(lái)了,雷軍還會(huì)遠(yuǎn)嗎?
巧合地是,兩人都是在4月14日,針對(duì)大模型,顯露出自己的布局。
事實(shí)上,小米入局大模型領(lǐng)域可謂“水到渠成”。
從內(nèi)部人才儲(chǔ)備來(lái)看,小米目前已擁有超過(guò)1200人的AI團(tuán)隊(duì)。如今,雷軍也終于為大模型團(tuán)隊(duì)選定了欒劍為“舵手”。
來(lái)源:小米官網(wǎng)
從服務(wù)能力協(xié)同來(lái)看,雷軍手中亦有金山云這張底牌。金山云是金山軟件的附屬公司,在公司掌舵人雷軍超前布局下,是與阿里巴巴最早在中國(guó)全力進(jìn)軍云計(jì)算的企業(yè)。
ChatGPT熱潮帶來(lái)的AI競(jìng)爭(zhēng),最直接的受益者正是云計(jì)算平臺(tái)。
一方面,生成式AI應(yīng)用背后的大模型需要更強(qiáng)的算力。OpenAI此前公布過(guò)一組數(shù)據(jù),目前大模型訓(xùn)練所需算力的增速保持在3-4個(gè)月/倍速度增長(zhǎng),遠(yuǎn)超摩爾定律18-24個(gè)月/倍。
另一方面,區(qū)別于傳統(tǒng)云計(jì)算平臺(tái)提供的算力、存儲(chǔ)等資源,擁有大模型的云廠商未來(lái)可以提供基于大模型開(kāi)發(fā)應(yīng)用。李彥宏不久前在接受采訪時(shí)就拋出過(guò)類(lèi)似的觀點(diǎn),未來(lái)企業(yè)在購(gòu)買(mǎi)云計(jì)算的時(shí)候不看底層算力,而是看大模型的優(yōu)劣。
就在本周,阿里和騰訊先后官宣“大動(dòng)作”。
在4月11日舉辦的阿里云峰會(huì)上,張勇表示,智能化時(shí)代帶來(lái)算力的爆發(fā),同時(shí)也提出了更高的要求,阿里云將為AI時(shí)代提供好算力基礎(chǔ)和大模型能力,全面服務(wù)智能化進(jìn)程。為此,阿里云要做好核心兩件事:第一,讓算力更普惠,推動(dòng)自研技術(shù)和規(guī)?;?jīng)營(yíng)的正循環(huán),持續(xù)釋放技術(shù)紅利;第二,讓AI更普及,讓每家企業(yè)的產(chǎn)品都能接入大模型升級(jí)改造,并有能力打造自己的專(zhuān)屬大模型。
隨后在4月14日,騰訊面向大模型訓(xùn)練,發(fā)布“超強(qiáng)算力集群”,要助力企業(yè)云上訓(xùn)練AI大模型,解決中小企業(yè)和創(chuàng)業(yè)公司的算力壓力。
金山云方面雖然并未像阿里騰訊那樣“聲勢(shì)浩大”,但也已有相關(guān)動(dòng)作。
天眼查App顯示,近日,北京金山辦公軟件股份有限公司申請(qǐng)注冊(cè)多個(gè)“chat 會(huì)議”“chat 演示”“chat 表單”“chat Office”“chat everything”等商標(biāo),國(guó)際分類(lèi)為網(wǎng)站服務(wù),當(dāng)前商標(biāo)狀態(tài)均為申請(qǐng)中。
來(lái)源:天眼查
內(nèi)有千人AI團(tuán)隊(duì)并由欒劍掌舵,外有金山云護(hù)駕,小米大模型已順利起航。
小愛(ài)同學(xué)距ChatGPT,還差一個(gè)文心一言
早在今年2月的小米投資者日上,對(duì)于小米在ChatGPT上的布局,小米手機(jī)部總裁曾學(xué)忠就表示,ChatGPT基于AI大模型、千億級(jí)參數(shù)量、數(shù)據(jù)量、還有人工標(biāo)注支撐,AI大模型方面小米一直都有投入。手機(jī)和汽車(chē)業(yè)務(wù)有很多AI大模型落地的場(chǎng)景。
隨后,在今年3月的2022年財(cái)報(bào)電話會(huì)議上,小米集團(tuán)總裁盧偉冰談到ChatGPT相關(guān)問(wèn)題時(shí)表示,小米很早就在AI大模型方面進(jìn)行了許多部署,同時(shí)采用了多技術(shù)路線并行的策略,小愛(ài)同學(xué)就是小米大模型落地的代表。
據(jù)盧偉冰介紹,小愛(ài)同學(xué)已經(jīng)做了6年,在與用戶的交互體驗(yàn)中積累了長(zhǎng)期可復(fù)用的經(jīng)驗(yàn),同時(shí),小米有豐富的場(chǎng)景落地經(jīng)驗(yàn),小愛(ài)同學(xué)支持手機(jī)、音箱、車(chē)等多場(chǎng)景的智能融合。未來(lái)小米將繼續(xù)大模型研究,引入更加先進(jìn)的大模型能力,包括探索多模態(tài)能力、智能座艙交互體驗(yàn)提升等。
不難發(fā)現(xiàn),小愛(ài)同學(xué)或許是小米在大模型領(lǐng)域,最直觀最先落地的產(chǎn)品。
來(lái)源:小米官網(wǎng)
然而,需要注意的是,小愛(ài)同學(xué)的產(chǎn)品能力,與基于GPT-3.5訓(xùn)練而來(lái)的ChatGPT仍有不小差距。何況,OpenAI也已發(fā)布了更為先進(jìn)的GPT-4大模型,就連GPT-5也已身處“傳說(shuō)”中。
此前,微軟CEO薩蒂亞·納德拉最近在接受英國(guó)《金融時(shí)報(bào)》采訪時(shí)表示,蘋(píng)果的Siri、亞馬遜的Alexa,微軟自家的Cortana(中文名:小娜)以及公認(rèn)拔尖的Google Assistant,這些語(yǔ)音助手有一個(gè)算一個(gè):都笨得跟石頭一樣。
隨后,微軟在2021年就正式宣布停止支持iOS和Android上的Cortana應(yīng)用,僅保留對(duì)Windows平臺(tái)的支持。
直到OpenAI帶來(lái)了ChatGPT,微軟直接“滿血復(fù)活”,戰(zhàn)斗力爆表。
Siri聯(lián)合創(chuàng)始人Adam Cheyer也在近期表示,ChatGPT理解復(fù)雜信息的能力讓現(xiàn)有的語(yǔ)音助手看起來(lái)很蠢。
那么,“小愛(ài)同學(xué)+ChatGPT”,究竟會(huì)怎樣?
在全球最大的代碼托管平臺(tái)Github上,有開(kāi)發(fā)者嘗試將ChatGPT接入小愛(ài)同學(xué),Star數(shù)已經(jīng)達(dá)到了1.3k。據(jù)項(xiàng)目介紹,只要有ChatGPT的賬號(hào)、小愛(ài)音箱、正常連接ChatGPT的網(wǎng)絡(luò)以及python 3.8+,人人都可以在小愛(ài)音箱上使用“ChatGPT版小愛(ài)同學(xué)”。
具體原理為,喚起小愛(ài)同學(xué)后,以“幫我”開(kāi)頭詢問(wèn)的問(wèn)題會(huì)自動(dòng)以文本形式發(fā)送一份給ChatGPT,同時(shí)會(huì)屏蔽小愛(ài)同學(xué)原本的回答,替換成“正在問(wèn)GPT,請(qǐng)耐心等待”,而ChatGPT生成的文本則會(huì)被小愛(ài)同學(xué)通過(guò)TTS(語(yǔ)音合成技術(shù))進(jìn)行語(yǔ)音回答。
從開(kāi)發(fā)者的演示顯示,整個(gè)過(guò)程足夠流暢,實(shí)際回答也遠(yuǎn)超小愛(ài)同學(xué)原本的“智力”。
然而,小米官方顯然不能直接與OpenAI合作,推出“ChatGPT版小愛(ài)同學(xué)”。
作為對(duì)比,早在今年2月,百度旗下人工智能助手“小度”就宣布,小度將融合“文心一言”的全面能力,打造針對(duì)智能設(shè)備場(chǎng)景的人工智能模型“小度靈機(jī)”,并應(yīng)用到小度全系產(chǎn)品。
隨后在3月份的文心一言發(fā)布會(huì)上,百度創(chuàng)始人李彥宏曾表示,文心一言差不多是今年1月份ChatGPT的水平,但差距不大,可能只是一兩個(gè)月的時(shí)間。
由此可見(jiàn),小愛(ài)同學(xué)距離ChatGPT,至少還差一個(gè)文心一言,然后再加“一兩個(gè)月的時(shí)間”。