文 | 娛樂資本論 知行
國產(chǎn)大模型與觀眾見面需要走幾步?
1、亮名字;發(fā)通稿;2、辦發(fā)布會,現(xiàn)場演示技(錄)術(shù)(屏);3、公布網(wǎng)站,收集內(nèi)測名額(發(fā)垃圾短信)。
俗話說,不怕生錯命,就怕安錯名。有投資人就說,大模型起名就是AI創(chuàng)業(yè)至為關(guān)鍵的一步。
在剛剛過去的世界人工智能大會上,一位媒體人一口氣拍了三十多張大模型的照片,并稱看到最后,已經(jīng)不認識大模型三個字了。
更絕的是,這些大模型的名字一個比一個難念,一個比一個仙氣飄飄,不熬廢幾個文聯(lián)老干部肯定想不出:從上古神話人物到圣賢百家,從借鑒GTP到原創(chuàng)的英文名,從動植物到電影角色,"悟道·天鷹"、"通義千問"、"軒轅"、"海河·諦聽"、"元乘象"、"文心一言"、"序列猴子"等各類名字不斷出現(xiàn)在各類社交平臺的頭版頭條中,上演了一場現(xiàn)實版的“諸神之戰(zhàn)”。
相比這些妖艷的科技民企,中特估先鋒中國電信的TeleChat以及農(nóng)業(yè)銀行的ChatABC則明晃晃的借鑒了鼻祖ChatGPT,倒顯出另一種自信和坦然。
仔細分析這些大模型的名字,我們也找到了不少規(guī)律,尤其作為AI時代的“基座”,大模型名字就像父母對孩子起名一樣,可以說代表著企業(yè)的價值和期待,以及在品牌傳播中對自己的自信程度。
命名規(guī)律
01、舊詞新組
與近些年兒童愛從《詩經(jīng)》《離騷》中找字取名為“梓軒”、“沐羽”、“歆若”類似,大模型廠商也偏愛從古文典籍中取詞再造新詞,讓高科技與傳統(tǒng)文化相遇,彰顯其與老干部厚重審美的同頻與不覺明厲的野心。
例如,百度的“文心一言”定位于人工智能基座型的賦能平臺,有文學創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理邏輯推算、中文理解、多模態(tài)生成等能力。
百度CTO王海峰曾解釋過“文心一言”的含義:“文”是語言文字,“心”是用心理解,“文心”指致力于理解和運用語言文字的自然語言理解模型,同時也呼應了《文心雕龍》,寓意用雕縷龍紋一樣精細的功夫去研究語言文字的內(nèi)涵和魅力;“一言”既有“一言為定”的寓意,也有對人機之間“你一言我一語”流暢溝通的殷切期盼。
阿里的大模型通義千問中,“通義”取自《漢書》中的“天地之常經(jīng),古今之通義也”,有“普遍適用的道理與法則”之意。官方解釋“千問”是“千萬次的問,千萬的學問,能問出千問的一定是真愛,能回答千問的也一定是真有學問,以及AI和我們一樣,都有千萬次交互的熱情”。
實話說,到現(xiàn)在互聯(lián)網(wǎng)上還有很大一批人以為“通義千問”是那個“眾里尋他千百度”的百度開發(fā)的。
知乎的“知海圖”通過在大海中行業(yè)的隱喻,表達了其大模型擅長為創(chuàng)作者、討論場、信息賦能的特點。
云知聲CEO黃偉則解釋,“山海大模型”的名稱由來是因其有龐大的訓練數(shù)據(jù)和海納百川的能力。
02、請出歷史人物,上演現(xiàn)代版“封神演義”
用上古神話人物命名大模型,代表者是華為。7月7日,華為云CEO張平安介紹盤古大模型時,喊出口號“不做詩,只做事”,正式給盤古大模型定調(diào)。這也意味著盤古主攻的方向是以視覺為主的數(shù)字化賦能場景,即針對行業(yè)的B端業(yè)務,例如,煤礦、水泥、電力、金融、農(nóng)業(yè)等,而非C端場景。
網(wǎng)上有不少用戶對華為的宣傳方向產(chǎn)生了質(zhì)疑,反駁盤古大模型是在用貶低GPT的方式,掩飾其在內(nèi)容生成與知識豐富面上的不足。不過這也給了其他大模型公司的宣傳拓展了新思路——“不擅長的方向,說它無用即可,我會的就是最好的”。
硅基智能推出了炎帝大模型,專注于數(shù)字人生成領(lǐng)域。關(guān)于取名,硅基稱希望可以繼承炎帝開拓進取、頑強不息的精神和使命,稱要用AI技術(shù)“復活”炎帝的精神。
度小滿請出了炎帝的結(jié)盟者軒轅(即黃帝),推出了針對中文金融領(lǐng)域的開源對話大模型軒轅。
粵港澳大灣區(qū)數(shù)字經(jīng)濟研究院則推出了姜子牙模型系列,包括通用人工智能模型封神榜大模型與二郎神大模型。接下來,三圣母大模型還會遠嗎?
孟子有云:“以力服人者,非心服也,力不贍也”;“權(quán),然后知輕重;度,然后知長短”。瀾舟科技認為這句話極好的體現(xiàn)了AI的實用性,打造了孟子大模型。
達觀的“曹植”大模型,名字取自曹植七步成詩的典故,是一個專注于金融、政務、制造等垂直領(lǐng)域的大語言模型,稱要讓大模型上演現(xiàn)實版的“七步成詩”。
03、古詞新用
面對大模型混戰(zhàn)的狀態(tài),馬化騰在騰訊2023股東大會上說,“我們在埋頭研發(fā),但并不急于把半成品拿出來展示?!毕噍^于其他互聯(lián)網(wǎng)公司的高調(diào),騰訊一直如高人般“低調(diào)”,大模型的名字也頗有高人之風。
騰訊的AI大模型名為“混元”,取自道家的“混元即無極,無極生太極”,看起來磅礴大氣,萬物皆包?;煸竽P鸵哺采w了NLP、CV、多模態(tài)等基礎(chǔ)大模型以及眾多行業(yè)/領(lǐng)域大模型,具備通用功能。
網(wǎng)易伏羲的大模型放棄了使用宏大的古代神話人物命名,轉(zhuǎn)用古詞后,其名字不僅顯得雅致,而且也有了獨特含義。具體來說,大語言模型“玉言”,服務領(lǐng)域主要是圖文、音樂等;AI作畫模型“丹青”,用以文生圖;教育場景下的大模型“子曰”,用于作業(yè)批改等。一眼看過去便知道網(wǎng)易大模型的應用場景。
繼書生大模型后,商湯科技發(fā)布了“日日新SenseNova”大模型體系。商湯科技聯(lián)合創(chuàng)始人徐立談到名字含義時說:“寓意‘茍日新、日日新、又日新’,希望在模型的迭代速度及處理問題的能力上可以日日更新,不斷解鎖AGI的更多可能?!?/p>
北京語言大學推出了適用于國際中文教育領(lǐng)域的大模型桃李。
星環(huán)科技推出了面向金融量化領(lǐng)域的大模型無涯,與面向數(shù)據(jù)領(lǐng)域的大模型求索。
中國移動發(fā)布了面向政務和客服領(lǐng)域的九天大模型。
螞蟻集團真正在研發(fā)大模型“貞儀”,名字來源于中國古代的一種測量儀器,象征著精確、公正和智慧。最為霸氣的名字,當屬國家超級計算天津中心研發(fā)的“天河天元大模型”,稱要在生成式智能的大算力、大數(shù)據(jù)、大模型上走出一條完整的信創(chuàng)路線,系統(tǒng)支撐中國生成式智能創(chuàng)新發(fā)展。
04、GPT+垂類專屬名稱
GPT是生成式預訓練Transformer模型的縮寫,也是最為知名的大模型之一。雖然GPT被國內(nèi)競品調(diào)侃為“狗屁通”,但大模型的名字中帶有GPT可以省去不少建設(shè)用戶心智的過程,很多垂類大模型會直接使用 GPT+垂類專屬名稱的命名方式,強調(diào)自己的垂類專業(yè)性。目前,這類命名占到了大模型總數(shù)的五分之一左右。
京東即將發(fā)布的新一代大模型“ChatJD”,定位為產(chǎn)業(yè)版本ChatGPT。
360推出的致力于以文本/對話的方式解決視覺任務的大模型SEEChat。
理想汽車自家研發(fā)的認知大模型Mind GPT,定位為用車“管家”。
中國電信的TeleChat主要解決數(shù)據(jù)中臺產(chǎn)品、智能客服領(lǐng)域。
農(nóng)業(yè)銀行發(fā)布了金融AI大模型ChatABC。
學而思發(fā)布了針對數(shù)學的大模型MathGPT,服務于數(shù)學愛好者和科研機構(gòu)。
左手醫(yī)生推出了醫(yī)療專業(yè)GPT模型左醫(yī)GPT。
印象筆記推出了面向工作和知識場景的大象GPT。
國產(chǎn)大模型的誕生之日也有文章可作。今年6月6日,數(shù)說故事發(fā)布了國內(nèi)首個專注Social領(lǐng)域的商業(yè)大模型“SocialGPT,昵稱為“社?!贝竽P汀S商稱,選擇在這個“666”的特別時間發(fā)布,也預示著“SocialGPT”強大的“社交”出圈能力。神有誕辰,大模型也有了值得紀念的生日。
此外,高校偏愛此類命名方式,比如東北大學的TechGPT,功能以知識圖譜構(gòu)建、閱讀和文本理解等自然語言處理為主。
華東師范大學的專注于心理健康與危機干預EmoGPT,專注于教學教育的EduChat。
北京信息工程大學的針對法律垂類的大模型ChatLaw。
華南理工大學的針對心理健康的大模型SoulChat。
05、道家學派“大爆發(fā)”
大模型的訓練需要大量的計算資源、數(shù)據(jù)和優(yōu)化算法,以逐步改善模型的性能和能力。這個過程類似于古代煉丹術(shù)士。煉丹術(shù)能讓煉丹者獲得超凡能力的實踐,這與大模型潛在的巨大能力不謀而合。不少場合里,大模型也被稱為“煉丹”,有了些許道教意味。也許是因為這個原因,國內(nèi)很多大模型的名字也充滿了道家的儀式感。
中科院推出了紫東太初全模態(tài)大模型,稱要打造全棧國產(chǎn)化通用人工智能底座。紫東常為紫氣東來之意,與老子相關(guān);"太初"出自《莊子·天地》,表示宇宙的最初和最原始的狀態(tài)。中科院自動化研究所所長徐波曾解釋過該名字的含義,“相當于人工智能走向人類智能的一個混沌初開之際,也是感知智能走向通用智能重要的第一步?!?/p>
智源人工智能研究院推出了悟道·天鷹大模型。"悟"指領(lǐng)悟、覺悟,"道"則代表了道家哲學中的道,悟道"是道家常用語。
智子引擎推出了"元乘象"大模型,"元"在道家中常用來指代宇宙的起源或至高無上的存在。"乘"在道家中通常指代乘載或依附。"象"則表示形象、符號或象征。
阿里達摩院推出了超算基礎(chǔ)實現(xiàn)的“腦級人工智能模型”八卦爐,讓“煉丹”走進現(xiàn)實。06其他大模型:中醫(yī)或地名中醫(yī)文化源遠流長,留下了諸多優(yōu)秀的故事典籍傳奇人物,這也讓中醫(yī)垂類大模型的命名別具一格。比如哈爾濱工業(yè)大學的本草大模型。
華南理工大學推出了服務于生活健康的扁鵲大模型。
香港中文大學(深圳)訓練并開源了醫(yī)療大模型華佗GPT。
智慧眼推出針對醫(yī)療領(lǐng)域的砭石大模型。“醫(yī)源于砭”出自《山海經(jīng)》,砭石,是古代的醫(yī)療工具。
大模型浪潮中,不乏地方高校的身影。這些大模型的命名偏愛地名+的形式,例如慧言科技+天津大學研發(fā)的側(cè)重于語音語言的的“海河·諦聽”大模型。西北工業(yè)大學與華為聯(lián)合研發(fā)的首個面向飛行器的流體力學大模型“秦嶺·翱翔”大模型。
從名字窺探行業(yè)
做大模型的公司,基本可以分為互聯(lián)網(wǎng)巨頭、科研院所、AI公司與行業(yè)公司幾大類。整體而言,各家在取名上的不同策略,也彰顯了其在大模型賽道上的不同定位。
互聯(lián)網(wǎng)公司偏愛舊詞新組和古詞新用類命名方式,有利有弊。
舊詞新組的名字對用戶來說陌生且拗口,古詞新用則常常讓用戶摸不著頭腦,且搜索時因為諧音的緣故也常常搜不到。從傳播和轉(zhuǎn)化效率的角度上考慮,這兩類名字性價比低,效率低。
但是這些古代詞和字常常具有深厚的文化底蘊和象征意義,雖不實用,但在與用戶建立情感鏈接上具備獨特的辨識度,占領(lǐng)了用戶心智后,產(chǎn)品容易在市場中脫穎而出,形成差異化競爭優(yōu)勢。尤其是這幾年的互聯(lián)網(wǎng)頻頻遭遇反壟斷和金融調(diào)查,更是加劇了互聯(lián)網(wǎng)公司想靠近中國古代傳統(tǒng)文化的“尋根”心理。
國內(nèi)的互聯(lián)網(wǎng)大廠普遍不差錢,擁有大量的C端用戶,有著足夠的渠道優(yōu)勢和時間精力讓新的品牌名占領(lǐng)用戶心智。
互聯(lián)網(wǎng)公司以通用大模型為主,可以賦能各類行業(yè),具體功能有待開發(fā)。這使得互聯(lián)網(wǎng)公司有必要給大模型塑造出足夠廣義且全新的品牌形象,為以后的發(fā)展鋪路。
對于中小型科技公司而言,被用戶看到迅速變現(xiàn)比品牌建設(shè)更實在有用。因此,它們更偏愛GPT+垂類專屬名稱的命名方式。
通過將GPT與特定領(lǐng)域的專屬名稱結(jié)合,科技公司可以迅速將產(chǎn)品的技術(shù)基礎(chǔ)和功能特點傳遞給用戶,讓用戶對產(chǎn)品的功能和應用場景有所了解,在目標用戶中建立品牌認知和聯(lián)想,也能增加被用戶了解和搜索到的概率。
目前,國內(nèi)的中小型AI公司更多的是做領(lǐng)域模型,與行業(yè)任務對齊,應用于企業(yè)生產(chǎn)。哲學的盡頭是科學,神話是人類對于未來的想象。某種程度上,道家對知識和智慧的探索,對理想人生的追求,與AI技術(shù)的發(fā)展不謀而合。從這個角度看可以很好的理解,國內(nèi)的科研院所為何愛用道家術(shù)語命名大模型。
使用神話、歷史人物來為大模型命名,可以暗示著模型的特定能力或目標,幫助公司更好地向公眾傳達模型的主要特點。但如果該模型未能達到該能力,則很容易反噬產(chǎn)品為公司帶來長久的負面影響。
地方高校使用標志性的地名命名大模型,可以提高地方的認知度,也能看到地方政府想在大模型浪潮中卡位的苗頭。
不過這里面的異類當屬中特估先鋒中國電信的TeleChat以及農(nóng)業(yè)銀行的ChatABC,二者明晃晃的借鑒了鼻祖ChatGPT,倒顯出另一種自信和坦然。名字是產(chǎn)品傳遞給消費者的第一印象,與企業(yè)的品牌息息相關(guān)。
國產(chǎn)大模型五花八門的名字,頗有些春秋戰(zhàn)國時代“百花齊放、百家爭鳴”的局面,這也在一定程度上反映了行業(yè)欣欣向榮的發(fā)展情況。但大模型歸根結(jié)底是關(guān)于生產(chǎn)力的革命,如何應用于生產(chǎn)才是大模型的核心競爭力,也是名字想占領(lǐng)用戶心智的根本所在。