文|最話FunTalk 何伊然
編輯|劉宇翔
進入2024年,AI賽道依然風光無限。微軟投資的Open AI推出了Sora,引爆了文本生成視頻熱潮。英偉達拿出了創(chuàng)紀錄的財報,今年以來,英偉達股價漲幅超過40%,沖上了歷史最高點,公司市值一度超過了谷歌和亞馬遜。
在Open AI、英偉達輝煌戰(zhàn)績的映襯之下,長期以來被視作硅谷最富有創(chuàng)新精神的AI旗幟谷歌的表現(xiàn)卻顯得有些迷茫。
2023 年 1 月,谷歌 CEO 桑達爾?皮查伊(Sundar Pichai)透露,谷歌將裁員 12,000 名人,約占當時員工總數(shù)的 6%。今年1 月 18 日,皮查伊再度宣布2024 年將繼續(xù)裁員,至今谷歌已裁員 1,000 多人,并且Pixel、Fitbit 和 Nest 硬件團隊現(xiàn)已合并為統(tǒng)一管理。
谷歌裁員、重組就是為了更聚焦 AI,以應對Open AI兇猛的攻勢,然而,就在英偉達財報公布的同一天,谷歌也登上了社交媒體的熱搜,原因卻是其AI模型Gemini翻車了。
01
社交媒體上,有用戶抱怨道,在谷歌AI模型Gemini的世界里,似乎不存在白人。
用戶輸入“創(chuàng)建一個教皇的圖像”的提示文字后,Gemini生成了黑人男性教皇和黑人女性教皇的形象。眾所周知,歷史上和現(xiàn)任教皇都是白種人,Gemini將教皇默認為有色人種的舉動讓用戶頗為不解。
許多用戶紛紛上傳自己使用Gemini生成的圖像,結果大家驚訝地發(fā)現(xiàn),只要不給出明確的白種人提示,Gemini生成的人物基本都是有色人種,就連明確給出“馬斯克”的文字提示,生成的人物圖像皮膚都變黑了。
“Gemini似乎不知道有白種人的存在。”AI模型在多元化問題上表現(xiàn)出如此不合常理的偏好性還是引起了用戶們的不滿。常年一線沖浪的首富馬斯克發(fā)布多則推文“埋汰”谷歌AI,嘲諷谷歌打著政治正確的旗號,旗下多個產品卻在給用戶傳達虛假信息。
隨后,谷歌高級副總裁拉加萬在博客道歉,谷歌官方承認在設置中做了特殊設定,以規(guī)避產品陷入AI常見的陷阱中,比如生成具有風險因素的圖像,但是 Gemini表現(xiàn)“未能達到預期效果”。
眾所周知,AI大模型是在互聯(lián)網海量數(shù)據(jù)的基礎上打磨出來的,從現(xiàn)實來看,由于科技圈話語權的問題,英文世界的內容會在機器學習中占據(jù)更大比重,這會出現(xiàn)明顯的側重偏差。
有業(yè)內人士分析認為,谷歌為了平衡,可能在后臺為用戶輸入的提示詞增加了更具體的多元化描述,并且在設置上將包含多元化元素的內容優(yōu)先級提前。牽一發(fā)而動全身,谷歌為了平衡的過度干預反倒讓AI大模型不夠智能和靈活的一面暴露出來。
谷歌宣布,將根據(jù)用戶反饋調整設置,暫時關閉Gemini圖像生成功能。
2月23日,馬斯克洋洋自得地發(fā)推稱,谷歌的人給他打了一個小時電話,承諾將修改Gemini存在的種族歧視問題。他話中有話地寫道:“時間會驗證一切?!?/p>
02
Gemini圖像生成功能的翻車表現(xiàn)在社交媒體引發(fā)的狂歡完全蓋住了谷歌正經消息的熱度。這大概率是“劈柴哥”(皮查伊的外號) 完全不想看到的,因為他正卯足勁為谷歌的 AI 產品造勢。。
“Gemini是我們當今廣泛使用的最大、功能最強大的AI模型。”當?shù)貢r間2月21日,谷歌發(fā)布了新一代開源模型Gemma。Gemma在拉丁語中意為“寶石”,是谷歌最新的LLM模型,采用了與創(chuàng)建Gemini模型相同的研究和技術。
官方宣傳顯示,Gemma 7B在MMLU(大規(guī)模多任務語言理解)得分率達到64.3%。同等規(guī)模中,原本最強Mistral 7B的得分率為62.5%。目前,Gemma是輕量級中“最先進的”開放模型系列。
Gemma系列有兩種參數(shù)規(guī)模,分別為“Gemma 2B”和“Gemma 7B”,即20億參數(shù)和70億參數(shù)。每個規(guī)模又分預訓練和指令微調兩個版本。每個參數(shù)都有基本和指令調整的變體。7B參數(shù)用于在消費級GPU和TPU上高效部署和開發(fā),2B版本則可直接在筆記本電腦上運行。
除了開源,谷歌還公布了Gemma的性能、數(shù)據(jù)集組成和建模方法的詳細技術報告。需要注意的是,Gemma支持的詞匯表大小達到了256K,這使得它可以給英語之外的語言提供更好更快的支持。
發(fā)布會后,Gemma第一時間在知名開源模型庫HuggingFace和HuggingChat上線,并迅速登頂“大語言模型榜單”。同時,谷歌還推出了鼓勵協(xié)作的工具以及使用Gemma模型的官方指南,使用Gemma的研究人員還有機會得到高達 50萬美元的 Google Cloud 積分。
不僅如此,谷歌還拉來了正在聚光燈下的英偉達背書支持。英偉達表示,已經和谷歌展開合作確保 Gemma 模型可以在旗下芯片上順利運行。英偉達稱,將開發(fā)與 Gemma 配合使用的聊天機器人軟件。
目前,Gemma的競品主要包括:Meta 的開源大型語言模型 Llama 2、Mistral AI 的 7B 模型、Deci 的 DecilLM 和微軟的 Phi-2。
谷歌官方特意強調,Meta的開源模型通過許可條款限制大型科技公司商用,Gemma沒有任何限制,在負責任并遵守安全標準情況下,任何規(guī)模的組織都可以商業(yè)使用。
顯然,為了兜售Gemma重奪AI領先地位,皮查伊可謂拼了。
但Sora的吸睛表現(xiàn)、英偉達出色的財報和社交媒體的狂歡讓Gemma模型發(fā)布的熱度被限制在了行業(yè)內部,并沒有引起外界的多少關注。
甚至赫利俄斯資本(Helios Capital)創(chuàng)始人阿羅拉還發(fā)布了一條聳人聽聞的消息,稱皮查伊可能會因Gemini 重大輿情事件而被解雇或辭職。
雖然,該消息并未獲得證實,但顯然資本市場對皮查伊已多少有所不滿。
03
自皮查伊上任以來,作為AI行業(yè)先導者的谷歌頻頻給人一種“凡是慢半拍”的觀感。
在離職員工打造的AI獨角獸成長為了科技圈新貴,微軟后來居上全面在軟件服務擁抱AI的時候,谷歌的高層似乎還陷在應對監(jiān)管機構頻頻開展的反壟斷調查,顧慮AI應用帶來科技倫理問題,因而遲遲不敢行動的泥潭里。
在AI底層架構來看,谷歌AI仍是王者一般的存在。
當下最火爆的生成式Ai應用背后都離不開Transformer框架,而這一框架是谷歌的研究人員在2017年發(fā)布的。Transformer迅速成為自然語言處理領域的標準模型,幫助OpenAI解決了循環(huán)神經網絡(RNN)長距離依賴問題,這才有了ChatGPT性能的飛躍式提升。
在AI基礎設施領域,和其他科技巨頭一樣,谷歌也在走自研路線,并不想被英偉達拿捏了。谷歌推出了轉為機器學習和深度學期打造的張量處理器(TPU)。TPU在語音識別、圖像處理等方面取得了顯著表現(xiàn),對英偉達的GPU發(fā)起直接挑戰(zhàn)。按照官方的數(shù)據(jù),TPU v5p在速度上不輸甚至可能優(yōu)于英偉達的H100。
此外,谷歌的BERT和EfficientNet等成果也在自然語言處理和計算機視覺領域產生了重要影響。
2018年起,谷歌在AI領域展現(xiàn)出來的姿態(tài)是拼命卷自己、繼續(xù)抓住在行業(yè)內的話語權,但在面向普通用戶的消費端應用上保持低調,卻更多是后臺行動。
這可能與谷歌的搜索引擎的商業(yè)模式,以及其被反壟斷監(jiān)管機構盯上有關。谷歌的搜索引擎長期以來是行業(yè)霸主,全球市占率超過90%。如果谷歌大張旗鼓地推廣AI機器人,并率先將其引入到搜索引擎對話框中,勢必會引來新一波反壟斷調查,還會直接影響谷歌的根基廣告收入。
但在搜索引擎市場市占份額很小的微軟,則不需要考慮商業(yè)收入,也不需要忌憚反壟斷監(jiān)管,重注 Open AI,在ChatGPT推出,馬上在Bing引入GPT。畢竟,微軟作為進攻方,只要能從谷歌手里切下更多的份額就是勝利。
所以,谷歌不是輸在技術維度。事實上,無論從哪方面看,深厚的技術儲備、廣泛的應用場景、領先的技術前瞻、豐富的數(shù)據(jù)資源和擴展中的生態(tài)系統(tǒng)都證明谷歌在 AI 領域有著巨大的潛力。
但OpenAI的火爆程度和微弱咄咄逼人的布局速度可能超過了谷歌的預期。一旦競爭對手在消費者心中建立起了固定印象,扭轉市場競爭形勢的難度會幾何倍數(shù)增長,谷歌因種種顧慮而選擇的穩(wěn)妥保守的策略就不得不變了。
所以,最近一段時間,谷歌裁員、重組,聚焦 AI,接連發(fā)布了Gemini和Gemma,試圖重奪AI行業(yè)領頭羊,也是皮查伊向董事會、資本市場證明其能力的放手一搏。
只是“Gemini歧視白人”的網絡輿情爆發(fā)卻完全抹去了皮查伊的努力,所以才爆出其可能被辭職的消息。在皮查伊的領導下,谷歌出于政治正確過于強調多元化,人為干預、調整模型參數(shù),現(xiàn)在反而被輿論所反噬。
這位非技術出身的 CEO,越來越多的被拿來與其印度“老鄉(xiāng)”微軟CEO薩提亞·納德拉(Satya Nadella)做比較。納德拉擔任微軟 CEO 后,聚焦云服務,改變微軟的商業(yè)模式,重注Open AI,將微軟從“互聯(lián)網時代的活化石”變成了云服務、AI 的迎領者,微軟的市值也從約3,000億美元增長到超過3萬億美元。
而此前市值與微軟難分伯仲的谷歌,如今市值只有1.7萬億美元。同為印度裔,同為超級科技公司 CEO,相比納德拉,皮查伊更顯得乏善可陳。
面對崩壞的口碑、平淡的股價,留給皮查伊的時間,可能確實不多了。