記者 | 李京亞
編輯 | 文姝琪
Meta的首席人工智能科學家、卷積之父楊立昆這樣評價ChatGPT大行其道引發(fā)的硅谷巨頭軍備戰(zhàn),“沒有人比其他人領先超過兩到六個月。”
他還給ChatGPT潑了盆冷水,在1月底的小型聚會上楊立昆發(fā)出譏諷:就底層技術而言,ChatGPT并不是多么了不得的創(chuàng)新,就是一個組合得很好的產品而已。
不久之前,他的東家Meta所推出的類ChatGPT語言模型Galactica遭遇了同谷歌巴德一樣被群嘲的命運,因在公開場合出現錯誤,Galactica上線短短三天后就被噴下線。谷歌方面因為巴黎活動上聊天機器人巴德的一處失誤,市值蒸發(fā)了1000億美元。
在ChatGPT引發(fā)的這場谷歌“背刺”微軟大戰(zhàn)中,為科學評估誰的技術更為出色,業(yè)內已進行過一些測試。
比如今年1月,在一名谷歌工程師的幫助之下,《經濟學人》向ChatGPT和谷歌尚未推出的基于Lamda模型的聊天機器人巴德提出問題,包括美國數學競賽中的10個問題和美國離校生考試中的10個閱讀問題,為了增加趣味性還要求每個模型提供約會建議。
谷歌的人工智能在數學問題表現上更優(yōu),正確回答了五個問題,而ChatGPT只正確回答了三個。二者給出的約會建議參差不齊,ChatGPT在常識問題上的準確率更高。
又過了幾天,母公司OpenAI對ChatGPT進行了更新,后者的數學能力得到提高。1月30日再次測試時,ChatGPT已與谷歌模型在數學題目中的表現打成平手。
已經被廣泛普及的一個事實是,ChatGPT背后的GPT模型是在超大語料基礎上預訓練出的大語言模型(LLM),但凡大模型都有極高的訓練成本,會導致知識更新的困難,ChatGPT采取的訓練方式尤甚,而ChatGPT的數學能力卻能以日為單位進化,足以說明潛力之大。
縱然如此,ChatGPT也并沒有同谷歌的語言模型拉開太大差距。
億級用戶在使用ChatGPT時,這個風靡全網的工具繼續(xù)得到了優(yōu)化迭代,但全球每天會發(fā)生100億次的搜索查詢,占比9成的谷歌搜索也在以日為單位迭代。在硅谷巨頭財務現狀江河日下,成本效率比以往任何時候都“更加重要”的當下,一切搜索引擎的更改都無法直接帶來效益,谷歌和微軟在這場游戲中真正需要的會是什么?
很多公開資料可以輕松查閱到谷歌與OpenAI最近5年在語言模型領域的發(fā)展時間線。
今年年初,谷歌AI掌門人杰夫·迪恩用萬字長文做了谷歌2022年在AI領域的總結報告,報告內容簡單概括即:谷歌在生成式AI、大型語言模型(LLM)等領域碩果累累,沒有任何一項研究進展落后于OpenAI的DALL-E和ChatGPT,但這些成果都存在于內部研究,沒有形成完整的部署和變現上的落實。
有觀點指出,這幾年中,谷歌有點像沈向洋時期的微軟,手握曾經最強大的AI資源,研究論文一篇接著一篇,但從頭到尾不發(fā)布任何有影響力的產品。
但為什么會變成這樣?安于現狀的谷歌是錯判了微軟和OpenAI的戰(zhàn)力,還是對自己在搜索引擎的主導地位有深層次自信?
優(yōu)等生為什么不交卷?
本時代最偉大的人工智能公司谷歌仍然擁有絕對實力。
在2019年到2021年兩年時間里,谷歌人工智能個各大部門在抗議聲中度過,但也從未落下對技術的銳意探索。
事實上,谷歌2017年提出的Transformer模型為今天這場游戲制定了規(guī)則,也是谷歌展現出了更豐富更準確的為大模型尋找能力提升的辦法。
首先,谷歌察覺大模型是競爭的關鍵并不晚于OpenAI。
在OpenAI的GPT-3驚艷世界不到一年之前,2021年1月,谷歌推出了1.6萬億參數的Switch Transformer,這個超級語言模型讓谷歌洞察到了稀疏多模態(tài)結構的價值。谷歌的研究人員當時表示,希望夠激勵稀疏模型成為一種有效的架構,并鼓勵人們在自然語言任務中多考慮這些靈活的模型。OpenAI的GPT系列一直在密集模型的道路上狂奔,已有傳言稱,尚未發(fā)布的GPT-4可能是第一個以稀疏為核心的大型AI模型。
更關鍵的是,谷歌還提前于OpenAI意識到了超大規(guī)模語言模型的非必要性。2021年10月,谷歌提出了一個新的語言模型Flan-T5,它的模型結構和GPT相似,但比OpenAI在2020年5月發(fā)布的GPT-3(也就是ChatGPT的前任)的模型參數有大幅降低,卻表現更佳,通過這一模型,谷歌探索到通過更多的監(jiān)督數據能夠降低模型規(guī)模,進而拿到更好的模型效果。
2022年10月,谷歌將語言模型Flan-T5開源,用30億參數跑基準跑贏了GPT-3的1750億參數。
現在的OpenAI也洞悉了這一點,開始避免模型“越大越好”的方法,希望專注于模型本身的質量,據悉,尚未面世的GPT-4的大小會與GPT-3大致相同。
OpenAI的成立本身,就承載著一群意欲打破谷歌在人工智能領域壟斷的青年才俊集體愿景,因此這家公司與谷歌的競爭一直擺在明處。
這場能力相近的游戲中,谷歌在技術前瞻性上更優(yōu),OpenAI則依靠執(zhí)著取勝。薩姆·奧特曼從YC孵化器辭職之后,全力帶領OpenAI以產品為導向悶頭苦干,一干精英在擴大模型和密集模型的道路上一往無前,反復之處無外乎精調方式的細節(jié)。
谷歌方面,思路活躍前衛(wèi),但在大的路線上屢經轉換:走稀疏模型路徑的萬億參數Switch Transformer影響較低,并未得到堅持投入;被反復打磨的Flan-T5模型雖然表現勝于GPT-3,但優(yōu)化速度緩慢,在此期間OpenAI已經完成了對ChatGPT的訓練。
2022年9月,谷歌姐妹公司DeepMind的麻雀模型初現,走上了小模型參數打敗精調的道路,與谷歌看重的LaMDA和PaLM模型在規(guī)模探索上有明顯思路區(qū)別,但一方面谷歌礙于與DeepMind之間的關系,另一方面在幾條路徑之間谷歌并未迅速確定麻雀就是最優(yōu)解,這些導致麻雀無法迅速轉換為產品。當時間又過去4個月,OpenAI的ChatGPT已經星火燎原。
精力分散是谷歌的宿疾。
搜索巨頭一直欠缺制定產品戰(zhàn)略的能力,谷歌員工可以用很低成本啟動一個全新項目,但如果一段時間后不達預期,項目就會立刻遭遇腰斬。有開發(fā)者專門為谷歌所關閉的產品成立了一個叫“Killed by Google”的網站,共有275個產品位列其中,包括谷歌云游戲平臺Stadia。
在微軟和谷歌兩家巨頭擔任過產品經理的Jackie Bavaro去年撰寫了一篇有影響力的博文分析谷歌的產品策略,她認為谷歌的公司文化鼓勵團隊提出自己的想法,公司的最高級OKR(目標管理法,谷歌的內部考核制度)并不凌駕于其他OKR之上,這看似很好,卻會以犧牲掉中型產品和員工精力為代價。反觀微軟,產品負責人非常清楚產品取得成功的條件,每個獲批項目必須與微軟更核心的戰(zhàn)略支柱緊密相關。
在微軟決定改道AI之后,連其培育工業(yè)基因的唯一種子——工業(yè)元宇宙項目都可以立即解散,軟件巨頭與谷歌之間的專注度高下立見。
谷歌的AI倫理委員會:消除偏見的人最受傷
對外,谷歌一直用“擔憂聲譽風險”來解釋延遲推出AI聊天產品的原因。
人工智能技術相比傳統(tǒng)技術對社會的影響確實可能更大,一些系統(tǒng)性偏見比如種族歧視、性別歧視以及年齡歧視,在人工智能模型和系統(tǒng)一旦表現,會帶來永久化和放大化的負面影響。
谷歌的憂慮看似是對社會和企業(yè)都負責任的做法,但現實中,那些在解決谷歌人工智能“聲譽風險”方面經驗最豐富的人,是受谷歌傷害最深的人群。
谷歌人工智能倫理團隊領袖麥格·米切爾2021年2月遭遇解雇,原因是她分享了同被解雇的前任---黑人女性研究員蒂姆尼·格布魯當政時期的郵件,米切爾和格布魯都是谷歌人工智能業(yè)務的領袖,格布魯因揭露面部識別系統(tǒng)中的種族和性別偏差而聞名于世。她們二人致力于消除人工智能偏見方面的研究,建樹豐厚,其離職引發(fā)了谷歌員工的廣泛抗議。
2021年4月,谷歌AI高管薩米·本吉奧因支持格布魯爾而主動離職,5月,谷歌專注于深度學習的AI工程負責人薩特拉吉特·查特吉因質疑了掌門杰夫·迪恩去年在Nature上發(fā)表的一篇論文遭遇解雇。當現在的杰夫·迪恩大談特談AI倫理和大公司責任之時,已經有人忘記了谷歌是一家因AI倫理而頻上新聞頭條的企業(yè)。
此后,多名人工智能領域精英開始拒絕谷歌的資助和工作機會。
某種意義上來說,AI倫理委員會的存在成為了谷歌做to C端產品對外發(fā)布時的“枷鎖”,這些內耗風波之后,谷歌的產品已被外界完全視為谷歌公司所表達的觀念,而微軟方面通過投資外部的創(chuàng)業(yè)公司OpenAI巧妙回避了這一點。
谷歌更大的麻煩來自美國政府。
雖然谷歌和微軟都是歐洲反壟斷舞臺的常客,但納德拉時代的微軟在美國政府的反壟斷視野中已經消失了數年。
根據NBC的數據,2016年到2020年,微軟與美國國防部和各種聯(lián)邦執(zhí)法機構簽訂了5000份合同,而谷歌則只有250份。
2020年,美國司法部對谷歌發(fā)起的反壟斷訴訟是21世紀以來全球最大規(guī)模的反壟斷案件,而今年年初,拜登政府時代首次對大型科技公司提起的反壟斷訴再次花落谷歌。美國司法部和八個州聯(lián)合起訴谷歌,指控其在線廣告市場的主導地位損害了競爭,要求將其分拆。
面臨內外的聯(lián)合施壓,谷歌必須至少顯得“科技向善”。
一些改變開始發(fā)生,2022年6月,谷歌悄悄禁止了Colab服務上的爭議Deepfake項目,為這一項目引發(fā)的大規(guī)模濫用畫上句號。
護城河外有焦土
ChatGPT已經成為一個網紅級的現象,人們已對其抱有先入為主的寬容。
微軟通過與OpenAI先10億后百億美元的魄力聯(lián)姻,成功找到了一條贏得資本市場認可的敘事主線,這條主線在微軟的炒作和媒體的推波助瀾之下,以微軟挑戰(zhàn)谷歌搜索壟斷地位的樣貌出現。
但一些來自現實的制約導致谷歌不可能與微軟同步呼應,比如將對話機器人真正融入搜索引擎之中。
StatCounter數據顯示,微軟本周披露,該公司每天的搜索查詢量約為100億次,這意味著谷歌每天的搜索查詢量約為3.3萬億次,目前微軟在全球搜索引擎市場的份額約為3%,谷歌則高達92.2%。
根據摩根斯坦利分析師Nowak的計算,如果谷歌將10%的搜索轉移到語言模型,會增加多達12億美元的運營成本。如果谷歌一半的查詢最終都使用了自然語言集成,那么成本可能會增加60億美元,息稅前利潤最多將減少6%。這注定谷歌無法直接回應微軟將ChatGPT整合到必應搜索中的挑釁,谷歌剛交出的四季度財報營收利潤都低于分析師預期,唯有獲客成本較低是唯一的亮點。
如果把與谷歌在搜索引擎領域爭雄當作微軟的某種炒作,那么在上周二華盛頓州雷德蒙德總部線下集會的當天夜晚,此行更真實的目的被微軟自行揭開。