正在閱讀:

頻繁跳票背后,蘋果AI落后的真相

掃一掃下載界面新聞APP

頻繁跳票背后,蘋果AI落后的真相

從遙遙領先,到遙遙落后?

文 | Tech星球

距離蘋果全球開發(fā)者大會(WWDC)還有20天,OpenAI 宣布了自其成立以來最大規(guī)模的收購案——以全股票交易的形式收購了蘋果前首席設計官Jony Ive創(chuàng)辦的硬件初創(chuàng)公司io。

通過收購“io”,OpenAI不僅獲得了曾參與設計iPhone等標志性產(chǎn)品的艾維及其前蘋果設計團隊,還將整合該初創(chuàng)公司的技術(shù)資源,并推出AI硬件產(chǎn)品。

Jony Ive曾主導iMac、iPhone、Apple Watch等劃時代產(chǎn)品的設計,定義了如今智能手機外觀與體驗。此次重返消費電子領域被視為蘋果最有潛力的對手之一。過去,消費電子領域一直是蘋果主導,公眾自然而然認為AI+消費電子,也應該是蘋果脫穎而出。

但蘋果屢次讓人失望,其最暢銷的產(chǎn)品iPhone至今未能實現(xiàn)在AI領域的大規(guī)模創(chuàng)新。被寄予厚望的SIri不過是定鬧鐘、問天氣而已,而且多個AI功能連續(xù)推遲上線后體驗仍然不佳。

多重因素影響,今年以來,蘋果股價已經(jīng)下跌了25%。長期關注蘋果的記者Mark Gurmn發(fā)表在彭博社的一篇名為《Why Apple Still Hasn’t Cracked AI》的文章揭露了蘋果AI依然落后于行業(yè)的內(nèi)幕。根據(jù)此文,并結(jié)合蘋果AI的最新動態(tài),本文試圖還原“蘋果AI為什么落后了”。

01 多次跳票的蘋果AI

蘋果AI的核心圍繞其稱為個人智能系統(tǒng)(personal intelligence system)的 Apple Intelligence,這套系統(tǒng)于去年在蘋果WWDC大會上推出,并許諾了包含郵件摘要、寫作工具、Genmoji自定義表情、新聞摘要等AI功能。

iPhone因為更新乏善可陳而屢屢被詬病,為提高消費者購買熱情,去年9月的蘋果手機發(fā)布會上(此時距離WWDC已經(jīng)過去3個月),蘋果宣稱最新款iPhone 16“專為Apple Intelligence深度打造”,但當月新機發(fā)售時卻未見AI功能蹤影,iPhone 16系列在首周末預購銷量也未及預期。

寫作助手與摘要生成等首批功能延后一個半月才陸續(xù)上線;Genmoji定制表情直至去年12月面世;而基于緊急程度智能排序通知的iOS系統(tǒng)通知功能重大升級,更遲至次年3月方才落地。

項目延期并非不可理解,游戲公司延遲發(fā)布一兩年都實屬正常,蘋果在AI的表現(xiàn)本就落后于OpneAI、Google這樣的公司,延遲上線后,更是令公眾失望。

接入ChatGPT的寫作功能,被吐槽像個臨時塞進去的,事實上也確實如此,有用戶吐槽該功能在概括和提取要點方面平平無奇。

用戶用Apple Intelligence要點提取功能,輸出的結(jié)果不佳。

Genmoji自定義表情,承諾能生成孔雀與冰棒融合等創(chuàng)意圖形,但實際效果遠遜于蘋果在廣告中展示的精致設計,且因算力消耗過大可能導致iPhone過熱并急劇耗電。

當時宣稱iOS通知功能可以將用戶蘋果手機內(nèi)包含郵件、網(wǎng)頁、各類應用和圖片的多種推送信息進行整合,以方便用戶一目了然,并優(yōu)先處理重要的內(nèi)容。

但實際運行中屢屢出錯。最受爭議的便是關于美國聯(lián)合健康集團(UNH)旗下聯(lián)合健康保險公司首席執(zhí)行官(CEO)布萊恩·湯普森(Brian Thompson)的推送。蘋果將湯普森在紐約街頭遭遇槍殺的報道提取總結(jié)為(槍手)路易吉·曼吉奧內(nèi)(Luigi Mangione)對自己開槍”。槍手路易吉因為一張俊朗的出庭照片風靡社交平臺,不少支持者認為路易吉是替3990萬背負醫(yī)療負載的人扣動扳機。

因為出現(xiàn)多次嚴重事實錯誤,許多用戶打算棄用或者關閉該功能,沒多久,該功能被迫下線。

去年WWDC發(fā)布會占據(jù)C位的的Siri,承載著蘋果AI的野望。蘋果首次宣稱該語音助手將能深度解析用戶個人數(shù)據(jù)與屏幕內(nèi)容進行應答。演示環(huán)節(jié)中,時任蘋果人工智能負責人的約翰·詹南德雷亞(John Giannandrea)團隊核心成員向Siri詢問母親旅行計劃,系統(tǒng)通過無縫整合郵件與短信信息,自動生成行程安排。公司同時宣布用戶可通過新型Siri實現(xiàn)無觸控操作:例如選擇照片、裁剪編輯并一鍵發(fā)送給家人。

不過,Siri的更新先是被推遲到5月,現(xiàn)在又變成了無限延期。因為無限延期的AI 版Siri,蘋果還被消費者起訴,理由是虛假宣傳。

在今年5月的財報電話會議上,當被問及AI進展遲緩時,庫克著重強調(diào)了已上市的“Apple Intelligence”功能及其對西班牙語、中文等語言的支持升級。他表示Siri的革新只是需要更長時間來達到蘋果的質(zhì)量標準?!皼]有太多其他原因”,庫克說,“就是比我們預期多花了點時間。”

02 從遙遙領先,到遙遙落后?

作為僅次于初代iPhone的iPhone 4S系列,后者重要歷史地位的一大原因便是以智能助手亮相的初代Siri,當時Siri已經(jīng)能夠?qū)崿F(xiàn)預訂餐廳、查找影院或呼叫出租車等功能。

喬布斯的判斷是Siri未來會成為蘋果設備的核心交互方式,將Siri列為蘋果最高優(yōu)先級的開發(fā)項目之一。不過,喬布斯去世后,很長一段時間內(nèi)蘋果的研究重點是被稱為“登月計劃”的Vision Pro和新能源汽車。

Siri也因此被彎道超車。2018年,僅僅問世2年的Google Assistant表示,將在年底前支持 30 種語言,當時Siri僅支持21種語言。

2018年,蘋果從谷歌挖角約翰·詹南德雷亞(John Giannandrea)擔任人工智能部門負責人,想要一鼓作氣補足蘋果AI的短板。詹南德雷亞曾是谷歌的二號人物,他負責的人工智能部門僅用了2年時間就將AI整合到包括搜索、Gmail和Google Assistant等Google旗下的核心產(chǎn)品中,Google 因此遙遙領先行業(yè)至今。

有錢有人也有決心,蘋果看起來只要付出足夠多的時間和精力就可以反超,但事實并非如此。長期關注蘋果的記者Mark Gurmn發(fā)表在彭博社的一篇名為《Why Apple Still Hasn’t Cracked AI》的文章,揭露了蘋果AI依然落后于行業(yè)的內(nèi)幕。

首先,是高管們意見不統(tǒng)一。詹南德雷亞入職蘋果后,在內(nèi)部發(fā)起了一些列改革。他希望蘋果追加數(shù)億美元投資,用于開展機器學習模型訓練所需的大規(guī)模測試及圖文標注工作,撤換掉了Siri部門的負責人,并提議砍掉使用率低的功能。

但他的改革進展并不順利。蘋果軟件主管費德里吉始終不愿對AI進行大規(guī)模投入,他認為AI并不是個人電腦或移動設備的核心能力,也不愿抽調(diào)資源。

沒錢沒資源,詹南德雷亞主持的AI工作進展緩慢。2022年11月,ChatGPT的橫空出世令蘋果措手不及。一位蘋果高管坦言,在此之前“Apple Intelligence的概念甚至都未成形”?!癘penAI的動向并非什么秘密”,另一位高管反思道,“任何關注市場動向的人都該預見這一趨勢,并全力跟進?!?/p>

ChatGPT發(fā)布后不出1個月,此前對AI持懷疑態(tài)度的費德里吉就嘗試用生成式AI為他的個人軟件項目編寫代碼。這項技術(shù)的潛力頓時令他豁然開朗。他隨即與詹南德雷亞等高管密集會晤OpenAI、Anthropic等企業(yè),惡補最新模型與市場動態(tài)。

這次調(diào)研讓費德里吉當即要求:原定2024年發(fā)布的iOS 18必須搭載盡可能多的AI功能。為此,詹南德雷亞火速組建大語言模型團隊提供技術(shù)支持——而這正是競爭對手多年前就已布局的領域。

為了在2024年的WWDC上拿出令人信服的產(chǎn)品,一開始他們打算采用內(nèi)部自研的聊天機器人,但在內(nèi)測時團隊發(fā)現(xiàn)內(nèi)部研發(fā)的聊天機器人在響應大多數(shù)查詢時,準確率至少落后ChatGPT 25個百分點。蘋果開始尋求外部力量。

這時候,蘋果內(nèi)部高管團隊對于“和誰合作”又有了分歧,詹南德雷亞力主采用谷歌的Gemini方案,他的理由是OpenAI既缺乏持久運營能力,又在數(shù)據(jù)隱私保護方面不可信賴。然而,蘋果企業(yè)發(fā)展團隊得出了相反結(jié)論。最終在WWDC大會上,公司宣布將把Siri無法處理的請求轉(zhuǎn)接至ChatGPT。

技術(shù)整合直到12月才真正落地,即便如此,這是少數(shù)幾個能像宣傳的那樣正常運行的智能功能之一,比如郵件摘要、寫作工具(其AI內(nèi)核依然來源于ChatGPT)。更多功能給人倉促上市的感覺,比如Genmoji表情包等。

去年宣布的Siri的重大更新遲遲未發(fā)布,在此之前蘋果已經(jīng)預熱許久。文章稱蘋果最初計劃在2025年4月推出Siri升級功能。然而,在iOS 18.4系統(tǒng)預定發(fā)布前數(shù)周,軟件工程高級副總裁克雷格·費德里吉(Craig Federighi)親自測試該版本時震驚地發(fā)現(xiàn),包括“語音搜索調(diào)取駕照號碼”在內(nèi)的多項高調(diào)宣傳功能均無法正常運作(此前WWDC演示視頻實為早期原型的概念展示,非實際系統(tǒng)能力)。

部分高管對缺乏自研聊天機器人憂心忡,但詹南德雷亞的看法卻不同。他覺得OpenAI、Meta和谷歌等對手構(gòu)不成迫在眉睫的威脅,而消費者并不需要ChatGPT這類工具,而是一個可以控制設備的交互界面。因此,并未全力推動團隊開發(fā)面向消費者的ChatGPT競品。同時,詹南德雷亞向同事指出,營銷團隊對未完成功能的過度炒作難辭其咎。

為了加速Siri的上市,蘋果不得不將Siri的基礎架構(gòu)一分為二——舊代碼支撐設置鬧鐘等傳統(tǒng)功能,新代碼處理涉及個人數(shù)據(jù)的請求。團隊沒想到的是,這種臨時方案適得其反,最終引發(fā)系統(tǒng)整合問題導致延期。員工表示,單個功能或許運行良好,但當代碼合并進行整體測試時,系統(tǒng)就會開始崩潰。

蘋果大模型訓練的落后并不能完全歸咎于詹南德雷亞一人。從成立之初,這家公司向來對新技術(shù)持觀望態(tài)度,因此當谷歌、亞馬遜等企業(yè)瘋狂搶購GPU資源時,前首席財務官盧卡·梅斯特里卻很保守,最終導致GPU需求遠遠超過了供給。GPU資源不足導致模型訓練大幅度落后。

蘋果對用戶隱私的長期堅守同樣成為掣肘。雖然其23.5億臺活躍設備構(gòu)成的生態(tài),能獲取比多數(shù)競爭對手更豐富的用戶數(shù)據(jù),但相比谷歌、Meta和OpenAI,蘋果對AI研究人員接觸用戶數(shù)據(jù)的限制嚴苛得多。這使得蘋果的研究人員不得不嚴重依賴第三方授權(quán)數(shù)據(jù)集,也就是專為AI訓練生成的人造數(shù)據(jù),嚴重拖累進度。

03 大刀闊斧改革能翻盤嗎?

Siri的不斷延期讓庫克失去了耐心,約翰·詹南德雷亞(John Giannandrea)被罷免所有產(chǎn)品開發(fā)管理權(quán),包括Siri工程及未來機器人設備項目,Siri現(xiàn)由ision Pro混合現(xiàn)實頭盔開發(fā)的蘋果高管邁克·羅克韋爾(Mike Rockwell)負責,并直接匯報給蘋果軟件工程主管克雷格·費德里吉(Craig Federighi)。

《Why Apple Still Hasn’t Cracked AI》一文透露了Siri目前的最新進展。為了推進Siri的上市進度,蘋果已將蘇黎世AI辦公室作為新架構(gòu)研發(fā)基地,旨在取代當前問題頻出的Siri混合架構(gòu),新的架構(gòu)采用完全基于大語言模型引擎構(gòu)建的“單體模型”,最終將使Siri的對話更自然、信息整合更精準,該項目內(nèi)部代號為“LLM Siri”。

蘋果高層對另一項延期的AI功能同樣充滿期待,該功能將允許Siri深度接入iPhone應用程序,實現(xiàn)更強大的語音設備控制能力。這不僅能使年收入達200億美元的應用商店與聊天機器人形成共生關系,更避免了聊天機器人完全取代傳統(tǒng)應用的風險。

同時,蘋果沒有放棄打造屬于自己的聊天機器人,一些高管正積極推動將Siri打造成真正的ChatGPT競爭對手。據(jù)內(nèi)部員工透露,公司測試中的聊天機器人在過去半年取得重大突破,部分高管認為其表現(xiàn)已可與新版ChatGPT相媲美。

即便如此,Siri的重大更新版本在短期內(nèi)依然無法上市。文章指出,在12天后的WWDC大會,Siri的重大升級版本可能不會出現(xiàn)或者不被重點提及,蘋果公司的重點放在現(xiàn)有 Apple Intelligence 功能的完善和一些新功能的加入,例如,A優(yōu)化的電池管理模式,以及一個虛擬健康教練。

其中一個非常重要的變化是,蘋果正計劃Apple intelligence 開放給第三方開發(fā)者,該消息預計在6月9日的全球開發(fā)者大會上公布。這一次動作被認為是,蘋果試圖在生成式AI領域趕超對手的。

對于蘋果而言,在AI領域落后,未必是災難性的。這家公司往往樂于觀望競爭對手率先試水新技術(shù)——承擔所有開拓風險——再向10億級用戶推出設計精良、體驗流暢的自家版本。從MP3播放器、智能手機、平板電腦、智能手表到無線耳機,蘋果屢試不爽。

更多的蘋果員工認為,蘋果之所以能成為全球最具價值的科技公司,靠的是每年僅推出一次重大更新的軟件系統(tǒng),配合精挑細選的內(nèi)容打造極致產(chǎn)品;而人工智能領域卻要求更快的迭代速度、更高的容錯率,以及更激進的用戶介入。這恰好不是蘋果擅長的。

即將舉辦的WWDC上,我們或許依然無法看到蘋果在AI上的卓越表現(xiàn)。但他依然有機會跟上并反超。

參考文章: 彭博社《Why Apple Still Hasn’t Cracked AI》

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。

蘋果

7k
  • 挑戰(zhàn)蘋果?Meta被曝計劃增設實體零售店
  • 墨西哥議員稱特朗普政策或讓蘋果價格上漲300%

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

頻繁跳票背后,蘋果AI落后的真相

從遙遙領先,到遙遙落后?

文 | Tech星球

距離蘋果全球開發(fā)者大會(WWDC)還有20天,OpenAI 宣布了自其成立以來最大規(guī)模的收購案——以全股票交易的形式收購了蘋果前首席設計官Jony Ive創(chuàng)辦的硬件初創(chuàng)公司io。

通過收購“io”,OpenAI不僅獲得了曾參與設計iPhone等標志性產(chǎn)品的艾維及其前蘋果設計團隊,還將整合該初創(chuàng)公司的技術(shù)資源,并推出AI硬件產(chǎn)品。

Jony Ive曾主導iMac、iPhone、Apple Watch等劃時代產(chǎn)品的設計,定義了如今智能手機外觀與體驗。此次重返消費電子領域被視為蘋果最有潛力的對手之一。過去,消費電子領域一直是蘋果主導,公眾自然而然認為AI+消費電子,也應該是蘋果脫穎而出。

但蘋果屢次讓人失望,其最暢銷的產(chǎn)品iPhone至今未能實現(xiàn)在AI領域的大規(guī)模創(chuàng)新。被寄予厚望的SIri不過是定鬧鐘、問天氣而已,而且多個AI功能連續(xù)推遲上線后體驗仍然不佳。

多重因素影響,今年以來,蘋果股價已經(jīng)下跌了25%。長期關注蘋果的記者Mark Gurmn發(fā)表在彭博社的一篇名為《Why Apple Still Hasn’t Cracked AI》的文章揭露了蘋果AI依然落后于行業(yè)的內(nèi)幕。根據(jù)此文,并結(jié)合蘋果AI的最新動態(tài),本文試圖還原“蘋果AI為什么落后了”。

01 多次跳票的蘋果AI

蘋果AI的核心圍繞其稱為個人智能系統(tǒng)(personal intelligence system)的 Apple Intelligence,這套系統(tǒng)于去年在蘋果WWDC大會上推出,并許諾了包含郵件摘要、寫作工具、Genmoji自定義表情、新聞摘要等AI功能。

iPhone因為更新乏善可陳而屢屢被詬病,為提高消費者購買熱情,去年9月的蘋果手機發(fā)布會上(此時距離WWDC已經(jīng)過去3個月),蘋果宣稱最新款iPhone 16“專為Apple Intelligence深度打造”,但當月新機發(fā)售時卻未見AI功能蹤影,iPhone 16系列在首周末預購銷量也未及預期。

寫作助手與摘要生成等首批功能延后一個半月才陸續(xù)上線;Genmoji定制表情直至去年12月面世;而基于緊急程度智能排序通知的iOS系統(tǒng)通知功能重大升級,更遲至次年3月方才落地。

項目延期并非不可理解,游戲公司延遲發(fā)布一兩年都實屬正常,蘋果在AI的表現(xiàn)本就落后于OpneAI、Google這樣的公司,延遲上線后,更是令公眾失望。

接入ChatGPT的寫作功能,被吐槽像個臨時塞進去的,事實上也確實如此,有用戶吐槽該功能在概括和提取要點方面平平無奇。

用戶用Apple Intelligence要點提取功能,輸出的結(jié)果不佳。

Genmoji自定義表情,承諾能生成孔雀與冰棒融合等創(chuàng)意圖形,但實際效果遠遜于蘋果在廣告中展示的精致設計,且因算力消耗過大可能導致iPhone過熱并急劇耗電。

當時宣稱iOS通知功能可以將用戶蘋果手機內(nèi)包含郵件、網(wǎng)頁、各類應用和圖片的多種推送信息進行整合,以方便用戶一目了然,并優(yōu)先處理重要的內(nèi)容。

但實際運行中屢屢出錯。最受爭議的便是關于美國聯(lián)合健康集團(UNH)旗下聯(lián)合健康保險公司首席執(zhí)行官(CEO)布萊恩·湯普森(Brian Thompson)的推送。蘋果將湯普森在紐約街頭遭遇槍殺的報道提取總結(jié)為(槍手)路易吉·曼吉奧內(nèi)(Luigi Mangione)對自己開槍”。槍手路易吉因為一張俊朗的出庭照片風靡社交平臺,不少支持者認為路易吉是替3990萬背負醫(yī)療負載的人扣動扳機。

因為出現(xiàn)多次嚴重事實錯誤,許多用戶打算棄用或者關閉該功能,沒多久,該功能被迫下線。

去年WWDC發(fā)布會占據(jù)C位的的Siri,承載著蘋果AI的野望。蘋果首次宣稱該語音助手將能深度解析用戶個人數(shù)據(jù)與屏幕內(nèi)容進行應答。演示環(huán)節(jié)中,時任蘋果人工智能負責人的約翰·詹南德雷亞(John Giannandrea)團隊核心成員向Siri詢問母親旅行計劃,系統(tǒng)通過無縫整合郵件與短信信息,自動生成行程安排。公司同時宣布用戶可通過新型Siri實現(xiàn)無觸控操作:例如選擇照片、裁剪編輯并一鍵發(fā)送給家人。

不過,Siri的更新先是被推遲到5月,現(xiàn)在又變成了無限延期。因為無限延期的AI 版Siri,蘋果還被消費者起訴,理由是虛假宣傳。

在今年5月的財報電話會議上,當被問及AI進展遲緩時,庫克著重強調(diào)了已上市的“Apple Intelligence”功能及其對西班牙語、中文等語言的支持升級。他表示Siri的革新只是需要更長時間來達到蘋果的質(zhì)量標準。“沒有太多其他原因”,庫克說,“就是比我們預期多花了點時間?!?/p>

02 從遙遙領先,到遙遙落后?

作為僅次于初代iPhone的iPhone 4S系列,后者重要歷史地位的一大原因便是以智能助手亮相的初代Siri,當時Siri已經(jīng)能夠?qū)崿F(xiàn)預訂餐廳、查找影院或呼叫出租車等功能。

喬布斯的判斷是Siri未來會成為蘋果設備的核心交互方式,將Siri列為蘋果最高優(yōu)先級的開發(fā)項目之一。不過,喬布斯去世后,很長一段時間內(nèi)蘋果的研究重點是被稱為“登月計劃”的Vision Pro和新能源汽車。

Siri也因此被彎道超車。2018年,僅僅問世2年的Google Assistant表示,將在年底前支持 30 種語言,當時Siri僅支持21種語言。

2018年,蘋果從谷歌挖角約翰·詹南德雷亞(John Giannandrea)擔任人工智能部門負責人,想要一鼓作氣補足蘋果AI的短板。詹南德雷亞曾是谷歌的二號人物,他負責的人工智能部門僅用了2年時間就將AI整合到包括搜索、Gmail和Google Assistant等Google旗下的核心產(chǎn)品中,Google 因此遙遙領先行業(yè)至今。

有錢有人也有決心,蘋果看起來只要付出足夠多的時間和精力就可以反超,但事實并非如此。長期關注蘋果的記者Mark Gurmn發(fā)表在彭博社的一篇名為《Why Apple Still Hasn’t Cracked AI》的文章,揭露了蘋果AI依然落后于行業(yè)的內(nèi)幕。

首先,是高管們意見不統(tǒng)一。詹南德雷亞入職蘋果后,在內(nèi)部發(fā)起了一些列改革。他希望蘋果追加數(shù)億美元投資,用于開展機器學習模型訓練所需的大規(guī)模測試及圖文標注工作,撤換掉了Siri部門的負責人,并提議砍掉使用率低的功能。

但他的改革進展并不順利。蘋果軟件主管費德里吉始終不愿對AI進行大規(guī)模投入,他認為AI并不是個人電腦或移動設備的核心能力,也不愿抽調(diào)資源。

沒錢沒資源,詹南德雷亞主持的AI工作進展緩慢。2022年11月,ChatGPT的橫空出世令蘋果措手不及。一位蘋果高管坦言,在此之前“Apple Intelligence的概念甚至都未成形”?!癘penAI的動向并非什么秘密”,另一位高管反思道,“任何關注市場動向的人都該預見這一趨勢,并全力跟進?!?/p>

ChatGPT發(fā)布后不出1個月,此前對AI持懷疑態(tài)度的費德里吉就嘗試用生成式AI為他的個人軟件項目編寫代碼。這項技術(shù)的潛力頓時令他豁然開朗。他隨即與詹南德雷亞等高管密集會晤OpenAI、Anthropic等企業(yè),惡補最新模型與市場動態(tài)。

這次調(diào)研讓費德里吉當即要求:原定2024年發(fā)布的iOS 18必須搭載盡可能多的AI功能。為此,詹南德雷亞火速組建大語言模型團隊提供技術(shù)支持——而這正是競爭對手多年前就已布局的領域。

為了在2024年的WWDC上拿出令人信服的產(chǎn)品,一開始他們打算采用內(nèi)部自研的聊天機器人,但在內(nèi)測時團隊發(fā)現(xiàn)內(nèi)部研發(fā)的聊天機器人在響應大多數(shù)查詢時,準確率至少落后ChatGPT 25個百分點。蘋果開始尋求外部力量。

這時候,蘋果內(nèi)部高管團隊對于“和誰合作”又有了分歧,詹南德雷亞力主采用谷歌的Gemini方案,他的理由是OpenAI既缺乏持久運營能力,又在數(shù)據(jù)隱私保護方面不可信賴。然而,蘋果企業(yè)發(fā)展團隊得出了相反結(jié)論。最終在WWDC大會上,公司宣布將把Siri無法處理的請求轉(zhuǎn)接至ChatGPT。

技術(shù)整合直到12月才真正落地,即便如此,這是少數(shù)幾個能像宣傳的那樣正常運行的智能功能之一,比如郵件摘要、寫作工具(其AI內(nèi)核依然來源于ChatGPT)。更多功能給人倉促上市的感覺,比如Genmoji表情包等。

去年宣布的Siri的重大更新遲遲未發(fā)布,在此之前蘋果已經(jīng)預熱許久。文章稱蘋果最初計劃在2025年4月推出Siri升級功能。然而,在iOS 18.4系統(tǒng)預定發(fā)布前數(shù)周,軟件工程高級副總裁克雷格·費德里吉(Craig Federighi)親自測試該版本時震驚地發(fā)現(xiàn),包括“語音搜索調(diào)取駕照號碼”在內(nèi)的多項高調(diào)宣傳功能均無法正常運作(此前WWDC演示視頻實為早期原型的概念展示,非實際系統(tǒng)能力)。

部分高管對缺乏自研聊天機器人憂心忡,但詹南德雷亞的看法卻不同。他覺得OpenAI、Meta和谷歌等對手構(gòu)不成迫在眉睫的威脅,而消費者并不需要ChatGPT這類工具,而是一個可以控制設備的交互界面。因此,并未全力推動團隊開發(fā)面向消費者的ChatGPT競品。同時,詹南德雷亞向同事指出,營銷團隊對未完成功能的過度炒作難辭其咎。

為了加速Siri的上市,蘋果不得不將Siri的基礎架構(gòu)一分為二——舊代碼支撐設置鬧鐘等傳統(tǒng)功能,新代碼處理涉及個人數(shù)據(jù)的請求。團隊沒想到的是,這種臨時方案適得其反,最終引發(fā)系統(tǒng)整合問題導致延期。員工表示,單個功能或許運行良好,但當代碼合并進行整體測試時,系統(tǒng)就會開始崩潰。

蘋果大模型訓練的落后并不能完全歸咎于詹南德雷亞一人。從成立之初,這家公司向來對新技術(shù)持觀望態(tài)度,因此當谷歌、亞馬遜等企業(yè)瘋狂搶購GPU資源時,前首席財務官盧卡·梅斯特里卻很保守,最終導致GPU需求遠遠超過了供給。GPU資源不足導致模型訓練大幅度落后。

蘋果對用戶隱私的長期堅守同樣成為掣肘。雖然其23.5億臺活躍設備構(gòu)成的生態(tài),能獲取比多數(shù)競爭對手更豐富的用戶數(shù)據(jù),但相比谷歌、Meta和OpenAI,蘋果對AI研究人員接觸用戶數(shù)據(jù)的限制嚴苛得多。這使得蘋果的研究人員不得不嚴重依賴第三方授權(quán)數(shù)據(jù)集,也就是專為AI訓練生成的人造數(shù)據(jù),嚴重拖累進度。

03 大刀闊斧改革能翻盤嗎?

Siri的不斷延期讓庫克失去了耐心,約翰·詹南德雷亞(John Giannandrea)被罷免所有產(chǎn)品開發(fā)管理權(quán),包括Siri工程及未來機器人設備項目,Siri現(xiàn)由ision Pro混合現(xiàn)實頭盔開發(fā)的蘋果高管邁克·羅克韋爾(Mike Rockwell)負責,并直接匯報給蘋果軟件工程主管克雷格·費德里吉(Craig Federighi)。

《Why Apple Still Hasn’t Cracked AI》一文透露了Siri目前的最新進展。為了推進Siri的上市進度,蘋果已將蘇黎世AI辦公室作為新架構(gòu)研發(fā)基地,旨在取代當前問題頻出的Siri混合架構(gòu),新的架構(gòu)采用完全基于大語言模型引擎構(gòu)建的“單體模型”,最終將使Siri的對話更自然、信息整合更精準,該項目內(nèi)部代號為“LLM Siri”。

蘋果高層對另一項延期的AI功能同樣充滿期待,該功能將允許Siri深度接入iPhone應用程序,實現(xiàn)更強大的語音設備控制能力。這不僅能使年收入達200億美元的應用商店與聊天機器人形成共生關系,更避免了聊天機器人完全取代傳統(tǒng)應用的風險。

同時,蘋果沒有放棄打造屬于自己的聊天機器人,一些高管正積極推動將Siri打造成真正的ChatGPT競爭對手。據(jù)內(nèi)部員工透露,公司測試中的聊天機器人在過去半年取得重大突破,部分高管認為其表現(xiàn)已可與新版ChatGPT相媲美。

即便如此,Siri的重大更新版本在短期內(nèi)依然無法上市。文章指出,在12天后的WWDC大會,Siri的重大升級版本可能不會出現(xiàn)或者不被重點提及,蘋果公司的重點放在現(xiàn)有 Apple Intelligence 功能的完善和一些新功能的加入,例如,A優(yōu)化的電池管理模式,以及一個虛擬健康教練。

其中一個非常重要的變化是,蘋果正計劃Apple intelligence 開放給第三方開發(fā)者,該消息預計在6月9日的全球開發(fā)者大會上公布。這一次動作被認為是,蘋果試圖在生成式AI領域趕超對手的。

對于蘋果而言,在AI領域落后,未必是災難性的。這家公司往往樂于觀望競爭對手率先試水新技術(shù)——承擔所有開拓風險——再向10億級用戶推出設計精良、體驗流暢的自家版本。從MP3播放器、智能手機、平板電腦、智能手表到無線耳機,蘋果屢試不爽。

更多的蘋果員工認為,蘋果之所以能成為全球最具價值的科技公司,靠的是每年僅推出一次重大更新的軟件系統(tǒng),配合精挑細選的內(nèi)容打造極致產(chǎn)品;而人工智能領域卻要求更快的迭代速度、更高的容錯率,以及更激進的用戶介入。這恰好不是蘋果擅長的。

即將舉辦的WWDC上,我們或許依然無法看到蘋果在AI上的卓越表現(xiàn)。但他依然有機會跟上并反超。

參考文章: 彭博社《Why Apple Still Hasn’t Cracked AI》

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。