正在閱讀:

噱頭之下,什么才是真“AI PC”?

掃一掃下載界面新聞APP

噱頭之下,什么才是真“AI PC”?

某種程度上來說,強(qiáng)綁定AI概念的PC業(yè)確實(shí)有了起色。

文|半導(dǎo)體產(chǎn)業(yè)縱橫

距離AI PC推出的概念炒作已經(jīng)一年有余了,但似乎“雷聲大,雨點(diǎn)小”。市場和消費(fèi)者似乎也并不買賬。AI PC真的“AI”嗎?什么才是真·AI PC?看看真正的AI大廠給的答案吧。

AI PC概念的興起

AI PC是Artificial Intelligence Personal Computer的簡稱,最早由英特爾于2023年9月提出,短短時(shí)間內(nèi)獲得業(yè)內(nèi)廣泛青睞,盡管發(fā)展時(shí)間不長,但業(yè)內(nèi)普遍認(rèn)為,AI PC將會(huì)是PC行業(yè)的轉(zhuǎn)折點(diǎn)。而Canalys 對 AI PC 的定義為配備專用 AI 芯片組或模塊(如 NPU)的臺(tái)式機(jī)和筆記本電腦,用于處理 AI 工作負(fù)載。

2024年被業(yè)界公認(rèn)為AI PC應(yīng)用的元年,各大企業(yè)紛紛推出了自己的AI電腦。

3月初,蘋果發(fā)布AI PC MacBook Air。3月18日,榮耀發(fā)布公司首款A(yù)I PC MagicBook Pro 16,緊接著,AMD董事會(huì)主席及CEO蘇姿豐宣布AMD銳龍8040系列AI PC處理器已經(jīng)實(shí)現(xiàn)出貨。3月22日,微軟宣布推出Surface AI PC。4月11日,華為發(fā)布新款MateBook X Pro筆記本電腦,首次應(yīng)用華為盤古大模型。

某種程度上來說,強(qiáng)綁定AI概念的PC業(yè)確實(shí)有了起色。2024年第四季度,AI PC出貨量達(dá)到1540萬臺(tái),占季度PC總出貨量的23%。2024年全年,AI PC占PC總出貨量的17%。其中,蘋果以54%的市場份額領(lǐng)跑,聯(lián)想和惠普各占12%。受Windows 10服務(wù)停止帶來的換機(jī)潮,AI PC的市場滲透率將在2025年繼續(xù)提升。但這其中究竟有多少AI含量?

AI PC:雷聲大雨點(diǎn)小

2024年2月23日,聯(lián)想CEO楊元慶在最新財(cái)報(bào)發(fā)布后表示,預(yù)計(jì)2024年全球PC出貨量將同比增長約5%。盡管面臨一些挑戰(zhàn),但他堅(jiān)信人工智能將是推動(dòng)聯(lián)想業(yè)務(wù)增長和重塑的關(guān)鍵因素。

然而,楊元慶也指出,目前AI PC市場還處于初級(jí)階段,盡管“雷聲大”,但實(shí)際銷售量和用戶接受度還相對較低。他認(rèn)為,這主要是由于技術(shù)成熟度、用戶教育以及市場接受度等方面的原因。

對于已經(jīng)發(fā)布的 AI PC 產(chǎn)品,不少人并不認(rèn)可,核心在于這些 AI PC 中“AI”與“PC”(硬件)基本是分離的。以目前 PC 上最大的 AI 用例——微軟 Copilot 來說,在英特爾與微軟對AI PC的聯(lián)合定義中,強(qiáng)調(diào)必須配備混合架構(gòu)芯片、Copilot 及其對應(yīng)的物理按鍵。但事實(shí)是,所有升級(jí)到最新 Windows 11 版本的 PC 都能使用 Copilot,因?yàn)?Copilot 只依賴于微軟 Azure 云端算力,與 PC 硬件本身無關(guān)。

而作為掌握核心科技的AI芯片老大,英偉達(dá)根本就不理微軟的定義,試問又有誰能比英偉達(dá)更有AI 的話語權(quán)?而英偉達(dá)很早就開始布局 AI 領(lǐng)域的生態(tài),自1993年成立以來,一直是加速計(jì)算領(lǐng)域的先驅(qū),擁有最廣泛 CUDA 生態(tài)應(yīng)用的 AI 生產(chǎn)力,帶有 N 卡獨(dú)顯的高性能PC,不那么依賴于 OEM 的適配,不但可以運(yùn)行輕量極的 AI 工具,比如本地的大語言模型,簡單的 Stable Diffusion繪圖,甚至可以玩中等規(guī)模的 AI 模型,實(shí)際使用的生成速度,也比普通核顯玩AI快得多。

之所以現(xiàn)在AI PC受到市場冷遇,主要有以下幾點(diǎn)原因:

1、現(xiàn)階段AI PC搭載的NPU算力不足

Intel NPU的AI性能最高為48TOPS,Intel Xe 核顯大約28TOPS。搭載核顯的 AI PC 算力目前在 10 - 45 TOPS 這個(gè)量級(jí),而搭載 GeForce RTX 40 系列 GPU 的設(shè)備,涵蓋了筆記本電腦和臺(tái)式主機(jī),能提供 200 - 1400 TOPS 不同級(jí)別的產(chǎn)品方案選擇。

而今年發(fā)布的RTX 5090顯卡采用了NVIDIA的Blackwell架構(gòu),這使得它在性能上有了質(zhì)的飛躍。據(jù)NVIDIA官方介紹,RTX 5090的AI算力達(dá)到了4000 TOPS,是上一代Ada Lovelace架構(gòu)的三倍。

NPU的AI算力與GPU相比可謂是弟中弟。

事實(shí)上主流的那些常見AI應(yīng)用方面,本地上哪怕單塊RTX 4080、4090也不見得多充沛,可想而知NPU這點(diǎn)算力也確實(shí)沒有太多作用。

2、NPU不帶DRAM,無法單獨(dú)支撐大模型運(yùn)行

目前的AI大模型從硬件需求來說都是“DRAM 的大模型”。NPU天生不帶DRAM,依賴系統(tǒng)RAM。也就是運(yùn)行大模型必須另配64G以上的DRAM以配合NPU——都加碼到這份上了,這為啥不直接用APU/GPU跑呢,都要加錢了,讓誰跑不是跑?

而且APU和GPU跑AI大模型是開源適配好的,可謂是開箱即用。

3、NPU適配應(yīng)用少,應(yīng)用范圍窄

理論上,現(xiàn)在NPU上已經(jīng)能跑LLM大語言模型、stable diffusion圖片生成、常見CV神經(jīng)網(wǎng)絡(luò)的推理(包括Resnet、yolo)、whisper語音轉(zhuǎn)文字。基本上所有的AI推理負(fù)載,本質(zhì)上就是矩陣運(yùn)算,都能夠通過NPU來實(shí)現(xiàn)低功耗運(yùn)行。

但實(shí)際上現(xiàn)在用戶買到的Windows筆記本電腦,能夠調(diào)用NPU的應(yīng)用場景是Windows Studio Effect里面的背景虛化、剪映摳圖。應(yīng)用范圍實(shí)在是太窄了。NPU支持的本地程序截止目前非常少。

總體來說,目前NPU實(shí)際能用的功能都是一些花拳繡腿。這一輪AI真正火起來,還是因?yàn)榇蠹铱吹紺hatGPT這樣的聊天機(jī)器人能夠解決很多問題。所以如果真的要讓NPU發(fā)揮作用,還是需要能運(yùn)行LLM大語言模型,而顯然當(dāng)前AI PC上的NPU無法滿足需求。

NPU還是GPU不重要,但本地化的AI很需要。而目前來看,是不是AI PC并不重要,有沒有搭載NVIDIA GPU比較重要。

三大廠的“真·AI PC”

此前雖然一些廠商宣傳推出了AI PC產(chǎn)品。但實(shí)際上卻至少噱頭居多,只是搭載了NPU芯片,而沒有真正的本地大模型運(yùn)行。既不能訓(xùn)練、也不能推理。

AI PC 的概念被廣泛宣傳在筆記本電腦上。然而,現(xiàn)在沒有任何一臺(tái)輕薄本,稱得上是高算力的 AI 專用計(jì)算設(shè)備PC,反倒是傳統(tǒng)的高性能游戲本,搭載強(qiáng)大 GPU 顯卡的臺(tái)式機(jī),可以真的去提供真正的 AI生產(chǎn)力。

真·AI PC還是得看能開發(fā)高性能GPU的廠商,比如英偉達(dá)和AMD。

而就在今年年初CES上,AMD發(fā)布了AI Max 300Strix Halo。黃仁勛也發(fā)布了Project DIGITS。再加上此前蘋果公司的Mac Pro。這三個(gè)是本地部署大模型的利器。堪稱“桌面AI超級(jí)電腦”。

AMD發(fā)布的Strix Halo有兩種:消費(fèi)級(jí)的Strix Halo---主要用于消費(fèi)性能筆電(游戲本)和商用級(jí)的Strix Halo Pro---主要用于移動(dòng)工作站。曝光的3DMark測試數(shù)據(jù)顯示,其旗艦型號(hào)Ryzen AI MAX+ 395有16個(gè)基于Zen 5架構(gòu)的CPU核心,32線程;40個(gè)基于RDNA 3.5架構(gòu)的GPU核心,即Radeon 8060S核顯;最高120W,是標(biāo)準(zhǔn)移動(dòng)APU的3倍;支持四通道LPDDR5X內(nèi)存,提供高達(dá)256 GB/s的帶寬。值得注意的是,集成的Radeon 8060S核顯性能竟達(dá)到前代Radeon 890M的三倍以上,甚至逼近RTX 4060獨(dú)顯水平。

英偉達(dá)將其發(fā)布的Project DIGITS稱之為“目前體積最小的AI超算”。Project DIGITS使用了一顆定制的“GB10”超級(jí)芯片,它在一個(gè)核心里融合了基于Blackwell架構(gòu)的GPU,以及NVIDIA與聯(lián)發(fā)科、ARM三方合作研發(fā)的Grace CPU。資料顯示,其中的Blackwell GPU能夠提供1PFLOPS的FP4算力,同時(shí)Grace CPU則包含了10個(gè)Cortex-X925核心和10個(gè)Cortex-A725核心。在GPU和CPU之間,則是通過大型超算同款的NVLINK-C2C芯片到芯片互聯(lián)總線連接。

Project DIGITS還配備了一顆獨(dú)立的NVIDIA ConnectX互聯(lián)芯片,它可以讓“GB10”超級(jí)芯片內(nèi)部的GPU兼容多種不同的互聯(lián)技術(shù)標(biāo)準(zhǔn),其中包括NCCL、RDMA、GPUDirect等,從而使得這顆“大核顯”可以被各種開發(fā)軟件和AI應(yīng)用直接訪問。

而蘋果則在2023年發(fā)布了M3系列芯片并配備了下一代 GPU,代表了蘋果芯片圖形架構(gòu)史上最大的飛躍。不僅速度更快、能效更高,并且還引入了稱之為“動(dòng)態(tài)緩存”的新技術(shù),同時(shí)首次為 Mac 帶來了硬件加速光線追蹤和網(wǎng)格著色等新渲染功能。渲染速度現(xiàn)在比 M1 系列芯片快 2.5 倍。值得注意的是,全新的M3 系列芯片帶來最高128GB的統(tǒng)一的內(nèi)存架構(gòu)。蘋果稱,對高達(dá) 128GB 內(nèi)存的支持解鎖了以前在筆記本電腦上無法實(shí)現(xiàn)的工作流程,例如人工智能開發(fā)人員使用具有數(shù)十億參數(shù)的更大的Transformer模型。去年蘋果有發(fā)布了M4 Pro芯片,性能號(hào)稱超越AI PC芯片。

而這三者都采用了一種叫做統(tǒng)一內(nèi)存架構(gòu)的技術(shù)。統(tǒng)一架構(gòu)的好處,就是把以前內(nèi)存和顯存(顯卡的內(nèi)存)做了統(tǒng)一,這樣就減少了CPU和GPU通信時(shí)候,在內(nèi)存和顯存之間數(shù)據(jù)通信時(shí)候的拷貝。此外,這一技術(shù)也能使電腦顯存更大,從而可以打破消費(fèi)級(jí)顯卡在運(yùn)行大模型時(shí)候顯存不足的困境。值得注意的是,統(tǒng)一內(nèi)存設(shè)計(jì)不是英偉達(dá)首創(chuàng),蘋果M1才是第一例。

Deepseek開啟桌面 AI 超級(jí)電腦之戰(zhàn)

近一段時(shí)間以來,DeepSeek線上算力的嚴(yán)重不足,帶火了大模型本地部署需求,三大廠的“真·AI PC”也都開始廠商部署DeepSeek。

而DeepSeek作為一款MoE模型對顯存要求高,對算力/內(nèi)存帶寬要求相對低。這也給了這些通過統(tǒng)一內(nèi)存技術(shù)而擁有大顯存的桌面AI超級(jí)電腦可乘之機(jī)。

之前有國外大佬用8臺(tái)M4 Pro Mac mini跑DeepSeek V3。同樣的,預(yù)計(jì)可以利用四臺(tái)Project DIGITS來部署DeepSeek V3,而且生成速度應(yīng)該也會(huì)快很多。根據(jù)AMD自己的公布,strix halo架構(gòu)APU可以部署70B的模型,比4090快2.2倍,功耗低87%。

有網(wǎng)友表示,“打算等halo筆記本上市之后把現(xiàn)在的筆記本換掉的,本地部署大模型確實(shí)有意思,再過幾年也許就可以本地部署671B的INT8或者FP8大模型了。除了大模型,RAM和CPU配置提高了,做其它事情也快?!?/p>

AI賽道,或許是國產(chǎn)廠商切入PC芯片領(lǐng)域的契機(jī)。當(dāng)前許多廠商開始營銷各類AI一體機(jī)產(chǎn)品。相信如果國產(chǎn)廠商能推出更大統(tǒng)一內(nèi)存,比如256G版本的國產(chǎn)“Project DIGITS”,也許會(huì)更受歡迎。

AI PC 的概念,是任人打扮的小姑娘。故事,其實(shí)各家有各家的講法。OEM 各大廠百花齊放,砸錢砸工程師做本地化AI應(yīng)用,軟件有些能本地也能云,云服務(wù)可以接入國產(chǎn)模型做商業(yè),可能是一快很好的蛋糕。

低延遲+隱私保護(hù),或許是拉動(dòng)類似GPT一類大語言模型,SD繪圖,聲音克隆,AI補(bǔ)幀,摳圖,重繪等本地化AI應(yīng)用的一個(gè)點(diǎn)。

AI PC 的足夠強(qiáng)的邊緣算力 + 大內(nèi)存(顯存)+優(yōu)化到足夠高效的軟件,結(jié)合起來才能有望解決行業(yè)痛點(diǎn),大批量落地 AI 終端。所以說,AI PC 其實(shí)也不完全是噱頭炒作,不管是更普惠的AI,更高能效的AI,還是更強(qiáng)大算力的AI,還是基于云和網(wǎng)絡(luò)更簡單好用的AI,都是有在進(jìn)一步發(fā)展技術(shù),摸索市場。

 
本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。

評(píng)論

暫無評(píng)論哦,快來評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

噱頭之下,什么才是真“AI PC”?

某種程度上來說,強(qiáng)綁定AI概念的PC業(yè)確實(shí)有了起色。

文|半導(dǎo)體產(chǎn)業(yè)縱橫

距離AI PC推出的概念炒作已經(jīng)一年有余了,但似乎“雷聲大,雨點(diǎn)小”。市場和消費(fèi)者似乎也并不買賬。AI PC真的“AI”嗎?什么才是真·AI PC?看看真正的AI大廠給的答案吧。

AI PC概念的興起

AI PC是Artificial Intelligence Personal Computer的簡稱,最早由英特爾于2023年9月提出,短短時(shí)間內(nèi)獲得業(yè)內(nèi)廣泛青睞,盡管發(fā)展時(shí)間不長,但業(yè)內(nèi)普遍認(rèn)為,AI PC將會(huì)是PC行業(yè)的轉(zhuǎn)折點(diǎn)。而Canalys 對 AI PC 的定義為配備專用 AI 芯片組或模塊(如 NPU)的臺(tái)式機(jī)和筆記本電腦,用于處理 AI 工作負(fù)載。

2024年被業(yè)界公認(rèn)為AI PC應(yīng)用的元年,各大企業(yè)紛紛推出了自己的AI電腦。

3月初,蘋果發(fā)布AI PC MacBook Air。3月18日,榮耀發(fā)布公司首款A(yù)I PC MagicBook Pro 16,緊接著,AMD董事會(huì)主席及CEO蘇姿豐宣布AMD銳龍8040系列AI PC處理器已經(jīng)實(shí)現(xiàn)出貨。3月22日,微軟宣布推出Surface AI PC。4月11日,華為發(fā)布新款MateBook X Pro筆記本電腦,首次應(yīng)用華為盤古大模型。

某種程度上來說,強(qiáng)綁定AI概念的PC業(yè)確實(shí)有了起色。2024年第四季度,AI PC出貨量達(dá)到1540萬臺(tái),占季度PC總出貨量的23%。2024年全年,AI PC占PC總出貨量的17%。其中,蘋果以54%的市場份額領(lǐng)跑,聯(lián)想和惠普各占12%。受Windows 10服務(wù)停止帶來的換機(jī)潮,AI PC的市場滲透率將在2025年繼續(xù)提升。但這其中究竟有多少AI含量?

AI PC:雷聲大雨點(diǎn)小

2024年2月23日,聯(lián)想CEO楊元慶在最新財(cái)報(bào)發(fā)布后表示,預(yù)計(jì)2024年全球PC出貨量將同比增長約5%。盡管面臨一些挑戰(zhàn),但他堅(jiān)信人工智能將是推動(dòng)聯(lián)想業(yè)務(wù)增長和重塑的關(guān)鍵因素。

然而,楊元慶也指出,目前AI PC市場還處于初級(jí)階段,盡管“雷聲大”,但實(shí)際銷售量和用戶接受度還相對較低。他認(rèn)為,這主要是由于技術(shù)成熟度、用戶教育以及市場接受度等方面的原因。

對于已經(jīng)發(fā)布的 AI PC 產(chǎn)品,不少人并不認(rèn)可,核心在于這些 AI PC 中“AI”與“PC”(硬件)基本是分離的。以目前 PC 上最大的 AI 用例——微軟 Copilot 來說,在英特爾與微軟對AI PC的聯(lián)合定義中,強(qiáng)調(diào)必須配備混合架構(gòu)芯片、Copilot 及其對應(yīng)的物理按鍵。但事實(shí)是,所有升級(jí)到最新 Windows 11 版本的 PC 都能使用 Copilot,因?yàn)?Copilot 只依賴于微軟 Azure 云端算力,與 PC 硬件本身無關(guān)。

而作為掌握核心科技的AI芯片老大,英偉達(dá)根本就不理微軟的定義,試問又有誰能比英偉達(dá)更有AI 的話語權(quán)?而英偉達(dá)很早就開始布局 AI 領(lǐng)域的生態(tài),自1993年成立以來,一直是加速計(jì)算領(lǐng)域的先驅(qū),擁有最廣泛 CUDA 生態(tài)應(yīng)用的 AI 生產(chǎn)力,帶有 N 卡獨(dú)顯的高性能PC,不那么依賴于 OEM 的適配,不但可以運(yùn)行輕量極的 AI 工具,比如本地的大語言模型,簡單的 Stable Diffusion繪圖,甚至可以玩中等規(guī)模的 AI 模型,實(shí)際使用的生成速度,也比普通核顯玩AI快得多。

之所以現(xiàn)在AI PC受到市場冷遇,主要有以下幾點(diǎn)原因:

1、現(xiàn)階段AI PC搭載的NPU算力不足

Intel NPU的AI性能最高為48TOPS,Intel Xe 核顯大約28TOPS。搭載核顯的 AI PC 算力目前在 10 - 45 TOPS 這個(gè)量級(jí),而搭載 GeForce RTX 40 系列 GPU 的設(shè)備,涵蓋了筆記本電腦和臺(tái)式主機(jī),能提供 200 - 1400 TOPS 不同級(jí)別的產(chǎn)品方案選擇。

而今年發(fā)布的RTX 5090顯卡采用了NVIDIA的Blackwell架構(gòu),這使得它在性能上有了質(zhì)的飛躍。據(jù)NVIDIA官方介紹,RTX 5090的AI算力達(dá)到了4000 TOPS,是上一代Ada Lovelace架構(gòu)的三倍。

NPU的AI算力與GPU相比可謂是弟中弟。

事實(shí)上主流的那些常見AI應(yīng)用方面,本地上哪怕單塊RTX 4080、4090也不見得多充沛,可想而知NPU這點(diǎn)算力也確實(shí)沒有太多作用。

2、NPU不帶DRAM,無法單獨(dú)支撐大模型運(yùn)行

目前的AI大模型從硬件需求來說都是“DRAM 的大模型”。NPU天生不帶DRAM,依賴系統(tǒng)RAM。也就是運(yùn)行大模型必須另配64G以上的DRAM以配合NPU——都加碼到這份上了,這為啥不直接用APU/GPU跑呢,都要加錢了,讓誰跑不是跑?

而且APU和GPU跑AI大模型是開源適配好的,可謂是開箱即用。

3、NPU適配應(yīng)用少,應(yīng)用范圍窄

理論上,現(xiàn)在NPU上已經(jīng)能跑LLM大語言模型、stable diffusion圖片生成、常見CV神經(jīng)網(wǎng)絡(luò)的推理(包括Resnet、yolo)、whisper語音轉(zhuǎn)文字?;旧纤械腁I推理負(fù)載,本質(zhì)上就是矩陣運(yùn)算,都能夠通過NPU來實(shí)現(xiàn)低功耗運(yùn)行。

但實(shí)際上現(xiàn)在用戶買到的Windows筆記本電腦,能夠調(diào)用NPU的應(yīng)用場景是Windows Studio Effect里面的背景虛化、剪映摳圖。應(yīng)用范圍實(shí)在是太窄了。NPU支持的本地程序截止目前非常少。

總體來說,目前NPU實(shí)際能用的功能都是一些花拳繡腿。這一輪AI真正火起來,還是因?yàn)榇蠹铱吹紺hatGPT這樣的聊天機(jī)器人能夠解決很多問題。所以如果真的要讓NPU發(fā)揮作用,還是需要能運(yùn)行LLM大語言模型,而顯然當(dāng)前AI PC上的NPU無法滿足需求。

NPU還是GPU不重要,但本地化的AI很需要。而目前來看,是不是AI PC并不重要,有沒有搭載NVIDIA GPU比較重要。

三大廠的“真·AI PC”

此前雖然一些廠商宣傳推出了AI PC產(chǎn)品。但實(shí)際上卻至少噱頭居多,只是搭載了NPU芯片,而沒有真正的本地大模型運(yùn)行。既不能訓(xùn)練、也不能推理。

AI PC 的概念被廣泛宣傳在筆記本電腦上。然而,現(xiàn)在沒有任何一臺(tái)輕薄本,稱得上是高算力的 AI 專用計(jì)算設(shè)備PC,反倒是傳統(tǒng)的高性能游戲本,搭載強(qiáng)大 GPU 顯卡的臺(tái)式機(jī),可以真的去提供真正的 AI生產(chǎn)力。

真·AI PC還是得看能開發(fā)高性能GPU的廠商,比如英偉達(dá)和AMD。

而就在今年年初CES上,AMD發(fā)布了AI Max 300Strix Halo。黃仁勛也發(fā)布了Project DIGITS。再加上此前蘋果公司的Mac Pro。這三個(gè)是本地部署大模型的利器??胺Q“桌面AI超級(jí)電腦”。

AMD發(fā)布的Strix Halo有兩種:消費(fèi)級(jí)的Strix Halo---主要用于消費(fèi)性能筆電(游戲本)和商用級(jí)的Strix Halo Pro---主要用于移動(dòng)工作站。曝光的3DMark測試數(shù)據(jù)顯示,其旗艦型號(hào)Ryzen AI MAX+ 395有16個(gè)基于Zen 5架構(gòu)的CPU核心,32線程;40個(gè)基于RDNA 3.5架構(gòu)的GPU核心,即Radeon 8060S核顯;最高120W,是標(biāo)準(zhǔn)移動(dòng)APU的3倍;支持四通道LPDDR5X內(nèi)存,提供高達(dá)256 GB/s的帶寬。值得注意的是,集成的Radeon 8060S核顯性能竟達(dá)到前代Radeon 890M的三倍以上,甚至逼近RTX 4060獨(dú)顯水平。

英偉達(dá)將其發(fā)布的Project DIGITS稱之為“目前體積最小的AI超算”。Project DIGITS使用了一顆定制的“GB10”超級(jí)芯片,它在一個(gè)核心里融合了基于Blackwell架構(gòu)的GPU,以及NVIDIA與聯(lián)發(fā)科、ARM三方合作研發(fā)的Grace CPU。資料顯示,其中的Blackwell GPU能夠提供1PFLOPS的FP4算力,同時(shí)Grace CPU則包含了10個(gè)Cortex-X925核心和10個(gè)Cortex-A725核心。在GPU和CPU之間,則是通過大型超算同款的NVLINK-C2C芯片到芯片互聯(lián)總線連接。

Project DIGITS還配備了一顆獨(dú)立的NVIDIA ConnectX互聯(lián)芯片,它可以讓“GB10”超級(jí)芯片內(nèi)部的GPU兼容多種不同的互聯(lián)技術(shù)標(biāo)準(zhǔn),其中包括NCCL、RDMA、GPUDirect等,從而使得這顆“大核顯”可以被各種開發(fā)軟件和AI應(yīng)用直接訪問。

而蘋果則在2023年發(fā)布了M3系列芯片并配備了下一代 GPU,代表了蘋果芯片圖形架構(gòu)史上最大的飛躍。不僅速度更快、能效更高,并且還引入了稱之為“動(dòng)態(tài)緩存”的新技術(shù),同時(shí)首次為 Mac 帶來了硬件加速光線追蹤和網(wǎng)格著色等新渲染功能。渲染速度現(xiàn)在比 M1 系列芯片快 2.5 倍。值得注意的是,全新的M3 系列芯片帶來最高128GB的統(tǒng)一的內(nèi)存架構(gòu)。蘋果稱,對高達(dá) 128GB 內(nèi)存的支持解鎖了以前在筆記本電腦上無法實(shí)現(xiàn)的工作流程,例如人工智能開發(fā)人員使用具有數(shù)十億參數(shù)的更大的Transformer模型。去年蘋果有發(fā)布了M4 Pro芯片,性能號(hào)稱超越AI PC芯片。

而這三者都采用了一種叫做統(tǒng)一內(nèi)存架構(gòu)的技術(shù)。統(tǒng)一架構(gòu)的好處,就是把以前內(nèi)存和顯存(顯卡的內(nèi)存)做了統(tǒng)一,這樣就減少了CPU和GPU通信時(shí)候,在內(nèi)存和顯存之間數(shù)據(jù)通信時(shí)候的拷貝。此外,這一技術(shù)也能使電腦顯存更大,從而可以打破消費(fèi)級(jí)顯卡在運(yùn)行大模型時(shí)候顯存不足的困境。值得注意的是,統(tǒng)一內(nèi)存設(shè)計(jì)不是英偉達(dá)首創(chuàng),蘋果M1才是第一例。

Deepseek開啟桌面 AI 超級(jí)電腦之戰(zhàn)

近一段時(shí)間以來,DeepSeek線上算力的嚴(yán)重不足,帶火了大模型本地部署需求,三大廠的“真·AI PC”也都開始廠商部署DeepSeek。

而DeepSeek作為一款MoE模型對顯存要求高,對算力/內(nèi)存帶寬要求相對低。這也給了這些通過統(tǒng)一內(nèi)存技術(shù)而擁有大顯存的桌面AI超級(jí)電腦可乘之機(jī)。

之前有國外大佬用8臺(tái)M4 Pro Mac mini跑DeepSeek V3。同樣的,預(yù)計(jì)可以利用四臺(tái)Project DIGITS來部署DeepSeek V3,而且生成速度應(yīng)該也會(huì)快很多。根據(jù)AMD自己的公布,strix halo架構(gòu)APU可以部署70B的模型,比4090快2.2倍,功耗低87%。

有網(wǎng)友表示,“打算等halo筆記本上市之后把現(xiàn)在的筆記本換掉的,本地部署大模型確實(shí)有意思,再過幾年也許就可以本地部署671B的INT8或者FP8大模型了。除了大模型,RAM和CPU配置提高了,做其它事情也快?!?/p>

AI賽道,或許是國產(chǎn)廠商切入PC芯片領(lǐng)域的契機(jī)。當(dāng)前許多廠商開始營銷各類AI一體機(jī)產(chǎn)品。相信如果國產(chǎn)廠商能推出更大統(tǒng)一內(nèi)存,比如256G版本的國產(chǎn)“Project DIGITS”,也許會(huì)更受歡迎。

AI PC 的概念,是任人打扮的小姑娘。故事,其實(shí)各家有各家的講法。OEM 各大廠百花齊放,砸錢砸工程師做本地化AI應(yīng)用,軟件有些能本地也能云,云服務(wù)可以接入國產(chǎn)模型做商業(yè),可能是一快很好的蛋糕。

低延遲+隱私保護(hù),或許是拉動(dòng)類似GPT一類大語言模型,SD繪圖,聲音克隆,AI補(bǔ)幀,摳圖,重繪等本地化AI應(yīng)用的一個(gè)點(diǎn)。

AI PC 的足夠強(qiáng)的邊緣算力 + 大內(nèi)存(顯存)+優(yōu)化到足夠高效的軟件,結(jié)合起來才能有望解決行業(yè)痛點(diǎn),大批量落地 AI 終端。所以說,AI PC 其實(shí)也不完全是噱頭炒作,不管是更普惠的AI,更高能效的AI,還是更強(qiáng)大算力的AI,還是基于云和網(wǎng)絡(luò)更簡單好用的AI,都是有在進(jìn)一步發(fā)展技術(shù),摸索市場。

 
本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。