正在閱讀:

滿血版DeepSeek-R1大模型部署門檻降低,聯(lián)想AI服務(wù)器單機(jī)即可支持

掃一掃下載界面新聞APP

滿血版DeepSeek-R1大模型部署門檻降低,聯(lián)想AI服務(wù)器單機(jī)即可支持

在DeepSeek App上線一個(gè)月之際,聯(lián)想宣布,旗下大模型訓(xùn)推一體AI算力平臺(tái)聯(lián)想問(wèn)天 WA7780 G3、大模型推理AI算力平臺(tái)聯(lián)想問(wèn)天 WA7785a G3全新升級(jí),單機(jī)即可部署DeepSeek-R1滿血版大模型。

圖片來(lái)源: 企業(yè)供圖

在DeepSeek App上線一個(gè)月之際,聯(lián)想正式宣布,旗下大模型訓(xùn)推一體AI算力平臺(tái)聯(lián)想問(wèn)天 WA7780 G3、大模型推理AI算力平臺(tái)聯(lián)想問(wèn)天 WA7785a G3全新升級(jí),單機(jī)即可部署DeepSeek-R1滿血版大模型(具備671B參數(shù))。此次升級(jí)將大幅降低客戶部署難度和成本,同時(shí)提升模型訓(xùn)練和推理性能,為DeepSeek等最新AI應(yīng)用的落地和規(guī)?;l(fā)展提供強(qiáng)有力的支持。

據(jù)了解,聯(lián)想正與DeepSeek在個(gè)人智能與企業(yè)智能兩大領(lǐng)域,開(kāi)展更全面、深入的合作。其中,聚焦企業(yè)智能,聯(lián)想中國(guó)基礎(chǔ)設(shè)施業(yè)務(wù)與DeepSeek的深度融合,正快速實(shí)現(xiàn)從訓(xùn)練到推理的全鏈條產(chǎn)品適配。

據(jù)了解,DeepSeek大模型憑借高性能、低成本和開(kāi)源三大特點(diǎn),助力各行業(yè)加速應(yīng)用大模型技術(shù)推動(dòng)業(yè)務(wù)升級(jí)轉(zhuǎn)型。DeepSeek-R1滿血版大模型基于6710億參數(shù),具備卓越的復(fù)雜推理和深度交互能力,眾多企業(yè)積極探索并部署DeepSeek-R1滿血版大模型以期提升業(yè)務(wù)效能與競(jìng)爭(zhēng)力。然而,在實(shí)際應(yīng)用中,用戶在本地接入時(shí)不可避免遇到算力基礎(chǔ)設(shè)施匱乏、訓(xùn)練推理服務(wù)性能難以達(dá)標(biāo)等一系列難題。

面對(duì)用戶實(shí)際應(yīng)用問(wèn)題,聯(lián)想問(wèn)天 WA7780 G3、聯(lián)想問(wèn)天 WA7785a G3與DeepSeek-R1滿血版大模型特點(diǎn)進(jìn)行了深度適配調(diào)優(yōu),單機(jī)即可部署DeepSeek-R1滿血版大模型,助力企業(yè)高效完成本地化部署,一站式構(gòu)建AI生產(chǎn)力,加速智能化升級(jí)。

值得一提的是,聯(lián)想問(wèn)天 WA7780 G3大模型訓(xùn)推一體服務(wù)器是為打破AI算力供給困境而來(lái),能夠?yàn)橛?xùn)練推理提供強(qiáng)勁的算力支撐。

作為領(lǐng)先的AI算力平臺(tái),這款服務(wù)器內(nèi)嵌Transfomer Engine,支持FP8優(yōu)化,可以幫助DeepSeek-R1滿血版大模型獲得更好的模型訓(xùn)練和推理性能。

在顯存方面,提供超1T HBM3e,充分滿足DeepSeek-R1滿血版大模型FP8精度下不低于800GB顯存容量的需求。顯存帶寬高達(dá)4.9TB/s,可以在推理解碼階段實(shí)現(xiàn)極致加速。

在高速互聯(lián)方面,GPU P2P通信帶寬達(dá)900GB/s,同時(shí)單機(jī)提供3.2TB/s的高帶寬低延遲網(wǎng)絡(luò)擴(kuò)展,能夠?yàn)镈eepSeek-R1滿血版大模型提供極低的通信延遲。

image

聯(lián)想問(wèn)天 WA7780 G3大模型訓(xùn)推一體服務(wù)器,圖片來(lái)源:企業(yè)供圖

聯(lián)想問(wèn)天 WA7785a G3服務(wù)器則聚焦于AI算力優(yōu)化,該大模型推理AI算力平臺(tái)原生支持FP8,提供超1.5T HBM3e,為DeepSeek-R1滿血版大模型插上性能騰飛的翅膀。

此外,顯存帶寬達(dá)5.3TB/s的高速顯存可以減少數(shù)據(jù)傳輸?shù)钠款i,從而加速訓(xùn)練過(guò)程,提高模型訓(xùn)練效率。GPU聚合帶寬達(dá)896GB/s,同時(shí)單機(jī)提供3.2TB/s的高帶寬低延遲網(wǎng)絡(luò)擴(kuò)展,充分滿足了DeepSeek-R1滿血版大模型并行計(jì)算時(shí)跨節(jié)點(diǎn)的通信需求,使其成為用戶首選大模型推理服務(wù)器。

image

聯(lián)想問(wèn)天 WA7785a G3服務(wù)器,圖片來(lái)源:企業(yè)供圖

此外,聯(lián)想正在加速推進(jìn)DeepSeek 671B-R1和V3模型及一系列蒸餾模型與其AI服務(wù)器的適配。未來(lái),聯(lián)想將持續(xù)創(chuàng)新為企業(yè)提供全面、高效、可靠的IT基礎(chǔ)設(shè)施,加速推動(dòng)AI創(chuàng)新與應(yīng)用落地,為千行萬(wàn)業(yè)積極擁抱AI注入強(qiáng)大動(dòng)力。

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。

聯(lián)想集團(tuán)

3.1k
  • 聯(lián)想美國(guó)PC市場(chǎng)份額增至17.2%,縮小與戴爾、惠普差距
  • 走進(jìn)燧弘華創(chuàng)慶陽(yáng)綠色智算中心,見(jiàn)證DeepSeek大模型加速落地

評(píng)論

暫無(wú)評(píng)論哦,快來(lái)評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

滿血版DeepSeek-R1大模型部署門檻降低,聯(lián)想AI服務(wù)器單機(jī)即可支持

在DeepSeek App上線一個(gè)月之際,聯(lián)想宣布,旗下大模型訓(xùn)推一體AI算力平臺(tái)聯(lián)想問(wèn)天 WA7780 G3、大模型推理AI算力平臺(tái)聯(lián)想問(wèn)天 WA7785a G3全新升級(jí),單機(jī)即可部署DeepSeek-R1滿血版大模型。

圖片來(lái)源: 企業(yè)供圖

在DeepSeek App上線一個(gè)月之際,聯(lián)想正式宣布,旗下大模型訓(xùn)推一體AI算力平臺(tái)聯(lián)想問(wèn)天 WA7780 G3、大模型推理AI算力平臺(tái)聯(lián)想問(wèn)天 WA7785a G3全新升級(jí),單機(jī)即可部署DeepSeek-R1滿血版大模型(具備671B參數(shù))。此次升級(jí)將大幅降低客戶部署難度和成本,同時(shí)提升模型訓(xùn)練和推理性能,為DeepSeek等最新AI應(yīng)用的落地和規(guī)?;l(fā)展提供強(qiáng)有力的支持。

據(jù)了解,聯(lián)想正與DeepSeek在個(gè)人智能與企業(yè)智能兩大領(lǐng)域,開(kāi)展更全面、深入的合作。其中,聚焦企業(yè)智能,聯(lián)想中國(guó)基礎(chǔ)設(shè)施業(yè)務(wù)與DeepSeek的深度融合,正快速實(shí)現(xiàn)從訓(xùn)練到推理的全鏈條產(chǎn)品適配。

據(jù)了解,DeepSeek大模型憑借高性能、低成本和開(kāi)源三大特點(diǎn),助力各行業(yè)加速應(yīng)用大模型技術(shù)推動(dòng)業(yè)務(wù)升級(jí)轉(zhuǎn)型。DeepSeek-R1滿血版大模型基于6710億參數(shù),具備卓越的復(fù)雜推理和深度交互能力,眾多企業(yè)積極探索并部署DeepSeek-R1滿血版大模型以期提升業(yè)務(wù)效能與競(jìng)爭(zhēng)力。然而,在實(shí)際應(yīng)用中,用戶在本地接入時(shí)不可避免遇到算力基礎(chǔ)設(shè)施匱乏、訓(xùn)練推理服務(wù)性能難以達(dá)標(biāo)等一系列難題。

面對(duì)用戶實(shí)際應(yīng)用問(wèn)題,聯(lián)想問(wèn)天 WA7780 G3、聯(lián)想問(wèn)天 WA7785a G3與DeepSeek-R1滿血版大模型特點(diǎn)進(jìn)行了深度適配調(diào)優(yōu),單機(jī)即可部署DeepSeek-R1滿血版大模型,助力企業(yè)高效完成本地化部署,一站式構(gòu)建AI生產(chǎn)力,加速智能化升級(jí)。

值得一提的是,聯(lián)想問(wèn)天 WA7780 G3大模型訓(xùn)推一體服務(wù)器是為打破AI算力供給困境而來(lái),能夠?yàn)橛?xùn)練推理提供強(qiáng)勁的算力支撐。

作為領(lǐng)先的AI算力平臺(tái),這款服務(wù)器內(nèi)嵌Transfomer Engine,支持FP8優(yōu)化,可以幫助DeepSeek-R1滿血版大模型獲得更好的模型訓(xùn)練和推理性能。

在顯存方面,提供超1T HBM3e,充分滿足DeepSeek-R1滿血版大模型FP8精度下不低于800GB顯存容量的需求。顯存帶寬高達(dá)4.9TB/s,可以在推理解碼階段實(shí)現(xiàn)極致加速。

在高速互聯(lián)方面,GPU P2P通信帶寬達(dá)900GB/s,同時(shí)單機(jī)提供3.2TB/s的高帶寬低延遲網(wǎng)絡(luò)擴(kuò)展,能夠?yàn)镈eepSeek-R1滿血版大模型提供極低的通信延遲。

image

聯(lián)想問(wèn)天 WA7780 G3大模型訓(xùn)推一體服務(wù)器,圖片來(lái)源:企業(yè)供圖

聯(lián)想問(wèn)天 WA7785a G3服務(wù)器則聚焦于AI算力優(yōu)化,該大模型推理AI算力平臺(tái)原生支持FP8,提供超1.5T HBM3e,為DeepSeek-R1滿血版大模型插上性能騰飛的翅膀。

此外,顯存帶寬達(dá)5.3TB/s的高速顯存可以減少數(shù)據(jù)傳輸?shù)钠款i,從而加速訓(xùn)練過(guò)程,提高模型訓(xùn)練效率。GPU聚合帶寬達(dá)896GB/s,同時(shí)單機(jī)提供3.2TB/s的高帶寬低延遲網(wǎng)絡(luò)擴(kuò)展,充分滿足了DeepSeek-R1滿血版大模型并行計(jì)算時(shí)跨節(jié)點(diǎn)的通信需求,使其成為用戶首選大模型推理服務(wù)器。

image

聯(lián)想問(wèn)天 WA7785a G3服務(wù)器,圖片來(lái)源:企業(yè)供圖

此外,聯(lián)想正在加速推進(jìn)DeepSeek 671B-R1和V3模型及一系列蒸餾模型與其AI服務(wù)器的適配。未來(lái),聯(lián)想將持續(xù)創(chuàng)新為企業(yè)提供全面、高效、可靠的IT基礎(chǔ)設(shè)施,加速推動(dòng)AI創(chuàng)新與應(yīng)用落地,為千行萬(wàn)業(yè)積極擁抱AI注入強(qiáng)大動(dòng)力。

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。