正在閱讀:

成本降低20% ?螞蟻集團(tuán)回應(yīng)自研大模型訓(xùn)練降本

掃一掃下載界面新聞APP

成本降低20% ?螞蟻集團(tuán)回應(yīng)自研大模型訓(xùn)練降本

螞蟻集團(tuán)稱,會逐步通過開源分享。

圖片來源:界面圖庫

3月24日,針對媒體對螞蟻百靈大模型訓(xùn)練成本的報(bào)道,螞蟻集團(tuán)方面回應(yīng)界面新聞稱,螞蟻針對不同芯片持續(xù)調(diào)優(yōu),以降低AI應(yīng)用成本,目前取得了一定的進(jìn)展,也會逐步通過開源分享。

此前有報(bào)道稱,螞蟻集團(tuán)正使用中國制造的半導(dǎo)體來開發(fā)AI模型訓(xùn)練技術(shù),這將使成本降低20%。知情人士稱,螞蟻集團(tuán)使用了包括來自阿里巴巴和華為的芯片,采用混合專家(MoE)機(jī)器學(xué)習(xí)方式來訓(xùn)練模型。他們表示,螞蟻集團(tuán)獲得了與采用英偉達(dá)H800等芯片訓(xùn)練相似的結(jié)果。

其中一位知情人士稱,螞蟻集團(tuán)仍在使用英偉達(dá)的產(chǎn)品進(jìn)行人工智能開發(fā),但目前其最新模型主要依賴于包括AMD產(chǎn)品和中國芯片在內(nèi)的替代產(chǎn)品。

該技術(shù)成果論文《每一個(gè)FLOP都至關(guān)重要:無需高級GPU即可擴(kuò)展3000億參數(shù)混合專家LING大模型》已在預(yù)印版Arxiv平臺上發(fā)表。

除了自研性能領(lǐng)先的大模型以外,該技術(shù)論文最大的突破在于提出了一系列創(chuàng)新方法,以提升資源受限環(huán)境下AI開發(fā)的效率與可及性。實(shí)驗(yàn)表明,其3000億參數(shù)的MoE大模型可在使用國產(chǎn)GPU的低性能設(shè)備上完成高效訓(xùn)練,性能與完全使用英偉達(dá)芯片、同規(guī)模的稠密模型及MoE模型相當(dāng)。

作為國內(nèi)較早布局AI大模型的廠商,螞蟻?zhàn)匝械陌凫`大模型2023年已通過備案,重點(diǎn)布局在生活服務(wù)、金融服務(wù)、醫(yī)療健康等場景的應(yīng)用。

 

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。

螞蟻集團(tuán)

2.2k
  • 國產(chǎn)算力生態(tài)有望迎來重大突破,人工智能ETF(515980)連續(xù)4天凈流入,最新份額創(chuàng)近1年新高!
  • 科技早報(bào) | 螞蟻集團(tuán)回應(yīng)自研大模型訓(xùn)練降本20%;騰訊領(lǐng)投智元機(jī)器人

英偉達(dá)

7.5k
  • 英偉達(dá)Rubin據(jù)悉將采用臺積電SoIC技術(shù)
  • 美股七巨頭全線飆漲,特斯拉暴漲近12%!美國50ETF(159577)放量漲超1%,連續(xù)7日吸金

評論

暫無評論哦,快來評價(jià)一下吧!

下載界面新聞

微信公眾號

微博

成本降低20% ?螞蟻集團(tuán)回應(yīng)自研大模型訓(xùn)練降本

螞蟻集團(tuán)稱,會逐步通過開源分享。

圖片來源:界面圖庫

3月24日,針對媒體對螞蟻百靈大模型訓(xùn)練成本的報(bào)道,螞蟻集團(tuán)方面回應(yīng)界面新聞稱,螞蟻針對不同芯片持續(xù)調(diào)優(yōu),以降低AI應(yīng)用成本,目前取得了一定的進(jìn)展,也會逐步通過開源分享。

此前有報(bào)道稱,螞蟻集團(tuán)正使用中國制造的半導(dǎo)體來開發(fā)AI模型訓(xùn)練技術(shù),這將使成本降低20%。知情人士稱,螞蟻集團(tuán)使用了包括來自阿里巴巴和華為的芯片,采用混合專家(MoE)機(jī)器學(xué)習(xí)方式來訓(xùn)練模型。他們表示,螞蟻集團(tuán)獲得了與采用英偉達(dá)H800等芯片訓(xùn)練相似的結(jié)果。

其中一位知情人士稱,螞蟻集團(tuán)仍在使用英偉達(dá)的產(chǎn)品進(jìn)行人工智能開發(fā),但目前其最新模型主要依賴于包括AMD產(chǎn)品和中國芯片在內(nèi)的替代產(chǎn)品。

該技術(shù)成果論文《每一個(gè)FLOP都至關(guān)重要:無需高級GPU即可擴(kuò)展3000億參數(shù)混合專家LING大模型》已在預(yù)印版Arxiv平臺上發(fā)表。

除了自研性能領(lǐng)先的大模型以外,該技術(shù)論文最大的突破在于提出了一系列創(chuàng)新方法,以提升資源受限環(huán)境下AI開發(fā)的效率與可及性。實(shí)驗(yàn)表明,其3000億參數(shù)的MoE大模型可在使用國產(chǎn)GPU的低性能設(shè)備上完成高效訓(xùn)練,性能與完全使用英偉達(dá)芯片、同規(guī)模的稠密模型及MoE模型相當(dāng)。

作為國內(nèi)較早布局AI大模型的廠商,螞蟻?zhàn)匝械陌凫`大模型2023年已通過備案,重點(diǎn)布局在生活服務(wù)、金融服務(wù)、醫(yī)療健康等場景的應(yīng)用。

 

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。