正在閱讀:

Llama 4被曝訓(xùn)練作弊,發(fā)布后實(shí)測(cè)差評(píng)如潮

掃一掃下載界面新聞APP

Llama 4被曝訓(xùn)練作弊,發(fā)布后實(shí)測(cè)差評(píng)如潮

據(jù)稱,Meta Platforms的CEO扎克伯格此前給全員下了死命令,4月底是Llama 4交付最后期限。

圖片來(lái)源:視覺(jué)中國(guó)

4月5日,Meta公司發(fā)布了大型語(yǔ)言模型Llama的最新版本Llama 4 Scout與Llama 4 Maverick。

Meta在聲明中表示,Llama 4是一個(gè)多模態(tài)AI系統(tǒng),能夠處理和整合文本、視頻、圖像、音頻等多種數(shù)據(jù)類型,并能在不同格式之間實(shí)現(xiàn)內(nèi)容轉(zhuǎn)換。據(jù)介紹,Scout和Maverick是該公司首款采用混合專家架構(gòu)(MoE)的模型,兩者均以開(kāi)源形式發(fā)布。此外,Meta還預(yù)告了Llama 4 Behemoth,稱其為“全球最聰明的語(yǔ)言模型之一,將作為未來(lái)模型訓(xùn)練的教師模型”。

沒(méi)想到,隨后就被曝出模型訓(xùn)練測(cè)試集作弊,內(nèi)部員工直接辭職,引發(fā)爭(zhēng)議。

爭(zhēng)議的導(dǎo)火索源于海外留學(xué)求職交流論壇“一畝三分地”的一篇帖子,發(fā)帖人自稱是參與Llama 4訓(xùn)練的內(nèi)部員工,并表示已因此辭職。

該員工透露,盡管團(tuán)隊(duì)反復(fù)努力訓(xùn)練,Llama 4的內(nèi)部模型性能始終無(wú)法達(dá)到開(kāi)源SOTA(State-of-the-Art,頂尖水平)基準(zhǔn),差距明顯。為達(dá)成目標(biāo),公司領(lǐng)導(dǎo)層提出在訓(xùn)練后期將各種基準(zhǔn)測(cè)試的“測(cè)試集”數(shù)據(jù)混入訓(xùn)練或微調(diào)數(shù)據(jù)中,以此在各項(xiàng)指標(biāo)上達(dá)成目標(biāo),交出一份“好看”的成績(jī)單。

這位內(nèi)部員工@dliudliu表示,自己無(wú)法接受這種做法,甚至辭職信中明確要求不要在Llama 4技術(shù)報(bào)告中掛名。

就在Llama 4即將發(fā)布前幾天,Meta AI研究主管Joelle Pineau在工作8年之后突然宣布離職。

知名科技媒體TechCrunch也發(fā)文質(zhì)疑Llama 4的性能測(cè)試存在誤導(dǎo)性。文章聚焦Llama 4(即Maverick)在著名的人類評(píng)估排行榜LM Arena上的表現(xiàn),指出Maverick雖取得第二名的好成績(jī),但背后另有隱情。在一些實(shí)測(cè)中,號(hào)稱千萬(wàn)上下文的召回率,上下文的實(shí)際表現(xiàn),遠(yuǎn)低于預(yù)期。而Llama 4 Maverick 在 aider 多語(yǔ)言編碼基準(zhǔn)測(cè)試中得分為實(shí)測(cè)僅為 16%。

有人認(rèn)為L(zhǎng)lama 4的表現(xiàn)甚至和Llama 3.2一樣沒(méi)有任何進(jìn)步,也無(wú)法完成寫詩(shī)。其他用戶在測(cè)試后也表達(dá)了同樣的觀點(diǎn),Llama 4有點(diǎn)不符合預(yù)期。

幾位AI研究人員在社交媒體上都“吐槽”認(rèn)為,Meta提交給LM Arena進(jìn)行測(cè)試評(píng)估的Maverick版本,和公開(kāi)發(fā)布給開(kāi)發(fā)者使用的版本可能并非同一個(gè)。

不過(guò)Meta表示,更強(qiáng)大的一款被命名為L(zhǎng)lama 4 Behemoth的大模型仍在訓(xùn)練中。據(jù)稱,Meta Platforms的CEO扎克伯格此前給全員下了死命令,4月底是Llama 4交付最后期限。

早在1月10日,有媒體稱,據(jù)加利福尼亞聯(lián)邦法院公開(kāi)的庭審文件中,一些作家指控Meta Platforms在訓(xùn)練其Llama AI模型時(shí),未經(jīng)授權(quán)使用了盜版電子書(shū)和文章數(shù)據(jù)集LibGen,并通過(guò)點(diǎn)對(duì)點(diǎn)(P2P)方式下載了大量盜版書(shū)籍和文章,而且內(nèi)部員工還爆料此事獲得了扎克伯格的允許,目前案件在審理中。

今年年初,扎克伯格曾表示2025年計(jì)劃投資多達(dá)650億美元用于人工智能(AI)相關(guān)項(xiàng)目,包括建立新的巨型數(shù)據(jù)中心和加大AI團(tuán)隊(duì)的招聘,以鞏固其在與OpenAI和谷歌競(jìng)爭(zhēng)中的地位。

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。

馬克?扎克伯格

  • 扎克伯格:Threads目前月活躍用戶已超過(guò)3.5億
  • Meta推出融合社交元素的獨(dú)立AI應(yīng)用,與ChatGPT抗衡

評(píng)論

暫無(wú)評(píng)論哦,快來(lái)評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

Llama 4被曝訓(xùn)練作弊,發(fā)布后實(shí)測(cè)差評(píng)如潮

據(jù)稱,Meta Platforms的CEO扎克伯格此前給全員下了死命令,4月底是Llama 4交付最后期限。

圖片來(lái)源:視覺(jué)中國(guó)

4月5日,Meta公司發(fā)布了大型語(yǔ)言模型Llama的最新版本Llama 4 Scout與Llama 4 Maverick。

Meta在聲明中表示,Llama 4是一個(gè)多模態(tài)AI系統(tǒng),能夠處理和整合文本、視頻、圖像、音頻等多種數(shù)據(jù)類型,并能在不同格式之間實(shí)現(xiàn)內(nèi)容轉(zhuǎn)換。據(jù)介紹,Scout和Maverick是該公司首款采用混合專家架構(gòu)(MoE)的模型,兩者均以開(kāi)源形式發(fā)布。此外,Meta還預(yù)告了Llama 4 Behemoth,稱其為“全球最聰明的語(yǔ)言模型之一,將作為未來(lái)模型訓(xùn)練的教師模型”。

沒(méi)想到,隨后就被曝出模型訓(xùn)練測(cè)試集作弊,內(nèi)部員工直接辭職,引發(fā)爭(zhēng)議。

爭(zhēng)議的導(dǎo)火索源于海外留學(xué)求職交流論壇“一畝三分地”的一篇帖子,發(fā)帖人自稱是參與Llama 4訓(xùn)練的內(nèi)部員工,并表示已因此辭職。

該員工透露,盡管團(tuán)隊(duì)反復(fù)努力訓(xùn)練,Llama 4的內(nèi)部模型性能始終無(wú)法達(dá)到開(kāi)源SOTA(State-of-the-Art,頂尖水平)基準(zhǔn),差距明顯。為達(dá)成目標(biāo),公司領(lǐng)導(dǎo)層提出在訓(xùn)練后期將各種基準(zhǔn)測(cè)試的“測(cè)試集”數(shù)據(jù)混入訓(xùn)練或微調(diào)數(shù)據(jù)中,以此在各項(xiàng)指標(biāo)上達(dá)成目標(biāo),交出一份“好看”的成績(jī)單。

這位內(nèi)部員工@dliudliu表示,自己無(wú)法接受這種做法,甚至辭職信中明確要求不要在Llama 4技術(shù)報(bào)告中掛名。

就在Llama 4即將發(fā)布前幾天,Meta AI研究主管Joelle Pineau在工作8年之后突然宣布離職。

知名科技媒體TechCrunch也發(fā)文質(zhì)疑Llama 4的性能測(cè)試存在誤導(dǎo)性。文章聚焦Llama 4(即Maverick)在著名的人類評(píng)估排行榜LM Arena上的表現(xiàn),指出Maverick雖取得第二名的好成績(jī),但背后另有隱情。在一些實(shí)測(cè)中,號(hào)稱千萬(wàn)上下文的召回率,上下文的實(shí)際表現(xiàn),遠(yuǎn)低于預(yù)期。而Llama 4 Maverick 在 aider 多語(yǔ)言編碼基準(zhǔn)測(cè)試中得分為實(shí)測(cè)僅為 16%。

有人認(rèn)為L(zhǎng)lama 4的表現(xiàn)甚至和Llama 3.2一樣沒(méi)有任何進(jìn)步,也無(wú)法完成寫詩(shī)。其他用戶在測(cè)試后也表達(dá)了同樣的觀點(diǎn),Llama 4有點(diǎn)不符合預(yù)期。

幾位AI研究人員在社交媒體上都“吐槽”認(rèn)為,Meta提交給LM Arena進(jìn)行測(cè)試評(píng)估的Maverick版本,和公開(kāi)發(fā)布給開(kāi)發(fā)者使用的版本可能并非同一個(gè)。

不過(guò)Meta表示,更強(qiáng)大的一款被命名為L(zhǎng)lama 4 Behemoth的大模型仍在訓(xùn)練中。據(jù)稱,Meta Platforms的CEO扎克伯格此前給全員下了死命令,4月底是Llama 4交付最后期限。

早在1月10日,有媒體稱,據(jù)加利福尼亞聯(lián)邦法院公開(kāi)的庭審文件中,一些作家指控Meta Platforms在訓(xùn)練其Llama AI模型時(shí),未經(jīng)授權(quán)使用了盜版電子書(shū)和文章數(shù)據(jù)集LibGen,并通過(guò)點(diǎn)對(duì)點(diǎn)(P2P)方式下載了大量盜版書(shū)籍和文章,而且內(nèi)部員工還爆料此事獲得了扎克伯格的允許,目前案件在審理中。

今年年初,扎克伯格曾表示2025年計(jì)劃投資多達(dá)650億美元用于人工智能(AI)相關(guān)項(xiàng)目,包括建立新的巨型數(shù)據(jù)中心和加大AI團(tuán)隊(duì)的招聘,以鞏固其在與OpenAI和谷歌競(jìng)爭(zhēng)中的地位。

未經(jīng)正式授權(quán)嚴(yán)禁轉(zhuǎn)載本文,侵權(quán)必究。