DeepSeek的開源模型DeepSeek-R1用十分之一的成本就能訓練出比肩OpenAI o1水平的模型,意味著算法有足夠的提高空間,不需要預期中那么多GPU。
受此影響,連日來全球市場算力硬件股持續(xù)走低,英偉達美股夜盤跌超5%,博通跌超4%;而擁有芯片設計公司Arm的軟銀集團下跌5.4%。軟銀集團已宣布OpenAI、和甲骨文在美國聯(lián)合成立“星際之門(Stargate)”項目,計劃4年內為美國人工智能基礎設施投資至少5000億美元,并創(chuàng)造超過10萬個就業(yè)機會。
同一天,DeepSeek在美區(qū)蘋果App Store免費榜飚升至第一位,超越ChatGPT、臉書母公司Meta旗下的社交媒體平臺Threads,以及谷歌Gemini、微軟Copilot等公司的生成式AI產品。
在AI界走向燒錢、打造閉源“護城河”的大趨勢下,這個由幻方量化所屬國產大模型公司“深度求索”開發(fā)的應用受到了硅谷對手的高度關注。
微軟CEO納德拉、Meta工程師均提到,DeepSeek的高性價比模式迫使硅谷重新評估研發(fā)策略,甚至可能加速美國企業(yè)從閉源轉向更開放的合作模式。
另據The Information網站消息,Meta已成立4個專門研究小組來研究DeepSeek的工作原理,并基于此來改進旗下大模型Llama,以及降低訓練和運行成本。
圖靈獎得主、Meta的AI首席科學家楊立昆(Yann LeCun)在Threads上的帖子中指出,“在我看來,DeepSeek的最成功之處在于,保持人工智能模型開源的價值,這樣任何人都可以從中受益。這就是開放研究和開源的力量。”
就在DeepSeek最新版本發(fā)布幾天后,Meta首席執(zhí)行官扎克伯格宣布,計劃在2025年支出超過600億美元,旨在鞏固保持該公司與OpenAI和谷歌的競爭。
而一直為特朗普提供建議的硅谷風險投資家Marc Andreessen則在X的一篇帖子中寫道,“Deepseek R1是我見過的最驚人、最令人印象深刻的突破之一。作為開源模式,這是給世界的一份珍貴禮物?!彼€將DeepSeek R1與冷戰(zhàn)時期美蘇軍事競賽的“斯普特尼克時刻”相提并論。