DeepSeek登頂中美App下載榜

  成本較低效能高 性能可比肩OpenAI

  最近幾日,中國人工智能公司深度求索(DeepSeek)發布的大模型DeepSeek-R1震動業界,該模型使用更低的成本和更小的算力規模,實現了足以匹敵美國頂尖AI模型的效果。北京時間1月27日,蘋果App Store中國區免費下載榜顯示,近一周全球刷屏的DeepSeek一舉登上首位。同時,DeepSeek在美國區蘋果App Store免費榜從昨日的第六位飆升至第一位。

  美國媒體的報道稱,DeepSeek-R1的出色表現已經給美國科技行業留下深刻印象,其開源模型成為行業關注與分析焦點。

  深度求索在1月20日發布了DeepSeek-R1模型,該公司表示,DeepSeek-R1在後訓練階段大規模使用了強化學習技術,在僅有極少標註數據的情況,極大提升了模型推理能力。在數學、代碼、自然語言推理等任務上,其性能比肩美國OpenAI o1正式版。為促進技術社區的充分交流與創新協作,深度求索還公開了DeepSeek-R1訓練技術。

  一些美企開始使用DeepSeek

  英偉達高級研究科學家范麟熙稱讚DeepSeek取得了突破,他在社交平台X上發文稱,DeepSeek-R1完全由強化學習驅動,「這讓人想起了AlphaZero,從零開始學習圍棋、將棋和國際象棋,而不是先模仿人類大師的動作。」

  DeepSeek-R1的表現引起美國科技行業的高度關注。舊金山AI硬件公司Positron的聯合創始人巴雷特·伍德塞德(Barrett Woodside)稱最近他和同事一直在討論DeepSeek的開源模型,「這太酷了。」一些美國企業也開始在工作中使用DeepSeek。硅谷一家創業公司的聯合創始人安東尼·普奧(Anthony Poo)告訴《華爾街日報》,他們原先使用Claude模型預測財務回報,但現在已轉向DeepSeek,兩者性能相似,使用DeepSeek成本僅為Claude的四分之一,「OpenAI的模型有着極佳的性能,但我們不想為不需要的能力付費。」

  不僅如此,DeepSeek的開發成本和使用的算力規模都遠低於美國頂尖AI公司。先前發布的DeepSeek-V3在僅使用2048顆英偉達H800 GPU的情況下,完成了6710億參數模型的訓練,成本約為560萬美元,這遠低於其他頂級模型的訓練成本。美媒指出,H800的算力要弱於英偉達H100等芯片,美國限制對華出口此類高性能芯片。

  開源能更快速迭代創新

  清華大學新聞學院、人工智能學院教授沈陽受訪指出,在開源的推動下,AI技術不再是少數幾家技術巨頭的專屬領地,它開始向更多參與者開放。

  「也許,未來的AI會更加民主化,更多創意和進步會從全球範圍內的無數小型團隊和初創公司中誕生,而非少數大型機構的閉門造車。」沈陽指開源同樣是一劑強心劑,技術共享並非止於代碼的開放,它還意味着思想的交匯、智慧的碰撞,開源讓全球的研究人員和開發者能夠站在一個共同的平台上,快速迭代、快速創新。