DeepSeek登頂中美App下載榜

香港仔 P10 2025-01-28

　　成本較低效能高性能可比肩OpenAI

　　最近幾日，中國人工智能公司深度求索（DeepSeek）發布的大模型DeepSeek-R1震動業界，該模型使用更低的成本和更小的算力規模，實現了足以匹敵美國頂尖AI模型的效果。北京時間1月27日，蘋果App Store中國區免費下載榜顯示，近一周全球刷屏的DeepSeek一舉登上首位。同時，DeepSeek在美國區蘋果App Store免費榜從昨日的第六位飆升至第一位。

　　美國媒體的報道稱，DeepSeek-R1的出色表現已經給美國科技行業留下深刻印象，其開源模型成為行業關注與分析焦點。

　　深度求索在1月20日發布了DeepSeek-R1模型，該公司表示，DeepSeek-R1在後訓練階段大規模使用了強化學習技術，在僅有極少標註數據的情況，極大提升了模型推理能力。在數學、代碼、自然語言推理等任務上，其性能比肩美國OpenAI o1正式版。為促進技術社區的充分交流與創新協作，深度求索還公開了DeepSeek-R1訓練技術。

　　一些美企開始使用DeepSeek

　　英偉達高級研究科學家范麟熙稱讚DeepSeek取得了突破，他在社交平台X上發文稱，DeepSeek-R1完全由強化學習驅動，「這讓人想起了AlphaZero，從零開始學習圍棋、將棋和國際象棋，而不是先模仿人類大師的動作。」

　　DeepSeek-R1的表現引起美國科技行業的高度關注。舊金山AI硬件公司Positron的聯合創始人巴雷特·伍德塞德（Barrett Woodside）稱最近他和同事一直在討論DeepSeek的開源模型，「這太酷了。」一些美國企業也開始在工作中使用DeepSeek。硅谷一家創業公司的聯合創始人安東尼·普奧（Anthony Poo）告訴《華爾街日報》，他們原先使用Claude模型預測財務回報，但現在已轉向DeepSeek，兩者性能相似，使用DeepSeek成本僅為Claude的四分之一，「OpenAI的模型有着極佳的性能，但我們不想為不需要的能力付費。」

　　不僅如此，DeepSeek的開發成本和使用的算力規模都遠低於美國頂尖AI公司。先前發布的DeepSeek-V3在僅使用2048顆英偉達H800 GPU的情況下，完成了6710億參數模型的訓練，成本約為560萬美元，這遠低於其他頂級模型的訓練成本。美媒指出，H800的算力要弱於英偉達H100等芯片，美國限制對華出口此類高性能芯片。

　　開源能更快速迭代創新

　　清華大學新聞學院、人工智能學院教授沈陽受訪指出，在開源的推動下，AI技術不再是少數幾家技術巨頭的專屬領地，它開始向更多參與者開放。

　　「也許，未來的AI會更加民主化，更多創意和進步會從全球範圍內的無數小型團隊和初創公司中誕生，而非少數大型機構的閉門造車。」沈陽指開源同樣是一劑強心劑，技術共享並非止於代碼的開放，它還意味着思想的交匯、智慧的碰撞，開源讓全球的研究人員和開發者能夠站在一個共同的平台上，快速迭代、快速創新。