DeepSeek公開推理系統細節 理論成本利潤率545%
香港文匯報訊(記者 蘇雨潤 北京報道)3月1日,DeepSeek發布《DeepSeek-V3/R1推理系統概覽》一文,首次向外界公開模型推理系統的優化細節,同時披露成本和利潤率等關鍵財務信息,備受關注的「DeepSeek開源周」正式畫上句號。在此次開源周中,DeepSeek完整開源5個代碼庫,覆蓋自然語言處理、計算機視覺等多個關鍵領域。復旦大學計算機科學技術學院教授張奇在接受香港文匯報採訪時指出,DeepSeek此次開源顯著提升了GPU(圖形處理器)的使用效率,有力推動了中小企業和高等院校的研究工作。
「DeepSeek開源周」自2月24日啟動以來,陸續開源了包括FlashMLA、DeepEP、DeepGEMM、DualPipe和EPLB對應的優化並行策略,以及推進器3FS和輕量化數據處理工具Smallpond,為全球開發者社區帶來了大量有價值的技術成果。這些開源項目覆蓋了AI開發的多個核心環節,從硬件性能優化、模型訓練加速到數據處理效率提升,降低了開發者使用大模型的技術門檻和成本。
GPU使用效率大幅提升
張奇指出,此前DeepSeek開源的大模型僅僅公布了參數,若要讓大模型在GPU上實現高效運行,還需要進行大量底層優化工作,而本周開源的代碼絕大部分都聚焦於高效訓練、運行和部署等關鍵環節,這對國內中小企業和高等院校的研究工作提供了很多幫助。「藉助這些工具,以往100個GPU或許僅能支持10個用戶同時訪問,而如今合理運用新公布的工具,100個GPU則能支持30至40個用戶同時訪問,不僅大幅提升了訪問速度,還顯著增強了大模型的工作效率。」
談及DeepSeek選擇開源代碼的原因,張奇透露,DeepSeek堅定選擇開源路線,其核心競爭模式和利潤來源並非依靠售賣模型服務盈利。此外,他表示,DeepSeek本次公開的內容基本圍繞效率提升展開,效果層面的核心技術並未公開,許多關鍵內容仍牢牢掌握在其手中。「在實際應用中,除效率外,效果才是關鍵,相比推理速度,大部分用戶更關注回答內容的質量。」
財務數據駁「賠錢運營」質疑
值得關注的是,DeepSeek此次還公布了運營成本和利潤率數據。假設以2美元/小時的GPU租賃成本計算,DeepSeek每日總成本約為87,072美元,若按DeepSeek-R1的定價對所有token(AI對話系統中文本的一個單元)進行計算,理論上一天的總收入可達562,027美元,成本利潤率高達545%。不過,DeepSeek也指出,受DeepSeek-V3較低定價、夜間折扣以及部分免費服務等因素影響,實際收入會低於理論值。
張奇表示,DeepSeek不僅展示了技術優化的顯著成果,更為行業提供了高效盈利範例。同時,此次公開推理系統細節和財務數據是對「開源周」的全面總結。此前網上不乏DeepSeek「賠錢運營」的爭議,如今DeepSeek公開整體加速代碼,表明其能夠以極低的成本運行和部署,按現行公開價格不僅不會賠錢,甚至還有可觀的利潤率。