DeepSeek如何成為巨人殺手?
測試表現
全面壓倒
•1月20日正式發布的推理大模型DeepSeek-R1,經多位科技界權威人士測試,證實其在數學、編程和推理等關鍵領域的表現,能與OpenAI推出的號稱「人類史上最強推理模型」的o1「掰手腕」,總體API調用成本卻低95%左右。
硬件要求
1/8
•研發DeepSeek大模型只需2048塊性能遠低於H100與Blackwell的H800芯片,用時僅53天。全球AI第一梯隊頭部公司至少也要動用1.6萬張以上GPU訓練。
研發費用
5%
•DeepSeek-V3模型以1/11的算力、僅2000個GPU芯片訓練出性能超越GPT-4o的大模型。其總訓練成本只有557.6萬美元,而GPT-4o的約為1億美元,使用25000個GPU芯片。
服務定價
便宜98%
•DeepSeek每百萬個token的查詢成本僅為0.14美元,而OpenAI的成本為7.50美元,成本降幅高達驚人的98%。 大公報整理