DeepSeek如何成為巨人殺手？

大公報 A1：要聞 2025-01-28

　　測試表現

　　全面壓倒

　　•1月20日正式發布的推理大模型DeepSeek-R1，經多位科技界權威人士測試，證實其在數學、編程和推理等關鍵領域的表現，能與OpenAI推出的號稱「人類史上最強推理模型」的o1「掰手腕」，總體API調用成本卻低95%左右。

　　硬件要求

　　1/8

　　•研發DeepSeek大模型只需2048塊性能遠低於H100與Blackwell的H800芯片，用時僅53天。全球AI第一梯隊頭部公司至少也要動用1.6萬張以上GPU訓練。

　　研發費用

　　•DeepSeek-V3模型以1/11的算力、僅2000個GPU芯片訓練出性能超越GPT-4o的大模型。其總訓練成本只有557.6萬美元，而GPT-4o的約為1億美元，使用25000個GPU芯片。

　　服務定價

　　便宜98%

　　•DeepSeek每百萬個token的查詢成本僅為0.14美元，而OpenAI的成本為7.50美元，成本降幅高達驚人的98%。大公報整理

讀大公報PDF版面