競爭優勢/DeepSeek旗艦模型減價 爭企業級AI服務市場
這邊廂美國企業為着AI而花費巨資,但那邊廂中國的AI成本卻不升反跌。中國AI公司DeepSeek近日宣布,旗下旗艦模型V4Pro永久降價75%,大幅降低企業使用成本。此舉不僅對OpenAI和Anthropic等美國主要AI業者構成直接競爭,更預示着企業級AI服務市場將迎來結構性變革,促使全球企業加速評估更具成本效益的AI解決方案。
DeepSeek V4 Flash模型在輸入成本上,比Anthropic的Claude Sonnet或者OpenAI的GPT5.5-Med便宜7倍,輸出成本更便宜17倍。此外,輕量級的DeepSeek V4 Flash模型,相較於Claude Haiku等入門級替代方案,價格是原來的十分一甚至二十五分一。
DeepSeek能夠實現如此大幅度的降價,主要原因是其在軟硬體整合上的創新。早在2024年的V2架構中,DeepSeek就已透過序列維度壓縮、原生記憶體卸載等四項突破性技術,大幅降低模型運行所需的記憶體與運算資源。例如,DeepSeek V4 Flash僅需5.48GB的高頻寬記憶體(HBM)即可處理一百萬個Token的上下文,相較之下,其他西方小型模型可能需要高達89GB。這項技術不僅提升效率,也被視為規避美國對英偉達頂級GPU出口限制的地緣政治策略。
用家看重服務商收費
這次降價策略已開始影響市場動態。DeepSeek V4 Flash模型在OpenRouter排行榜上奪下首位,其Token使用量激增48%,而DeepSeek V4 Flash也名列第六。包括Uber、Airbnb和Pinterest在內的企業,都曾因高昂的Token使用成本而尋求替代方案。Uber一名主管表示,缺乏更好的產品展示,高昂的Token費用越來越難以證明其合理性;Airbnb行政總裁Brian Chesky則傾向使用阿里巴巴的Qwen等更快速、便宜的模型。Pinterest技術總監Matt Madrigal透露,該公司透過在專有資料上訓練Qwen模型,將成本降低了九成。