中國小公司AI「火」到海外 性價比擊敗美國巨頭
【大公報訊】記者張寶峰北京報道:1月20日晚,中國DeepSeek(深度求索)公司發布推理模型DeepSeek-R1正式版,該模型在數學、代碼、自然語言推理等多個領域展現出與OpenAI o1正式版比肩的實力,但訓練成本更低。據介紹,DeepSeek僅用兩個月就完成了訓練,成本為550萬美元,僅為OpenAI等美國公司所花費金額的一小部分。此外,在2024年12月26日晚間,其開源模型DeepSeek-V3上線後更是在國內外AI圈刷了屏。
剛開始歐美還不相信,海外獨立評測網站Artificial Analysis就關鍵指標進行了反覆測試,最終得出的結論是各項指標的分數都為80以上。團隊只有139名研發人員,是OpenAI的十分之一。
據公開資料了解,DeepSeek創始人梁文峰出生於上世紀80年代廣東一個五線城市,本科、碩士就讀於浙江大學,攻讀人工智能專業。2008年,梁文峰開始致力於量化對沖領域的研究,2015年創立了幻方量化,之後規模擴張迅速,隨後2023年7月成立DeepSeek。該公司第一期研發投入就是幻方自主出資的,且旗下擁有「螢火超算」萬卡級別的算力加持。
美科技界高度評價:或改變一切
去年5月,深度求索發布DeepSeek-V2,以其創新的模型架構和史無前例的性價比爆火。模型推理成本被大幅降低,引發字節、阿里、百度等企業的模型降價潮,中國大模型價格戰由此一觸即發。
DeepSeek的崛起,不僅震動了國內科技界,更引起了美國科技界的廣泛關注。知名投資人馬克·安德森對DeepSeek-R1給予了高度評價,稱其為「我見過的最令人驚嘆和印象深刻的突破之一」。而AI科技初創公司Scale AI的創始人亞歷山大·王更是直言,DeepSeek的AI大模型發布可能會「改變一切」,讓美國在人工智能競賽中的領先地位受到挑戰。