【新聞鏈接】成立不到兩年 低成本訓練引關注
DeepSeek和幻方量化的共同創始人梁文鋒一直鮮少露面。1月20日他參加國務院總理李強主持召開專家、企業家和教科文衞體等領域代表座談會並發言,此後廣受關注。
座談會當天,DeepSeek正式發布DeepSeek-R1模型,並表示「在數學、代碼、自然語言推理等任務上,該模型性能比肩OpenAI o1正式版」。
2024年同期,獲邀參會的AI企業代表則是百度集團的李彥宏。總理李強去年12月在浙江調研時指出,要大力開展基礎研究和共性關鍵技術研究,加強算力等新型基礎設施布局建設,取得更多原創性引領性成果。
總部位於杭州的幻方量化2023年4月以一篇文章低調宣告DeepSeek的誕生。在成立之初,DeepSeek即標榜將專注於通用人工智能(AGI)的基礎研究,並將其成果盡數「開源」。DeepSeek鮮有公開的融資動作,且商業化腳步亦慢於其他公司。
DeepSeek在去年多次因大模型訓練成本低廉而獲得關注。公司上個月在一篇論文中披露,去年12月發布的DeepSeek-V3使用英偉達的H800芯片進行訓練,花費不到558萬美元。橫向對比,成本是美國AI巨頭的幾十分之一。 ●路透社、新華社