【新聞鏈接】成立不到兩年低成本訓練引關注

香港文匯報要聞 2025-01-28

　　DeepSeek和幻方量化的共同創始人梁文鋒一直鮮少露面。1月20日他參加國務院總理李強主持召開專家、企業家和教科文衞體等領域代表座談會並發言，此後廣受關注。

　　座談會當天，DeepSeek正式發布DeepSeek-R1模型，並表示「在數學、代碼、自然語言推理等任務上，該模型性能比肩OpenAI o1正式版」。

　　2024年同期，獲邀參會的AI企業代表則是百度集團的李彥宏。總理李強去年12月在浙江調研時指出，要大力開展基礎研究和共性關鍵技術研究，加強算力等新型基礎設施布局建設，取得更多原創性引領性成果。

　　總部位於杭州的幻方量化2023年4月以一篇文章低調宣告DeepSeek的誕生。在成立之初，DeepSeek即標榜將專注於通用人工智能（AGI）的基礎研究，並將其成果盡數「開源」。DeepSeek鮮有公開的融資動作，且商業化腳步亦慢於其他公司。

　　DeepSeek在去年多次因大模型訓練成本低廉而獲得關注。公司上個月在一篇論文中披露，去年12月發布的DeepSeek-V3使用英偉達的H800芯片進行訓練，花費不到558萬美元。橫向對比，成本是美國AI巨頭的幾十分之一。 ●路透社、新華社

讀香港文匯報PDF版面

【新聞鏈接】成立不到兩年 低成本訓練引關注