專家解讀/開源AI比閉源AI僅落後6個月

大公報 A3：內地 2025-01-31

圖：在去年「香港國際創科展」上，香港生成式人工智能研發中心展示的AI發明成果吸引參觀者駐足了解。

　　全球AI圈又領教了一回「神秘的東方力量」。1月20日，DeepSeek官宣其最新AI推理模型DeepSeek R1。多位業內人士指出，DeepSeek此次最大的貢獻，是向世界展示了快速、低成本實現o1同等模型能力的可能性。清華大學計算機科學與技術系副教授劉知遠表示，「東方力量」其實就是工程創新加持下的追趕能力。在算力吃緊的情況下，DeepSeek打了一場以少勝多的仗。

　　R1怎麼能如此便宜？新加坡南洋理工大學計算機學院助理教授劉子緯表示，算力達到一定量級的情況下，可以通過工程創新把性能差距抹平。在堆算力的路線進入瓶頸後，DeepSeek選擇了在底層算法、訓練模式和數據三個層面進行了工程迭代。基於混合專家模型、注意力機制等方面的創新，R1做到了「用50次運算達成別人做100次運算的效果」，效能提升明顯。而在拋棄監督學習後，計算資源的需求也大幅減少。

　　芯片禁運難遏中國AI發展

　　多位業內人士表示，DeepSeek真正的價值，在於展示了工程實踐和理論創新之間的平衡點，開創了一條符合現實算力約束的技術迭代道路。「R1說明開源AI僅落後於閉源AI不到6個月。」在劉知遠看來，GPT階段也就是2023年初的時候，OpenAI模型發布之後，國內團隊需要一年的時間才能趕上。但是到了文生視頻模型Sora，以及後來的GPT-4o和o1，國內的追趕時間縮短到半年以內。「DeepSeek的階段性成果釋放了一個信號，那就是通過芯片禁運等方式來遏制國內AI發展難以行通。這就是開源的力量。」劉知遠說。\中國新聞周刊

讀大公報PDF版面