專家解讀/開源AI比閉源AI僅落後6個月

全球AI圈又領教了一回「神秘的東方力量」。1月20日,DeepSeek官宣其最新AI推理模型DeepSeek R1。多位業內人士指出,DeepSeek此次最大的貢獻,是向世界展示了快速、低成本實現o1同等模型能力的可能性。清華大學計算機科學與技術系副教授劉知遠表示,「東方力量」其實就是工程創新加持下的追趕能力。在算力吃緊的情況下,DeepSeek打了一場以少勝多的仗。
R1怎麼能如此便宜?新加坡南洋理工大學計算機學院助理教授劉子緯表示,算力達到一定量級的情況下,可以通過工程創新把性能差距抹平。在堆算力的路線進入瓶頸後,DeepSeek選擇了在底層算法、訓練模式和數據三個層面進行了工程迭代。基於混合專家模型、注意力機制等方面的創新,R1做到了「用50次運算達成別人做100次運算的效果」,效能提升明顯。而在拋棄監督學習後,計算資源的需求也大幅減少。
芯片禁運難遏中國AI發展
多位業內人士表示,DeepSeek真正的價值,在於展示了工程實踐和理論創新之間的平衡點,開創了一條符合現實算力約束的技術迭代道路。「R1說明開源AI僅落後於閉源AI不到6個月。」在劉知遠看來,GPT階段也就是2023年初的時候,OpenAI模型發布之後,國內團隊需要一年的時間才能趕上。但是到了文生視頻模型Sora,以及後來的GPT-4o和o1,國內的追趕時間縮短到半年以內。「DeepSeek的階段性成果釋放了一個信號,那就是通過芯片禁運等方式來遏制國內AI發展難以行通。這就是開源的力量。」劉知遠說。\中國新聞周刊