議事論事/從「算力競賽」到「效率創新」,核心是人才\冼漢廸
近期,DeepSeek在全世界引起了廣泛的關注。高效推理、訓練成本低、模型開源等特點使其脫穎而出。在遭受大規模惡意攻擊、美國國家安全調查等事件之後,英偉達、微軟、亞馬遜等美國巨頭又先後接入,證明了DeepSeek的實力和影響力。
以開放打破技術壁壘
推理能力強,訓練成本低。DeepSeek得益於先進的模型架構、首創的聯網推理能力以及數據與算法的雙重優化等,其推理能力在多個基準測試中表現出色,尤其針對中文推理能力的專項優化,使其在理解中文複雜語境等方面表現出色。在實際使用DeepSeek後,筆者亦對其在數學、代碼等問題上的推理能力由衷讚賞。此外,這些技術組合也使得DeepSeek的訓練成本遠低於其他競爭對手。
據悉,DeepSeek-V3與GPT-4o性能接近,但訓練成本僅為後者的十幾分之一。新發布的DeepSeek-R1性能對齊OpenAI-o1,但訓練成本亦遠低於後者。或受此影響,美國AI芯片巨頭英偉達總市值一周縮水5520億美元(約合4.3萬億港元),其他主要科技股亦出現不同程度下跌。
模型開源,提升AI普惠。除了在技術上的突破,DeepSeek的開源策略也獲得了廣泛的認可,為其發展帶來了諸多積極影響。這種開放性打破了技術壁壘,展示了中國在AI領域的技術實力和開放態度,讓不同地區、不同背景的技術人員都能站在巨人的肩膀上進行探索和創新。個人亦可在自己的電腦部署和應用DeepSeek模型。目前香港的多所大學都已經開始使用或計劃使用DeepSeek進行研究和教學,可見其開源策略的積極反響,未來有望惠及更多的科研和產業。
DeepSeek的出現讓AI領域的發展從「算力競賽」轉向了「效率創新」,不僅為國家AI領域的發展樹立了新的標杆,也為香港創新科技提供了新的思路和方向。香港應充分發揮自身的優勢,與內地協同合作,推動AI技術在金融、貿易等領域的深度融合,實現互利共贏。同時,還應進一步加強在AI領域的研發投入和人才培養,不斷提升自身的創新能力和競爭力。
2023年,DeepSeek創始人梁文鋒在接受媒體採訪時,探討了人才招聘的問題。他認為,「如果追求短期目標,找現成有經驗的人是對的。但如果看長遠,經驗就沒那麼重要,基礎能力、創造性、熱愛等更重要」。他表示,「我們的總結是,創新需要盡可能少的干預和管理,讓每個人有自由發揮的空間和試錯機會」。
進一步優化政策環境
在2024年的採訪中,他再次強調了選人標準一直都是熱愛和好奇心,並採用自下而上、自然分工的策略,讓每位自帶想法的人,自主探索和互相協同。他亦表示,創新的MLA架構即來自一位年輕研究員突發奇想設計的一個替代方案。
筆者認為,這種策略是DeepSeek能夠快速成長和持續創新的關鍵之一,體現了對員工創造力的尊重和信任,從而激發了團隊的創新活力,這為香港創新生態建設提供了有益的參考。香港若能在鼓勵探索、支持創新、尊重個人、寬容失敗等方面持續完善和改進,並進一步優化政策環境,為本地企業提供更多的支持和資源,將有助於吸引和培養更多像DeepSeek這樣的創新型企業和AI領域的傑出人才,進而推動整個行業的前進和發展。此外,香港若能在特區政府層面設立青年創科獎項、創科獎學金,鼓勵香港青年學習理科投身科技事業,將有助於激發青年一代的創新熱情和科技夢想,為香港創新科技事業的長遠發展注入源源不斷的新鮮血液。
港區全國人大代表、香港互聯網專業協會會長